情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
記事
知のコンピューティング:人間と機械の共創する社会を目指して
岩野 和生茂木 強
著者情報
ジャーナル フリー HTML

2015 年 58 巻 7 号 p. 515-524

詳細
著者抄録

現代社会は知識と情報にあふれており,われわれはこれを活用しきれていない。知のコンピューティングは,知の創造,蓄積と流通を促進し,人間の科学的発見を加速し,人々が賢く生きるための仕組みづくりを目指す活動である。本稿では,背景として情報科学技術の発展と課題を述べた後,知のコンピューティングの仕組みとしての社会実装イメージを提案する。さらに,人と機械の創造的協働を実現するための研究開発について考察し,最後に,広範な社会的インパクトをもつ科学技術の社会受容に関する取り組みについて紹介する。

1. はじめに

知のコンピューティングとは,情報科学技術を用いて,知の創造を促進し,科学的発見や社会への適用を加速することを目指した活動である。

現代社会は知識と情報であふれており,われわれはこれを活用しきれていない。学術論文や書籍・文献のデジタル化やWikipediaに代表されるインターネットを活用した新たな知識体系の整備,ブログやSNSなどの断片的だが大量の発信文書など,膨大な知識の体系や断片がインターネット上に無秩序に増殖している。しかし,活用に関しては,キーワード主体の検索エンジンを通した人手による探索が現状の主要な手段であり,それ以上の,知の創造や蓄積や伝播(でんぱ),活用に向けた新たな方法論は出現していない。

一方,情報科学技術の分野では,半導体やハードウェア技術の継続的な進歩により,計算機としての性能と記憶容量は加速度的に向上し,また,ソフトウェアの分野でも,人工知能技術の発展は一時期の幻滅期を越えた新たな領域に踏みだそうとしている。人工知能技術の成果は,たとえば将棋では一流の棋士に匹敵する力量をもち,また難問クイズ番組でも人間の歴代チャンピオンに勝つなど特定分野での成功が目立つ一方,音声認識や機械翻訳においても実用レベルの完成度をわれわれが享受できるようになってきた。

科学技術振興機構(JST)研究開発戦略センター(CRDS)では,研究開発の俯瞰(ふかん)報告書「電子情報通信分野(2013年)」注1)にて,今後わが国が戦略的に取り組むべき分野の一つとして「知のコンピューティング」を提唱した。世にあふれる情報・知識を有効に活用することで,人々が賢く生きる上での糧(知)とするための仕組み,および,その研究開発を模索してきた。具体的な活動として,2013年度には,学際的な有識者・研究者を招いたサミットや複数回のワークショップを通じて,新たな学問分野としての研究開発の方向性と具体的な研究開発テーマの深掘りなど検討を重ねたものを,戦略プロポーザル「知のコンピューティング~人と機械の創造的協働を実現するための研究開発~」(http://www.jst.go.jp/crds/pdf/2013/SP/CRDS-FY2013-SP-07.pdf注2)として発行した。

2. 人工知能技術の発展

1956年夏に米国ダートマス大学において,コンピューターサイエンスや人間の知能に関する通称「ダートマス会議」(The Dartmouth Summer Research Project on Artificial Intelligence)が開催された。会議の主宰者の1人であるジョン・マッカーシーが提案した人工知能(Artificial Intelligence)という言葉がこの新しい分野の名前として採用された。その後,チェスや定理証明などの問題に取り組んだが,常識的知識と推論に関する研究の未熟さと計算機能力の限界により,現実的な問題が解けず,産業への応用が進まないままブームは沈静化した。

1982年通商産業省が国家プロジェクト「第五世代コンピュータ」を始動した。世界最高速の推論マシンを開発したものの,限定的な知識を使った推論ではできることが限られていた。また,世界的にはエキスパートシステムの潮流があり専門家の経験知をルールとして記述することで専門家の代行ができることが期待された。しかし,専門家といえども専門知識だけではなく常識を使って今までに出会ったことのない問題を解決している。特定の問題向けに多くのエキスパートシステムが開発されたが,成功は限定的だった。

1995年頃からインターネットの時代になり,それまでとは桁違いに豊富なデータが得られるようになった。Web上のテキストや画像,SNSの文章,さらにはスマートフォンからのさまざまなデータも利用できるようになった。一方で,ITの進歩によりこれらの膨大なデータを処理する環境が整い,機械学習技術が進展した。これまで人間が書き下ろさなければならなかった知識をコンピューターが自動的に作り出すことができるようになってきた。畳み込みニューラルネットワークやサポート・ベクトル・マシン,さらに最近話題になっている多層型のニューラルネットワークであるディープ・ラーニングなどの機械学習技術を使って,これまで以上に高度な画像や音声認識,テキスト解析が可能になってきた。これらは,人間が行っている情報処理とは別のアプローチであり,膨大な量のデータを高速に処理するという人間とはまた違った特徴をもっている。

この結果,人工知能研究は21世紀に入ってさまざまな応用分野で成果をあげはじめた。大規模コーパスをベースにした統計的機械学習を活用した機械翻訳や音声認識は,すでに特定の分野では実用レベルに達している。20世紀のチェスに続いて,コンピューター将棋で「あから2010」が女流将棋王将に勝利したり,IBMの質問応答システムWatsonが超難問クイズ番組“Jeopardy!”において人間のチャンピオンを破るなど,特定分野においては,トップレベルの人間と伍(ご)するレベルに到達している。また,ディープ・ラーニングと呼ばれる最新の機械学習の手法は,Google X Labがいわゆる「教師なし学習」で猫の画像を認識する能力を示すなど,従来の機械学習の壁をブレークするものと期待されている。

今後は,大量のデータから得られる知識とともに,脳科学や認知科学など人間の知能や知識に関する基礎的な研究が進み,それらの成果が人工知能と融合することによって,これまでよりも複雑で高度な問題が解決されることが期待される。また,人工知能による機械の高度化だけではなく,高度化された機械をいかに使いこなすかという人間側に立った研究の進展も期待される。

3. ビッグデータの生産と活用の不均衡

ビッグデータの時代であると言われる現代社会は知識と情報にあふれている。たとえば,研究開発の主要な定量的指標である全世界の論文数は年々増加し2010年には30万件を超え,主要国の特許出願件数も同様に160万件に達する注3)。2001年に個人プロジェクトとして発足したWikipedia(英語版)の記事数は2015年8月時点で490万件を超えており,これはブリタニカ百科事典の記事数50万件を大きく上回る。医学分野で登録される記事や論文の総数は近年急成長しており,疫学の専門医が知識レベルを維持するのに1日当たり21時間の勉強が必要であるという見積もりもある注4)

2012年世界のデジタル情報の総量1.8ゼタ(1021)バイトのうち23%はビッグデータとして活用可能でありながら,分析が行われているデータは1%未満と言われる注5)。また,わが国の産業界で流通するデータ量の総数は2005年から7年間で5.2倍の2.2エクサ(1018)バイトに拡大している注6)。これに対して,米国ではBIG DATA Initiative(2012年),わが国でも,膨大化するデジタルデータに対して比較的早い段階で,文部科学省「情報爆発時代に向けた新しいIT基盤技術の研究」(2005年)や経済産業省「情報大航海プロジェクト」(2007年),文部科学省のビッグデータの応用と基盤(2013年)のプロジェクトを推進している。しかし,技術開発への投資の一方で,データサイエンティストと呼ばれるデータ分析の専門家が需要に間に合わないという指摘もある。

しかし,活用に関しては,たとえばインターネットから有用な情報を求める際には,キーワードを主体とした検索エンジンを通した人手による探索が現状の主要な手段であり,それ以上の,知の蓄積や伝播,活用に向けた新たな方法論は出現していない。

4. 集合知のパワー

2007年に英国オックスフォード大学でスタートしたオンラインプロジェクトGalaxy Zooは,インターネット上で銀河の画像を分類するボランティア参加型プロジェクトである注7)。20万人以上のボランティアが参加して,天文学者がハッブル望遠鏡で撮影した銀河の画像を鑑賞しつつ分類することで銀河研究を支援している。すでに100万枚の画像を分類し,天文学者による銀河形成に関する探査的研究を助けているのである。これらの成果は,渦状のアームや銀河中心のふくらみなど画像中の形の特徴を読み取り分類する能力に関して,人間はコンピューターよりもはるかに優れていることを示している。

2008年,米国ワシントン大学のDavid Baker教授らは,「タンパク質折り畳み」問題(化学的に安定した最低エネルギー構造の特定)にパズルゲーム感覚でチャレンジし,折り畳みの優劣を競い合う無料プログラムFolditを発表した注8)。タンパク質が取り得る形状は無数にあり,コンピューターによるシミュレーションでは膨大な時間がかかることから,「タンパク質折り畳み」問題は,科学における最も重要な未解決問題のうちの1つであると言われてきた。しかしながら,Foldit参加者は,人間の直感力(パターン認識能力)を生かしながら,マウスを使って得点が高い(エネルギー的により安定な)タンパク質構造を競い合って作ってゆくことでタンパク質構造予測に携わり,科学者が10年かかっても解けなかった難問題(HIV / AIDS治療薬を開発するために必要な酵素の構造解析)を3週間で解くことに成功したのである。

2010年Kaggle社は,複雑なビッグデータ問題に取り組めるデータサイエンティストをソーシャルネットワーク的手法で世界中から集めて競争させるアウトソースサービスを開始した。代表的事例である入院患者の予測コンペでは,過去の患者のデータを分析し,近々入院が予測される患者を早めにケアすることで,緊急入院数を減少させ医療コストを削減させた。日本国内でも,2013年にインフォコム社が主催する,日本初の懸賞金モデルによるデータ解析クラウドソーシングサイトCrowdSolving注9)がサービスを開始し,数論的ロジックから導かれる数値予測,ヒトインフルエンザウイルスの株予測など多くの実績を重ねている。

5. 人と機械の創造的協働を実現する知のコンピューティング

これまで見てきたように,今日のわれわれを取り巻く環境はデータや情報,知識であふれており,将棋やクイズをはじめ特定の領域で人間を凌駕(りょうが)せんとする人工知能のニュースは枚挙にいとまがない。しかし,これら,あふれる情報,あふれるパワーは十分に活用されていると言えるであろうか。知の創造,蓄積と流通を促進し,人間の科学的発見を加速し,人々が賢く生きるための仕組みが必要ではないだろうか。

われわれは,情報科学技術を用いて,知の創造を促進し,科学的発見や社会への適用を加速することを目指した活動として,知のコンピューティングを提言する(1)。

知のコンピューティングは,豊富なデータ,事例に基づいて,漠然とした課題から具体的な問題への明確化を支援する。また,個別の問題解決に対して,複数の解決策を提示するとともに,シミュレーションや過去の事例に基づき利害得失も示すことができる。さらに,これらの過程を集積し,再利用できる。この結果,社会・経済に対して,複数のシステムからエビデンスを統合的に解析したり,さまざまな視点からの知を集めることにより,人類の意思決定の質が向上し,従来では解けないような課題に対する納得性の高い解決策が導けるなどの効果をもたらし,より高度な知的社会の実現に一歩近づける。

2は,知のコンピューティングの成果を社会に実装した際のイメージである。

知のコンピューティングの成果はたとえば3階層で実装することができる。ここで,第3階層(社会へ影響を与えるレイヤー)に現れる人やシステムが知のコンピューティングの成果の受益者である。知のコンピューティングはこれら受益者に対してさまざまな機能をサービスという形で提供する。

図1 知のコンピューティング俯瞰図
図2 知のコンピューティングの成果実装イメージ

(1) 第1階層

情報・状況を把握するレイヤーでは,エージェントと呼ばれるソフトウェアが実世界やサイバー空間に存在するさまざまな情報から知識を抽出して構造化する。多くの情報源に対しては情報の流れが一方向であるが,集合知エージェントは,上位のレイヤーからの要求に応じて人々にダイナミックに問いかけて衆知を集めるインタラクティブな機能が必要となる。

(2) 第2階層

知の集積・伝播のレイヤーでは,オーケストレーターと呼ばれる自律分散知的情報処理システムが,上位のサービスレイヤーからの,知の蓄積・伝播・探索・予測・発見の要求を構造化された知を活用して処理する。

(3) 第3階層

社会に影響を与えるレイヤーでは,サービスと呼ばれるアプリケーションプログラムが,人間や社会システムとインタラクションをもちながら人間や社会の問題解決を支援する。人間に働きかけるサービスと機械や社会システムに働きかけるサービスに大別できる。

6. 人間と機械の新たな関係

知のコンピューティングの根底には,人と機械の共創する社会を目指すという思想がある。ここで述べる「共創」の意味は,これまで人間だけ,あるいは,機械だけではなしえなかったことを,人間と機械の相互作用を通して実現するということである。言うまでもなく科学的発見や最終的な意思決定の主体は人間にある。一方で,機械が,人間と創造的協働を行う能力を内蔵することで,人間との相互作用を通して学習し,相対する人間に適応できるようになる。逆に,人間も機械との相互作用を通して自分だけでは知りえない,実現しえないことを学び実現することができる。これにより,従来なしえなかった新たな発見への道が開けることを期待する。

知識の共有・活用に関する研究はSECIモデル注10)が有名だが,知のコンピューティングでは形式知の段階に機械を導入し,より高度な知識や賢い判断を生み出すKnowingのプロセスとして,人間と機械の創造的協働を指向する(3)。この考え方は2013年に実施した「知のメディア」ワークショップにて示された注11)。Knowingのプロセスにおいて,人間と機械は独立ではなく,相互に対話と協働を進めながら,既知の知識(K1 : Knowledge 1)の深い意味を知ることにより新たな知識(K2 : Knowledge 2)を獲得する。

知のコンピューティングの実現に向けては以下のような研究開発が必要であると考えている。

図3 知の蓄積・伝播・探索に向けた,人と機械の創造的協働のアプローチ。Knowingのダイナミックなプロセスを実現

(1) 加速する知の集積・伝播・探索

世界中のネットワークにつながった多様な知能や知識を活用し,ごく簡単なやり取りで,最適な提案を行うことは,人間のキャパシティーを大幅に超えている。ここでは,特に人間と機械のインタラクションを通して知の集積・伝播・探索のための研究開発を推進する。

(2) 予測・発見の促進

科学は,物事を理解することで科学法則を見いだし,それを現実の問題に当てはめて解く。しかし,既知の科学法則だけでは解けない,あまりに複雑な問題や法則自体が複雑になってしまった問題もある。ここでは,科学技術を顕微鏡や望遠鏡のように使って,これまでは見えなかった領域を拡大したり,これまで捉えきれなかった全体像を多面的に俯瞰(ふかん)したりして,人間の科学的発見や知の創造を加速するための研究開発を追求する。

(3) 知のアクチュエーション

上記の開発成果は,直接的に,または機械や社会システムを通じて間接的に,人間や社会に還元すること(アクチュエーション)で,より納得性のある意思決定やより優れたシステム制御など,人々の賢い暮らしに貢献することができる。さらに,関係するすべての科学者と行動者に還元した結果をフィードバックすることで,知の創造と還元の循環を効果的に進める方策の検討を行う。

7. 成熟度モデル

知のコンピューティングの達成目標として段階的な進化が可能な成熟度モデルを考察した。IBMのオートノミックコンピューティングで提唱された成熟度のレベル注12)を参照し,レベル0からレベル4までの5段階を設けた(1)。段階が上がるにつれて,機械側の対応能力と自律性が向上する。同時に,人間側の対応は具体的・現場的なものから抽象的・規律的なものに変化する。1では,各レベルにおいて,人間の役割と機械の役割を例示したが,具体的なイメージをもってもらうために,2に挙げた成果イメージの具体例と,参考事例としてクルマの自動化を付記した。

成熟度モデルは,本プロポーザルの達成目標をはるかに超えているものを含む。それをここに示すのは,知のコンピューティングに関わる研究者にとって,実装イメージを段階的に把握することが有用であると考えるからである。

表1 知のコンピューティングの成熟度モデル。成熟度レベルとサービスの具体例

8. 反復型開発による社会適用の進化

知のコンピューティングの扱う問題領域は,個人向けの比較的プリミティブなものから,集団や社会システムを対象とする複雑かつ高度なものまで広範にわたる。よって,4のような反復型開発アプローチによる研究開発を提言する。

第1段階として,主に個人や小集団を対象としたプリミティブな問題領域における質問応答や提案・助言サービスを実現する。第2段階では,発見支援や予測・発見サービスなど研究者や専門職などへより専門性の高い機能を提供する。第3段階では,合意形成や教育・訓練サービスなど社会的影響の高い機能が実現できることを目指す。

なお,研究開発成果はプラットフォーム化し,プロジェクト内,プロジェクト間,将来の関連プロジェクトにわたって共有する。それをプロジェクト完了後も市民が利用できるプラットフォームとすることで,研究開発の成果が活用されつつ改良され進化することが可能になる。

JSTにおいて2014年度から始まった戦略的創造研究推進事業CREST「人間と調和した創造的協働を実現する知的情報処理システムの構築」注13)は,この第1段階開発に当たるものである。

図4 反復型開発アプローチ

9. 社会に受け入れられるために

本稿の研究開発もその一端であるが,近年,人工知能の急速な発達を危惧する言論がマスコミで取り上げられる機会が増えた。影響力の高い著名な科学者や実業家による発言ということもあるが多くは人工知能の専門家ではないため必ずしも科学的な根拠が十分でないように見える。一方で人工知能学会の倫理委員会のように専門の研究者による取り組みも始まっている。

知のコンピューティングの社会的なインパクトを考えれば,1990年に米国がヒトゲノム計画を立ち上げた際に,研究に潜む倫理的・法的・社会的問題(ELSI: Ethical, Legal, and Social Issues)に予算を振り分け,研究を促進したのと同様な施策を実施する必要がある。

しかし,このような広範な影響を与えうる科学技術に対しては単独の研究コミュニティーを超えた対応が必要である。そのような試みの端緒として2014年9月に科学技術未来戦略ワークショップ「知のコンピューティングとELSI/SSH」注14)注15)を開催した。人文社会学(SSH: Social Science and Humanities)と情報科学技術(IST: Information Science and Technology)の双方の有識者が集い,知のコンピューティングの描き出す未来像に対して想定すべきイシューを探索した。5は抽出された論点や概念を,倫理・法・社会の枠組みで分類することを試みたマップである。簡単に解決できる課題はなく,単独でも複数の科学技術でも答えることのできない種類の問題も含まれている。複数の学問分野の科学者のみならず政策決定者,産業界から一般市民までも含めた,継続的な議論の場が必要である。

図5 知のコンピューティングとELSI/SSH論点マップ

10. おわりに

2013年7月に「知のコンピューティング」というコンセプトを提唱してから2年が経過した。その間に,「知のメディア」などのワークショップで取り組むべき研究開発課題の深掘りを進めるとともに,技術開発の副作用として発生する正負のインパクトに関する検討も進めてきた。今後は,見えてきた全体像を知のコンピューティングのグランドデザインとして中長期的な研究開発戦略提言にまとめる。同時に,「予測・発見と知のアクチュエーション」ワークショップや,ELSI/SSHに関する検討会を継続的に実施することで,研究開発課題のさらなる深掘りと開発成果の社会受容に向けた方策の具体化を推進する所存である。

執筆者略歴

  • 岩野 和生(いわの かずお)

科学技術振興機構 研究開発戦略センター上席フェロー。1975年東京大学理学部卒業後,日本アイ・ビー・エム(株)入社。東京基礎研究所所長,米国ワトソン研究所,大和SW開発研究所所長,先進事業担当,未来価値創造事業担当を経て,2012年より三菱商事(株)ビジネスサービス部門顧問。東京工業大学客員教授。情報処理学会フェロー,日本学術会議連携会員。Ph.D.(米国プリンストン大学)。

  • 茂木 強(もてぎ つよし)

科学技術振興機構 研究開発戦略センターフェロー。1980年京都大学理学部卒業後,三菱電機(株)入社。コンパイラの研究開発に従事。米国スタンフォード大学留学。情報技術総合研究所 情報システム技術部門統括を経て,2012年より現職。戦略プロポーザル『知のコンピューティング』作成リーダー。

本文の注
注1)  JST-CRDS. 研究開発の俯瞰報告書「電子情報通信分野(2013年)」. 2013. http://www.jst.go.jp/pdf/pc201306_iwano.pdf, (accessed 2015-08-20).

注2)  JST-CRDS. 戦略プロポーザル「知のコンピューティング~人と機械の創造的協働を実現するための研究開発~」. 2014. http://www.jst.go.jp/crds/pdf/2013/SP/CRDS-FY2013-SP-07.pdf, (accessed 2015-08-20).

注3)  文部科学省. "平成25年版科学技術白書". http://www.mext.go.jp/b_menu/hakusho/html/hpaa201301/1326593.htm, (accessed 2015-08-20).

注4)  Microsoft Research. "The Fourth Paradigm", 2009. http://research.microsoft.com/en-us/collaboration/fourthparadigm/4th_paradigm_book_complete_lr.pdf, (accessed 2015-08-20).

注5)  International Data Corporation (IDC). "The Digital Universe in 2020", 2012. http://www.emc.com/collateral/analyst-reports/idc-the-digital-universe-in-2020.pdf, (accessed 2015-08-20).

注6)  総務省. 平成25年版情報通信白書. http://www.soumu.go.jp/johotsusintokei/whitepaper/h25.html, (accessed 2015-08-20).

注7)  M. Nielsen. Reinventing Discovery: The New Era of Networked Science. Princeton Univ Pr., 2011.

注8)  F. Khatib, F. DiMaio, Foldit Contenders Group, Foldit Void Crushers Group, S. Cooper, et al. "Crystal structure of a monomeric retroviral protease solved by protein folding game players". Nature Structural & Molecular Biology 18, 1175 (2011).

注9)  CrowdSolving. https://crowdsolving.jp/, (accessed 2015-09-11).

注10)  野中郁次郎,竹内弘高が提唱。2つの知識「暗黙知」と「形式知」が相互作業によりスパイラルを描きながら新たな知識を創造する。野中郁次郎, 竹内弘高. "The Knowledge Creating Company", Oxford University Press. 1996.(日本語版「知識創造企業」東洋経済新報社 1996).

注11)  JST-CRDS. 科学技術未来戦略ワークショップ「知のコンピューティング:知のメディア」. 2013. http://www.jst.go.jp/crds/pdf/2013/WR/CRDS-FY2013-WR-07.pdf, (accessed 2015-08-20).

注12)  A Practical Guide to the IBM Autonomic Computing Toolkit. 2004. http://www.redbooks.ibm.com/redbooks/pdfs/sg246635.pdf, (accessed 2015-08-20).

注13)  JST, CREST. 「人間と調和した創造的協働を実現する知的情報処理システムの構築」, 2014.

注14)  JST-CRDS. 科学技術未来戦略ワークショップ「知のコンピューティングとELSI/SSH」, 2014. http://www.jst.go.jp/crds/pdf/2014/WR/CRDS-FY2014-WR-09.pdf, (accessed 2015-08-20).

注15)  「知のコンピューティングとELSI/SSH」の背景(岩野和生:CRDS). https://www.youtube.com/watch?v=V8pSO_5bBRg, (accessed 2015-09-11).

 
© 2015 Japan Science and Technology Agency
feedback
Top