J-STAGE トップ  >  資料トップ  > 全文HTML

情報管理
Vol. 60 (2017) No. 5 p. 339-344

記事言語:

http://doi.org/10.1241/johokanri.60.339

視点

視点 スキーマ・マシンとしての人工知能のインパクト

前回の記事では,スキーマという概念を用いて,私たちが人工知能をどのように理解しているかを論じた1)。今回は,人工知能のもたらす社会的影響を理解するための手段としてスキーマ概念を採用し,現在および近未来の人工知能を,人間と同様にスキーマを使いこなすばかりか,スキーマを獲得し,改良までしていくスキーマ・マシンとしての能力をもつ人工物として特徴づけることによって,人工知能のもたらしうるインパクトについて論考する足掛かりをつくる。

スキーマを用いた行動主体の内面の理解

前回の記事1)では,人々がさまざまな経験を通して,所与の対象について作り上げている概念をスキーマと呼び,人々が人工知能をどう思うか,分析するための手段として用いた。より一般的には,人々は,成長の過程で学習や行動によって獲得したスキーマに基づいて行動し,実体験やメディア体験から新しいスキーマの生成や,従来のスキーマの更新・消去を積み重ねることで,自分が保有するスキーマの生態系を発展させていると考えることができる。このアプローチでは,分析者は1(下)のような状況で,子どもたちはきっと1(上)のようなスキーマを思い浮かべているのだろう,と仮定して,スキーマの内容やその利用法についての分析を行う。

厄介なことに,1のような状況で子どもたちが本当は何を思い浮かべているかを知ることはできない。たとえそれが自分自身のことであっても,どんなに自省し,自問自答したとしても,解像度を多少上げることはできても,自分はさまざまな状況で何を考えているのか,なぜそうしているのかを決定する礎となる確固たる自己を見つけることは容易ではない。解像度を上げようとすればするほどスキーマはぼんやりして揺れ動いていることがますます確実になるだけだ。脳科学が発達した今日であっても,他者のスキーマを詳細に知ることはまだまだ発展途上にある。

このような困難さにもかかわらず,さまざまな手法で得られる知見を統合して,人々がどのようなスキーマをもち,それがどのように変化しているかを解明することは,人間や社会を理解するための基本であり大変重要なことであると考えられる。そのような考えに従って,前回の記事では,人々が人工知能(特にそのアーキテクチャー)についてどのようなスキーマをもっていそうかという観点から論考を行った。

今回は,人間だけでなく,人工物,特に,人工知能も何らかのスキーマに従って,2のように外界を認識し,行動しているもの――スキーマ・マシン――と見なして,そのスキーマの内容と利用法の観点から分析を進める。2のロボットがそれほど高度なものでない場合でも,ロボットを人のようなものに見立てて,「ロボットは外界をこのように認識し,このように状況判断をして行動しているのだ」と,分析する。こうした擬人化の手法はしばしば,誤った帰結をもたらしかねないので,十分な注意が必要であるが,人工知能技術の発展で,ヒューマノイドロボットに象徴されるように,抽象度の高い認知社会的なスキーマを有し,それに従って社会的文脈を知覚し,人のように社会的な行動をしていると見なすことのできる人工物を分析したり設計したりするためには便利である。たとえば,レジロボットや接客ロボットは単に仕事をするだけでなく,Jibo注1)に象徴されるように,種々の社会的状況を察知して,社会的に適切な振る舞いをすることで,おもてなしをしているように見える振る舞いを生成し,ユーザーもそう感じているとわれわれは分析する。そして,このような人工知能搭載型ロボットの設計に携わる人も,同様のイメージを思い浮かべながら,テクノロジーを駆使してその実現を行っていると考えることができる。


View Details
図1 子どもたちの遊び


View Details
図2 スキーマに従って行動するスキーマ・マシンとしての人工知能の位置づけ

志向姿勢で交流できる人工物としての人工知能

デネットは外界の対象を人々がどのようにとらえるかという心的態度に着目して,物理姿勢,設計姿勢,志向姿勢に分類している2)。物理姿勢は,対象を道端の石ころのようにただただ物理法則に従うものとしてとらえる態度を指す。設計姿勢は,対象を製作者の設計に従って機能するものとしてとらえる態度を指す。志向姿勢は,対象がちょうど人のようにさまざまな手段で相手の意図を読み,それに基づいて自分の意図を変化させて,行動するものとしてとらえる。

われわれの身近なところによくある自販機は,カスタマーがある手続きに従って商品を選択し,代金を投入すれば,商品が出てくるという機能が実現された人工物として,設計姿勢でとらえられることが多いだろう。

人工知能技術が進んできて自販機にもたくさん使われるようになったらどうなるだろうか?Amazon Alexa注2)やGoogle Home注3)など,広がり始めている会話型インターフェースに自販機の未来の姿をうかがうことができる。こうした会話型インターフェースでは,人と端末とがいろいろな会話を交わしながら,その中で注文を受け付ける。世間話をしながら物を買う相手はこれまでは人であったので,ユーザーは,表向きはこうした会話端末は人間ではないといいながらも,ユーザーの社会脳といわれる脳部位が活性化して,会話型インターフェースとのやりとりをまるで人を相手にした会話のように感じるだろう3)

会話型インターフェースが優れているところは,われわれが対人コミュニケーションで長年培ってきた志向姿勢の経験に少し修正をかけるだけでそのまま使えることだ。そのおかげで,人間と人工物のコミュニケーションは非常に緊密なものとなり,利用者の過去の経験を利用して,詳細な説明がなくても,人工物が提供できる多種多様なサービスが小さなコストで提供可能になる。

他方,設計姿勢をいだく必要のある人工物の場合は,ユーザーは,設計の前提となる,利用のために必要な知識と取り決めを学び,頭に入れてからでないと使えない。よいデザイン4)で解決すべきだというのが正論であっても,これから爆発的に増えてくるであろう複雑で多様な人工物に対してうまく当てはまるデザインを見つけるためには,膨大な試行錯誤が必要である。そのような地道な努力自体は大変貴重であるが,たとえ実現できたとしても長い時間がかかり,たいていのユーザーには我慢できないだろう。また,設計者が商品に込めた思いや,ユーザーへの気持ちをインタラクティブに伝えようとしても,ユーザーが設計姿勢をいだいてしまうと伝えることはとても困難になる。

サービス提供者とカスタマーの取り決めに基づくカスタマーの設計姿勢を前提とした自販機も残るであろうが,多くのものは志向姿勢をベースにするものに変わるのではないか。

人工知能の実現法の革新

工学者にとっては,志向姿勢を実現する自販機を人工システムとしてどのように実現するかという問題を解かねばならない。従来のプログラム開発手法でこの問題を解こうとすると,志向姿勢を実現する自販機が提供する豊富なサービスがどのような状況で起動されるべきか,可能な状況とその判定法を網羅的に見いだして,その時々にどのサービスを提供するかを設計する必要がある。

既存の計算機科学手法は,優れたプログラミング環境やプログラムによる物理世界制御法を提供するものであったが,多様な状況を認識し,状況に応じてちょうどよい加減のサービスを提供するロジックを手作業で作り上げる手間はまだまだ大きく手に負えるものではない。従来の人工知能研究では,知的探索によって解を求める手続きを明示的に示すことを回避する「弱い方法」や,言語的な知識の表現による高水準記述により,この問題を解決しようとしてきたが,われわれが普通に接する複雑な日常世界では歯が立たなかった。最近の人工知能のインパクトのもう一つの側面はこの点に関するものである。すなわち,人工知能の一環として発展してきた機械学習の技術の発展により,プログラミングによってではなく,データからスキーマを作り出せるようになったことが変革をもたらした。

人間がどのような状況でどのようなサービスをした結果どのような顛末(てんまつ)になったかというデータが大量にあれば,機械学習手法でそこから一定以上の頻度で繰り返し出現するパターンを自動検出し,うまくいったときとそうでないときを対照し,データが与えられていない場合についても他のデータの統計的性質から推定して,それらしいサービスを提供できるようになることが機械学習の手法のエッセンスである。理屈の上からはこうした方式を実現しても,いつも適切な行動を生成できるという論理的な保証はないが,アルゴリズムを工夫し,ある程度のデータの質と量が得られると,機械学習アルゴリズムは人間を凌駕(りょうが)しうる高品質の推定ができることが経験的にわかってきた。

近似という観点からみると,機械学習の方が,人々の望む志向姿勢をよりよく近似できる。定性的にいうと,従来のプログラミングだとなんだかぎくしゃくして,すぐに機械だと見破られて,「これは人じゃない,機械だ」と思われて,志向姿勢は破綻し,設計姿勢に後退してしまう。機械学習だと,間違いはあっても全体として人間らしく振る舞う。AlphaGo注4)や現在の自動運転車注5)は,その近似度が高いばかりか,限定されているとはいえ,それ自体十分広い領域でその道の専門家を上回るという点で素晴らしい。 GoogleのNeural Machine Translation注6)のタスクは,まだまだ内容を深く理解することなく言語表現を置き換えているだけのレベルではあるが,広域にわたり高品質の翻訳を遂行できる点がすごい。

人工知能の技術が革新的であるのは,人工知能がスキーマを自ら作り出し,経験を通して改良できる能力をもっていることである。たとえば,AlphaGoは「自分自身との対戦」を通して能力を高めていく5)。そのように作り出され改良されるスキーマは自分自身の行動を生成するためにも,複製して自分自身と異なる行動主体の行動を生成するためにも使うことができる。このような能力をもつ人工物は周りを見渡しても人工物だけであり,人工知能技術のインパクトの大きさを示唆している。

いま実現できる人工知能の限界

現在の機械学習技術にはまだいろいろな限界がある。第一に,狭い範囲でしか性能を発揮できない。現在の機械学習技術に駆動された人工知能は狭い人工知能と呼ばれ,広い範囲で行動できる広い人工知能(または,人工汎用(はんよう)知能)と対照されている。ごく少数の例外を除けば,広い範囲にわたる人間の知識の重要な側面をうまく近似できず,広い問題領域で無数に存在する想定外の局面で行き詰まったり,とんでもない行動をする可能性を払拭(ふっしょく)できないので,失敗すると重大なダメージの生じる問題にはまだ使えない。狭い人工知能の知能が人間の域を超えたとしても,広い範囲で人間のレベルはそう簡単に超えられそうはない。

第二は,人工知能は認識したものに関する知識を状況に応じて使いこなせるレベルには達していない。言語処理においては,一見話せるようにみえても,言語表現を実体と結び付けて理解していない。言葉の上でだけわかったふりをしているにすぎない。「熱があります」と,人が言ったとき,「しんどいでしょう。養生してください」と返事はできても,「熱がある」,「しんどい」,「養生する」ことがどういうことか経験として知っているわけではない。パターン認識においても,見えているもののカテゴリーを判定できても,関連する知識を総合して,空間的な状況を推定したり,状況に即して次にどのようなことが起きそうか予測する能力はまだまだ低い。

第三は,人工知能自体の限界ではないが,人工知能が利用できる人工身体の能力が低いことである。人間のような強力な身体をもてない。人間のような器用さ,柔軟さ,持久力のある身体をもった知能が実現されるまでは長い道のりがある。

第四は,上記の理由により,人を含んだ物理環境で活動させようとすると,安全問題が発生するため,人を傷つけないやわらかな材料や制御方式などのイノベーションがなければならない。自動運転車の開発がなかなか進まないのはこのせいである。逆に人のいないところは縦横に発展できる可能性がある。したがって,現状では,倉庫,物流,船,農業など,トレーニングを受けた人しか入れないところでは,人工知能技術の進展が進んでいる。

一般論としては,この限界を乗り越えるためには,人工知能が自発的に学習して,人間と価値観を共有できるようになる必要がある。

とはいうものの,最近の人工知能研究の進展は著しい。技術が進歩し,大勢の研究者を取り込んでいる。狭い人工知能でも急速に成果が得られ始め,適用範囲が広がりつつあるので,狭い人工知能だからこれはできないと決めつけてしまうのは乱暴であろう。

言語能力については,人工知能が言語表現の内容はわかっていなくても,その脈絡がどのようなものか推定することができるレベルまできている。実際,長年の懸案であった,写真への自然言語記述の生成の研究はいま急速に進みつつある(たとえば参考文献6)。これができると,先に人工知能の限界として挙げた対象のカテゴリーがわかってもそれに関わる知識を状況に応じて使えないという限界は急速に緩和されていく。このような技術により,「本物の意識」の実現は難しくても,意識があるようにロボットを振る舞わせることは,いまの技術の射程に入っている。

知識メディアとしての人工知能

前回の議論1)と今回のこれまでの議論をまとめると,3のような構図が浮かび上がる。人工知能を搭載したシステムは,人間が普通にもつ外界を理解し,行動するためのスキーマと同様のスキーマを豊富に有し,自分の置かれた状況に一番近そうなスキーマを取り出して,それを下敷きにして推論などで足りないところを適宜補いながら行動し,行動の経験からスキーマを自力で改良していくものであるという見方でとらえることができる。現在のところ,まだ人工知能が感知し活用できるスキーマは限られているが,インターネット上の膨大な情報資源を活用し,機械学習技術によって知識として利用可能なものに変えていくので,領域を限ればその道の専門家をしのぐレベルに達し始めている。

人工知能が登場する前は,スキーマを自覚的に生み出し,語り,利用し,改良し,共有できるのは人だけであった。われわれが有するスキーマの大半は,人類の歴史の中で人間同士,あるいは,人間と環境とのインタラクションの中から生み出され,結合や分解を繰り返し広がり,共有されてきたものが伝承されたものであろう。

人間は子どものうちは人として生きていくための素朴なスキーマを親や友達など限られた人とのインタラクションを通して獲得していくが,一定の年齢以上になると,学校に入り,より組織的なトレーニングを受けることで成人としての社会でサービスを提供し,そこから得られる収入を糧に生活していくためのスキーマを獲得していく。

ある種の専門的な問題を責任をもって確実に解決できる専門家は,常人にはなかなか理解して使いこなせない一連の専門知識に相当するスキーマを有し,それを常時更新しながら,使いこなしている人たちとしてとらえることができる。

われわれ自らが体験や思考の中から獲得するスキーマも少なからずある。そうしたスキーマは,さまざまなコミュニケーション手段で拡散され,他の人が有用であると認めれば,広がり,共有されていく。

このようなスキーマのフローを取りもったり,スキーマをもたない人を助けるために,人間社会では,先生,アドバイザー,アシスタント,トレーナー,代理人,モデレーターなどの職業やロールが生み出されてきた。また,自らが,見習い,弟子,生徒となって,スキーマの獲得を目指すことがあれば,パートナーとして対等の立場で助け合ったり,上司-部下,あるいは,経営者-従業員という役割分担の契約をして,より大きなスキーマの実行に参画することもある。

われわれの社会がこのようにスキーマを用いて特徴づけられるとすれば,いまや,人間と同様にスキーマを獲得し,適用し,共有し,改良できる人工知能が社会に広く浸透し,先生,アドバイザー,パートナーなどこれまで人間しかできなかった役割を担い始めたといえる。

こうした人工知能は,人と人の間に存在し,知識の流通を促進する役割を果たすという意味で,従来のメディアが一段進んだ知識メディア7)であるととらえることができる。

次回は知識メディアとしての人工知能の登場で社会がどのように変わっていくか,論考したい。

※西田氏の「視点」は,12月号に続きます。


View Details
図3 スキーマの獲得,利用能力をもつマシンとしての人工知能

執筆者略歴

  • 西田 豊明(にしだ とよあき) nishida@i.kyoto-u.ac.jp

1993年奈良先端科学技術大学院大学教授,1999年東京大学大学院工学系研究科教授,2001年東京大学大学院 情報理工学系研究科教授を経て,2004年4月から京都大学大学院 情報学研究科教授。人工知能とインタラクションの研究に従事。会話情報学を提唱。理化学研究所・革新知能統合研究センター(AIP)・「人とAIのコミュニケーション」チームリーダー,総務省「AIネットワーク社会推進会議」構成員,日本学術会議連携会員(2006年~)。情報処理学会フェロー。電子情報通信学会フェロー。

本文の注

注1)  Jibo:https://www.jibo.com/

注2)  Amazon Developer:https://developer.amazon.com/ja/alexa

注3)  Google Homeのご紹介:https://madeby.google.com/home/

注5)  たとえば,Waymo:https://waymo.com/

参考文献

1)  西田豊明. 視点 人工知能スキーマ:人々は人工知能をどうとらえているか. 情報管理. 2017, vol. 60, no. 1, p. 50-55. http://doi.org/10.1241/johokanri.60.50, (accessed 2017-05-31).
2)  デネット, ダニエル C.著; 若島正, 河田学訳. 「志向姿勢」の哲学:人は人の行動を読めるのか?. 白揚社, 1996, 453p.
3)  Reeves, Byron; Nass, Clifford. The media equation: How people treat computers, television, and new media like real people and places. CSLI Publications, 1996, 317p.
4)  ノーマン, ドナルド A.著; 野島久雄訳. 誰のためのデザイン?:認知科学者のデザイン原論. 新曜社, 1990, 427p.
6)  Vinyals, Oriol; Toshev, Alexander; Bengio, Samy; Erhan, Dumitru. "Show and tell: A neural image caption generator". In IEEE Conference on Computer Vision and Pattern Recognition (CVPR15), Boston, 2015-06-07/12, IEEE, 2015, p. 3156-3164.
7)  Stefik, M. The next knowledge medium. AI Magazine. 1986, vol. 7, no. 1, p. 34-46.
Copyright © 2017 Japan Science and Technology Agency

記事ツール

この記事を共有