Serviceology
Online ISSN : 2423-916X
Print ISSN : 2188-5362
Special Issue: "Service × Technology Innovation and Social Impact"
Potentials of Deep Learning for Services
Yutaka Matsuo
Author information
JOURNAL OPEN ACCESS FULL-TEXT HTML

2017 Volume 4 Issue 1 Pages 10-15

Details

1. はじめに

近年,人工知能がブームを迎えている.歴史的に見れば3度目のブームであり,過去の2回と同じく,「猫も杓子も」人工知能といった様相を呈している.筆者は,1997年,人工知能の冬の時代に,人工知能学会の会長を務めた石塚満先生の研究室で研究をスタートし,その後も人工知能の分野で研究を続けてきたので,人工知能の研究が冷遇されるのは半ば当たり前だと思ってきた.したがって,こうした人工知能のブームは嬉しい半面,危惧も感じる.話に聞いていた通りに,ブームになると「人工知能搭載」と謳う製品が増える.わずか2, 3年前には,人工知能をこきおろしていた研究者が今や「自分こそが人工知能の研究者だ」という顔をしている.長年,人工知能を研究してきた身としては,今回の人工知能ブームが,過去のブームと同じく,大きな失望につながらないように何とか良い方向に持っていきたいと思っている.

筆者は以前から,ディープラーニング(深層学習)の重要性を指摘してきた(松尾2015).これまでの人工知能技術の歴史を考えると,知識を利用する際のフレームを決めるのが難しいというフレーム問題や、シンボルがそれが指すものと接地(グラウンド)していないというシンボルグラウンディング問題等,難問とされている問題の根源は同じであり,それは特徴表現の抽出に関わる.そしてディープラーニングは,こうした特徴表現の抽出に関わる重要な問題を解いており,それがきっかけとなって,既存の人工知能技術が新たな展開を迎えるだろうという主張である.数年前にはディープラーニングの重要性は社会のなかでもあまり理解されていなかったと思うが,最近では,著書の中で指摘したように,強化学習との融合,ロボットに対する適用,言語処理との融合などの形で技術が進み,ディープラーニングの重要性に対する社会の理解も高まってきた(松尾2015).

さて,今回はサービス学会で記事を書かせていただく機会をいただいた.ディープラーニングの進展は,サービス産業にも大きな影響があると考えており,ぜひ,その点を主張したいと思い引き受けた.本稿では,ディープラーニングの中でも,特に,

  • (i)   画像認識
  • (ii)   深層強化学習を用いたロボット・機械による動作の学習

の2点に注目し,それがどのような変化をもたらすかを示す.特にサービス産業の各セクターにおいて,どのようなイノベーションがあり得るかについて述べる.また,倫理面からの議論も少し紹介する.

なお,本稿で書いていることは,できるだけ論文や実例を引用しているものの,多くの部分が筆者自身の見通しに依拠している.それは,技術に関しての最新の進展と,さまざまなヒアリング調査での知見に基づいたものである.この2年間ほど,ディープラーニングの応用可能性について,さまざまな産業の方と話し,現場の視察や見学にたびたび出向いた.今後の進展については,やや主観的な記述になってしまうことをあらかじめご容赦いただきたい.

2. ディープラーニングの進展の概要とサービス産業に対するインパクト

近年,ディープラーニングの技術の進展が激しいが,ディープラーニングの研究で行われていることは,1980年代に行われていたニューラルネットワークの研究で行われていたこととほぼ同じである.当時,できるはずだと思われていたことが,実際にできるようになった.昨年11月に発刊された書籍であるDeep Learning (Goodfellow et al. 2016)には次のように述べられている.

人工ニューラルネットワークの最初の実験が1950年代に行われたのに,なぜ最近になってようやく,深層学習が極めて重要な技術と認識されるようになったかは,不思議に思うかもしれない.(中略)今日,複雑なタスクで人間の性能に到達する学習アルゴリズムは,1980年代におもちゃの問題を解くのに苦労した学習アルゴリズムとほとんど同一である.(中略)最も重要な新しい進歩は,今日ではアルゴリズムが成功するのに必要とするだけのリソースを,アルゴリズムに提供することができることである.

つまり,計算機のパワーの向上,データの増大によって,従来のアルゴリズムがうまく動くようになったということである.1980年代から目論見られていたように,ディープラーニングは,音声認識や画像認識で大きな性能の向上をもたらした.さらには,自然言語処理(翻訳や対話システム),画像や映像の生成,画像からの自動キャプショニング,深層強化学習によるゲームやロボットの動作の学習など,さまざまなタスクで目覚ましい成果を挙げている.

本稿では,このなかでも大きなイノベーションとして,

  • (i)   画像認識(物体の検出やセグメンテーション,行動認識などを含む)
  • (ii)   深層強化学習を用いたロボット・機械による動作の学習

の2つに焦点をあてる.これらが,産業的に与えるインパクトが最も大きいと考えられるためである.

(i)に関して,2015年にはImageNetデータセット*1における画像認識で,ベースラインである人間の精度を超えた.今では,タスクによっては人間の認識精度を大きく上回る場合もある.これは,さまざまな場所にカメラを置くことで,これまでにできなかった規模や精度での認識が可能になることを意味する.人間の視覚システムに例えると,カメラは網膜に,ディープラーニングの処理は視覚野の処理に該当する.したがって,両方がそろって初めて「コンピュータに目が見える」状態になる.翻って考えると,これまで建物や街中にカメラを多く置けなかった(置かなかった)のは,結局,認識の処理を人間がやるしかなかったため,人間が見られる以上の数を置いても仕方なかったからである.ところが,ディープラーニングにより視覚野の処理が自動化できることになれば,カメラをたくさん置けば,さまざまなことが認識できるということになる.

(ii)に関しては,画像認識を行った上で,高次の特徴量を状態表現として強化学習を行う技術であり,DeepMindによるアルファ碁(V. Minh et al. 2015)で有名になった.ゲームだけでなく,UC Berkeleyを中心に,ロボットへの応用の研究が行われており(Levine et al. 2015),例えば,レゴブロックをくっつける,ドアを開ける,ハンガーをかける,Tシャツをたたむ,いろいろなものを持ち上げるなど,これまでのロボットの技術では難しかったような動作が次々と可能になっている.最近では,Audiが車の駐車を深層強化学習で行うという例も出ている.

人工知能技術全体でいうと,ディープラーニング以外にもさまざま技術があるが,イノベーションの果実は,主に米国を中心とする企業(GoogleやFacebook,Amazonなど)が刈り取っており,少なくとも世界的には決着がついていると考えられるので,ここでは対象に含めない.(もちろん,最近でも進展はあり,サービス産業に関係するところでは,弁護士業務を支援するAI技術(Fronteoが提供するサービスなど)や,医療の文献調査を支援するAI(IBMのワトソン)など,さまざまな活用の可能性はある.)

3. サービス産業の各セクターに対する影響

この章では,サービスに関わるさまざまな産業において,どのような応用可能性があるかを示す.総務省統計局のサービス産業動向調査における産業区分けを参考にしている.

3.1 医療

厚生労働省では,2017年の年始から,「保健医療分野におけるAI活用推進懇談会」が開始された.海外でも医療分野において,多くの試みが始まっているが,その理由は医療画像に対して,画像認識の技術が簡単に活用しやすく,かつ産業規模も大きいからである.主に,X線,CT,MRIなどの医療画像からの診断,皮膚病や眼底等の診断(将来的には内視鏡など),がん細胞などの病理診断が有望な領域である.

取り組みとして有名なものに以下がある.DeepMindは,ロンドンの病院と提携し,加齢黄斑変性と糖尿病性網膜症の診断に取り組んでいる.米国では,Enliticが医療画像に取り組み,例えば肺がんの検出では人間の医者よりも精度がよいという結果を出している.米国GEのヘルスケア事業は,カリフォルニア大学サンフランシスコ校と組んで,医療画像に対するディープラーニングの活用を開始した.

国内では,プリファードネットワークス(PFN)とがん研がゲノムデータの分析において取り組みを始めた.医療画像では,PKSHA Technologyとノーリツ鋼機の取り組みや,キャノンなどの取り組みもある.放射線科医は慢性的に不足しており,ディープラーニングが大きな解決策になる可能性がある.

画像診断の次に有望なのは,薬の管理であろう.薬の処方,調剤,管理は,病院の仕事の中でも大変な労力を要している.また,ミスが許されない仕事でもある.調剤士による薬の取り出しや,病院内での薬の流通,薬剤の投薬管理(飲み合わせチェックなど)は,ディープラーニングの認識技術,あるいは深層強化学習によるロボット・機械の開発により,大幅に自動化できる可能性がある.

看護や介護の領域では,見守りが挙げられる.これまではさまざまなセンサーを置くしかなかったが,画像で認識するようにすることで,ベッドでの異常検知や,認知症の方の見守りが,従来よりも格段に高い精度でできるようになるだろう.食事や入浴の介助をロボットで行うこと,手術をロボットで行うことも将来的には実現するだろうが,安全に関わるため法律等の整備だけではなく,社会的な理解も必要とされることなどから,時間はかかると予想できる.

3.2 物流

物流分野は,自動化が進んでいるものの,まだ人手に頼っている部分も多い.乗用車の自動運転は近年大きく注目されているが,物流分野への活用のほうが先に実現されるのではないだろうか.特に,トラックの自動運転で敷地内での運転は,最もハードルが低く,比較的早期に実現されると思われる.

また,荷物を積み下ろすバンニング・デバンニングは,認識を必要とするために,フォークリフト等を使いながら人手を必要とする作業である.これは深層強化学習により,自動化できる可能性が高い.また,荷をパレットにつむパレタイジング,あるいは,ピッキングなども,状況を認識しつつ作業する必要があるために,現在のところ人手を必要としているが,画像認識および深層強化学習で急速に自動化が進むことが予想される.

店舗内での在庫管理(数量のチェック)は,画像認識で可能になるだろう.また,狭い空間にどのように入っていくのか,細かいものを把持できるハードウェアが構成できるのかなどの課題はあるものの,深層強化学習により,陳列の作業もできるようになる可能性がある.万引きの防止は,小売においては長年の課題であったが,カメラを多く配置し,ディープラーニングによる認識技術を使うことで解決に向かうかもしれない.

3.3 不動産・都市

不動産は大きな産業である.土地を造成したり,建物を建てたりするための,土木や建築に関わるさまざまな作業は,時々刻々と状況が変わり,そのために人間の「眼」を必要とする作業がほとんどであるが,画像認識と深層強化学習により自動化が大きく進むだろう.

ディープラーニングを使うことで,不動産価値を向上させるさまざまな方法が可能になる.例えば,街中に防犯カメラを置くことで,不審者を検出したり,喧嘩や泥酔,事故や誘拐などを防いだりすることができる.どの都市においても,治安はいずれ大きく向上するはずである.特定の都市が先行して導入すれば,「事故や犯罪がほぼゼロの街」を実現することもでき都市のブランディングに活かすことができる.

都市レベルまでいかなくとも,マンションと近隣の学校や公園等を巻き込んだ地域でこれを実現することで,子どもに対しての「絶対の安全」を提供するといった新たな付加価値を住まいに対して提供することができるかもしれない.また,「かっこいい街」「おしゃれな街」がどうやって構成されているのかを考えると,そこを訪れる人がどう感じたかという感覚の総体であろうと考えられる.ふとした瞬間にみる風景,お店,人々,こういったものがその街の雰囲気を作り出す.つまり,街を訪れる人に何らかのカメラを装着し,その人が見るものを映像で取り,それをディープラーニングを用いて大規模に分析することで,「おしゃれな光景」がどのくらいあるか,あるいはゴミや汚い路地などの「不快な光景」がどのくらいあるかをスコア化し,これを上げるような街づくりをすることもできるだろう.

街や商業施設に設置されたカメラにより,人々の動きを観察すれば,人がどのように滞留し,どのように移動しているかが分かる.人が人にどのくらいぶつかりそうになったか,話しながら歩いているのか,どちらを向いているのかなどの分析も可能になるはずである.以前からある「なぜこの店で買ってしまうのか」(アンダーヒル2001)のような目視による分析を大規模にリアルタイムにできるようになるということである.店舗内行動のディープラーニングによる分析については,国内では,ABEJAが始めているが,商品や店頭広告の配置だけでなく,植木や看板の位置決め,一方通行の設定など,さまざまな導線の最適化に用いることができるだろう.

3.4 宿泊・飲食

宿泊や飲食は,対価をもらって客に対してサービスを提供し,満足して帰ってもらうことを目的とするので,客の表情や行動を観測することは重要である.

例えば,外国人の来訪が多い宿泊施設のさまざまな場所にカメラを設置し,どういった人がどこに滞留し,どこで迷っているのか,どこで表情が明るくなっているのか,どこで険しい顔をしているのかなどが分かれば,より快適に過ごしてもらうための創意工夫に活かすことができる.

飲食においても,客の様子を認識し,定量的に測定することで分析ができるはずである.どういったメニューが頼まれ,それがどのくらいのスピードで食べられられるのか,残されるのか,そのメニューを頼んだときの表情はどうか,会話は弾んでいるか,メニューと再来店との相関はどうかなどである.これらは,高度な画像認識により近い将来に実現されるはずである.

宿泊や飲食において,快適なベッドやテーブル,空調などの「居心地の良い空間」を提供することも重要である.ユーザーの表情や行動を読み取ることで,より快適な空間を提供できる.例えば,上着を着ると温度を上げる,暑そうにすると温度を下げるなどのこともできるようになるはずである.寝相を見て,寝苦しくないように,あるいは目覚めやすいように温度を調節するといったことも可能かもしれない.

高度な「おもてなし」を実現するために,常連の顧客が来た瞬間に,それを認識し,従業員に知らせる,過去のデータと照らし合わせて,その人に合わせたサービスを提供することもできるようになるだろう.

3.5 美容・広告・娯楽

Beauty is in the eye of the beholderということわざがあるが,美は,まさに認識に関わる.これまでは自動化や定量的な分析が難しかった.しかし,ディープラーニングの認識技術により,美をこれまでにない形で科学的に捉えることも可能であろう.語弊を鑑みずに言うと,人間の顔をある多次元の特徴空間で表すとして,美人(あるいは美男子)に該当する非線形な多様体があるとしよう.メイクやおしゃれをするということは,この領域に近づける努力と言えるかもしれない.しかし,どの方向が目標とする多様体に最も距離が近いのかは,自明でなく,また,自分がこの多様体のどこを好むか,あるいは他人がどこを好むかによっても事情は異なる.こうした事情を考慮しながら,パーソナライズした美を提供することが,従来よりも,よりシステマティックに効率的に精度よくできるかもしれない.

広告産業においては,顧客がどのくらい広告を注視したかということは本来は重要な指標である.顧客の注視を得るために,コンテンツを最適化するということもできるだろう.例えば,電通とクラウディアンは,通過する車の車種をディープラーニングにより認識し,屋外広告を変えるという実験を行った.米国のAffectivaという会社は,ユーザーの表情を読み取ることで,コンテンツや広告の最適化をしようとしている.同じく米国のEmotientはAppleが買収したが,iPhoneのユーザーの表情をリアルタイムに読み取り,インタラクションに活かすということであろう.

娯楽においても,認識技術は大きな役割を果たすと考えられる.例えば,バルセロナの劇場が,認識技術を用いて笑うごとに課金(pay-per-laugh)という試みを行っていたが,そういったことが可能になる.さらに言えば,誰がどの瞬間に笑ったかということを分析すれば,笑いどころが同じかどうかを分析することで,ある種の笑いの主成分分析のようなことができるかもしれない.笑う,泣くなどの感情に関する分析ができれば,コンテンツの製作においても大いに役に立つはずである.

スポーツにおいては,興業主側,プレイヤー側のそれぞれに活用の可能性がある.興業主側としては上記と同じ,顧客の分析によるコンテンツ評価やスポーツ施設の最適化に活かすことができる.プレイヤー側としては,従来は,相手プレイヤーの動きを分析して,弱点を突くことは人間が行っていた.例えば,テニスプレイヤーは筋肉の動きでどちらかを判断するように訓練される.しかし,これを画像認識により自動化すると,人間が気づかないような微小な変化を見つけ,そこから相手の行動を読むように訓練できるかもしれない.また,選手の練習時に,熟練のプレイヤーや監督ならわかるような「腰が入っているか」「体重が乗っているか」などの高次の特徴量をタイムリーに選手に戻してやることができれば,練習の助けになるかもしれない.

3.6 教育

教育における人工知能の活用は,主にEduTechという言葉で語られる.主なものとしては,教育に関するデータをたくさん集め,個々の学習者にあわせた学習方法を提供することであり,必ずしもディープラーニングと関係するわけではない.EduTechは数年前にかなり盛り上がっていたが,最近ではKhan Academyが職業訓練にシフトするなど,米国でも日本でもブームが一段落しつつ,徐々に社会の中に定着しつつある.

教育において,ディープラーニングが活かされる場面としては,やはり見守り系になるだろう.集中力と教育効果は大きな相関があると思うが,集中しているかどうかを認識できることにより,生徒がより集中しやすい環境,条件,指導方法を最適化することができるかもしれない.例えば,やる気が出る音楽を聞く,やる気が出るマンガを読ませるなど,さまざまな最適化が可能になる.

ディープラーニングを中心とする機械学習の急速な進展にともなって,そもそも人間の学習にとって有用な知見も得られるはずである.例えば,習熟の早い人は,補助問題としての予測問題を常に解いている傾向があるのではないかと思う.そもそも興味があるものが上達するというのは,アテンションがかかることで補助問題としての教師あり学習を多数やっていることと同じことが行われているのではないだろうか.とすれば,常に予測するような癖をつけることで,学習を効率化するということもあるのかもしれない.

3.7 労務管理

企業内の間接部門等の仕事についても,新たなイノベーションが起きる可能性はさまざまにあると思うが,なかでも,労務管理は,画像認識の技術で大きく向上する可能性があるだろう.

例えば,情報技術の進展でテレワークの普及が期待されているが,思ったほどには広がらない.大きな問題のひとつは,見られていなければ怠けてしまうことである.ところが,認識技術を用いれば,PCの前で仕事をしているのか,あるいはネットを見ているだけなのかを区別することもできる.そうすると,頑張ったことに対して正当な支払いをすることも可能になる.ユーザーのプライバシーを侵さず,例えば「仕事しているか」だけを認識する技術により,努力に対する支払いが可能になる.筆者は「努力給」と呼んでいるが,時給,成果給に次ぐ,第3の方式ができる可能性もあるのではないかと思う.

企業内のコミュニケーションの様子,表情などを読み取ることで,例えば,ストレスのレベル,うつ病の傾向,ハラスメントなども分かるかもしれない.Hitachiが加速度センサーでこうした試みを行っているが,これが画像認識で簡単にできるようになる.誰がコミュニケーションを活性化しているのか,元気づけているのかなども読み取ることができれば,企業の生産性を上げることにもつながる.

本章では,サービス産業に関わるさまざまなセクターでの可能性について述べてきた.もちろん,サービス産業以外での,一次産業,二次産業でも画像認識や深層強化学習の可能性は大きい.しかし,国内のGDP,従事者の数からいって,サービス産業における活用は,ディープラーニングの応用先として大変重要であるだろう.

4. 倫理・プライバシー

ここまで見てきたように,ディープラーニングによって今までよりも格段に高度な認識ができるようになり,サービス産業におけるさまざまな場面で,PDCAのサイクルが回るようになる.顧客の数や動作,表情をリアルタイムに定量化することができれば,さまざまな最適化が可能になる.

一方で,客や従業員にとって,カメラにより「ずっと見られている」のは,(人の関与がなく,計算機上の処理だけだとしても)気持ち悪いと感じるかもしれない.こうした,人工知能と倫理に関しては,さまざまなところで議論されている.内閣府では,人工知能と人間社会に関する懇談会が2016年から開かれた.英国のFuture of Life Institute は,2017年2月にアシロマAI原則というのを出した.国内外の動きに関しては,(松尾他 2016)に詳しい.

筆者の考えでは,本稿に書いたように,ディープラーニングによる認識や深層強化学習は,非常に大きな産業上の可能性がある.したがって,倫理的な議論が過度に技術的な進展の障害になるべきではないと考える.(ただ,軍事利用は別で,国際社会を巻き込んだ議論が必要であろう.)カメラ画像の利用をどう捉えるかは,経産省や総務省は,大まかな指針を示している(経済産業省2017)が,あまり早期に規制すべきではなく,さまざまな活用方法や問題が見えてきた段階で,緩やかに問題に対する対処法を検討していき,必要最小限の範囲で規制をするべきではないだろうか.

一方で,サイバーセキュリティを拡張した概念として,ディープラーニングによる認識や深層強化学習といった技術がもたらすリスクについてもしっかり考えることは重要である.例えば,人の表情から国家機密が流出する可能性があるのかないのか.人の出入りを観察することで,要人と関係の深い人が特定されたり,あるいは,侵入できるパターンが検知したりできるのではないか.「認識ができること」による犯罪をどう防いでいけばいいのかなど,議論すべき点は多い.

5. まとめ

本稿では,特にディープラーニングが可能にする影響を,サービス産業に関して考察した.ディープラーニングのもたらす効果のなかでも,画像認識,および深層強化学習による影響を中心に記述した.

ここで書いたことは,技術的な可能性であり,実際に実現するのは,容易ではない場合もあるだろう.例えば,データをどう集めるか,投資対効果はどのくらいか,いかにユーザーに安心感をどう持ってもらうかなど,現実的な問題はさまざまである.しかし,こうした問題を乗り越えることで,サービス産業全体にとっても,大きなイノベーションにつながるはずである.こうした技術がきっかけとなり,サービス産業全体が活性化し,ひいては人工知能の技術への投資にもつながれば,人工知能研究者としても大変喜ばしいことである.そのためにも,ディープラーニングの技術の可能性をしっかりと捉えて,サービス学全体がさらに大きく発展していくことを期待している.

著者紹介

  • 松尾 豊

1997年 東京大学工学部電子情報工学科卒業.2002年 同大学院博士課程修了.博士(工学).同年より,産業技術総合研究所研究員.2005年10月よりスタンフォード大学客員研究員.2007年10月より,東京大学大学院工学系研究科総合研究機構/知の構造化センター/技術経営戦略学専攻 准教授.2014年より,東京大学大学院工学系研究科 技術経営戦略学専攻 グルーバル消費インテリジェンス寄付講座 共同代表・特任准教授.2002年 人工知能学会論文賞,2007年 情報処理学会 長尾真記念特別賞受賞.2012年〜14年,人工知能学会編集委員長を経て,現在は倫理委員長.専門は,人工知能,Webマイニング,ビッグデータ分析,ディープラーニング.

*1  画像認識で共通に用いられるデータセット.10万枚以上の画像とシソーラスの語彙が対応づけられている.

参考文献
 
© 2020 Society for Serviceology
feedback
Top