情報管理
連載
「情報」とはなにか 第5回 ■情報×集団心理:Web上の「書き込み」による情報拡散とシミュレーション
高安 美佐子
著者情報
ジャーナル フリー HTML

60 巻 (2017) 7 号 p. 512-515

詳細
PDFをダウンロード (1186K) 発行機関連絡先
著者抄録

インターネットという情報の巨大な伝送装置を得,おびただしい量の情報に囲まれることになった現代。実体をもつものの価値や実在するもの同士の交流のありようにも,これまで世界が経験したことのない変化が訪れている。本連載では哲学,デジタル・デバイド,サイバーフィジカルなどの諸観点からこのテーマをとらえることを試みたい。「情報」の本質を再定義し,情報を送ることや受けることの意味,情報を伝える「言葉」の役割や受け手としてのリテラシーについて再考する。

第5回は,サイバー空間における情報拡散の推移がテーマ。ある単語の出現数やその減衰を数理モデルで表し,科学的にシミュレーションすることから何がわかるのか。

東日本大震災

2011年3月11日,数百年に一度と言われる大地震が東日本を襲った。引き続き巨大津波,原子力発電所の連鎖破綻など極めて非日常的な災害が続き,日本中が非常に異常な集団心理状態に陥っていった。歴史的にも大きな災害は何度も起こり,同じように異常な心理状態が発生していたと考えられるが,21世紀に入ってからの災害は特別である。ブログやTwitter,SNSといったリアルタイム型の情報共有システムがあったおかげで,人々の時々刻々の感情を含んだ書き込み記事がインターネット上にデータとして残されているのだ。

後から足跡をたどるようにして,集団心理の推移を定量的に解析することが可能となっている。実際のデータを分析することで,どこから出た情報がどのように人々の間に広がっていったのかを正確に追跡できるようになっており,多くの科学者がそのデータに注目している。震災時は,日常より,人々のさまざまな感情成分が大きく揺さぶられていることが知られている。また,このような不安な状態では,多くの誤情報に翻弄(ほんろう)されている人々の様子が記録に残っている。誤情報を早期に発見し,訂正して混乱を回避するにはどうしたらよいのか,といった実用的な課題に世界中の科学者が真剣に取り組んでいる。

東日本大震災に絡んで発生した最も典型的な誤情報(デマ)の拡散事例は,東京湾岸の市原市で起こったコスモ石油のガスタンクの爆発に伴うデマである。大きな余震の影響で,3月11日午後3時過ぎに液化石油ガスが漏れだして引火し,午後5時ごろ,ガスタンクが大きな音とともに爆発し,火山の噴火のようなきのこ雲が発生した。テレビやラジオなどのマスコミの報道は,津波などのさらに被害の大きな災害に焦点が当てられており,また,電話はほとんど使えなかった環境の中で,Twitterやブログなどでこの事故の情報を拡散し,人々に知らせようとする人が出てきた。

そのような状況の中で,午後6時ごろ,最初のデマ情報が発信された。「東京湾岸で石油タンクが爆発し,有毒な化学物質を含む危険な雨が降るかもしれないので,肌を守るために傘を持ってください」というような内容だった。これに対して,デマを訂正する,「爆発したタンクは液化石油ガスで,有毒な物質は発生しません」という情報が午後7時30分ごろには個人から発信されたが,デマ情報の拡散が勝り,翌日になっても拡散され続け,結果3万人以上がその拡散に関与することとなった。デマ情報の拡散が止まり始めたのは,翌日の午後3時になって,浦安市が公式なWebサイトで「タンクの爆発で有害物質が発生したという科学的な根拠のない情報が流れているが,誤情報に惑わされないように」という内容の明確な情報を公開してからだった。震災の中,さまざまな,陰惨で非現実的な報道に直面して混乱した人々が,危険な誤情報を正しい情報と思い,善意から拡散していたケースも多かった。そのような善意の下,後の訂正情報を見て,自分が流した情報が誤りだったというデマ訂正の情報を早急に拡散させ,デマ情報は急速に終息した。

情報拡散のシミュレーション

このような,サイバー空間での誤情報・訂正情報の拡散過程を数理モデルで表し,科学的にシミュレーションを行うことができる。

Twitterやブログなどを利用し,インターネット上に書き込みをするのは,日記のように自分の体験を書く人,自発的に自分の考えや趣味について発信する人,あるいは,他の人の書いた記事に触発されて,そのコメントなどの記事を書く人などである。そのような書き込みの行動を,次のように確率的な数理モデルで表現することができる。

まず,書き込みをする可能性のあるエージェント(人)を仮想的に多数想定し,それぞれがサイバー空間の記事を読む確率,その中のある話題に関心をもつ確率,関心をもったことに関して書き込みを行う確率,その話題への関心がなくなった状態に遷移する確率など,観測結果を用いながら適宜設定する。そのうえで,コンピューターで作成した乱数に従って,それぞれの人の行動のシミュレーションを行うと,ある話題に関心をもつ人が次第に増えてブームが起こり,やがて,そのブームが衰退するというようなマクロな人間の集団的行動をコンピューター上で再現することができる。

このような考え方に基づいたモデルを拡張すれば,前述のガスタンクの爆発に伴うデマの拡散と,そのデマ情報の修正情報の拡散に関しても,シミュレーションを行うことができる。モデルには数個のパラメーターがあり,データ同化,すなわち,現実のデータとの整合性が最も高くなるようにそれらのパラメーターを調整することで,シミュレーションの結果を現実の結果と比較することができる。現実の結果を一定の精度で再現することができるようになったら,さらに,たとえば,デマ情報を修正する浦安市の公式ブログの発信が現実よりも2時間早かったらどうなっただろうか,などの仮想状況を想定して,結果がどれくらい変わるかをコンピューター上で実験を行って調べることもできる。このような解析からわかってきたのは,誤情報の修正は,できるだけ早い時期に中立的で公正な公の機関から発信することで効果が発揮される傾向があるということだ。

忘却曲線

サイバー空間の中の「津波」という単語の出現数は,2011年3月11日より以前は1日当たり100件程度だったが,3月12日には14万件を超える数になった。その後,時間の経過とともに次第に数が減少していったが,その減少の仕方の関数形を推定すると,地震の発生日からの日数のおよそ0.7乗分の1というベキ乗の関数であることがわかった。この関数形をそのまま延長すると,「津波」という単語の出現数が大震災の前の状態になるまでには,およそ25年かかると推定された。人々の集団的な記憶がどのように薄れていくか,その忘却曲線が見積もれるわけである。つまり東日本大震災ほどの災害の後では,「津波」という言葉を以前のように使えるようになるまでには1世代程度かかるということなのだ。

同じような忘却曲線の関数形は,さまざまなニュースに関して確認できる。たとえば,2009年にマイケル・ジャクソンが突然亡くなったときにも,「マイケル・ジャクソン(Michael Jackson)」という単語の書き込み数がその日のうちに急増し,その後,経過時間のベキ乗の関数形でゆっくりと減衰していった。自動車の部品の不具合によるリコールなど産業界のニュースも含めて,急に話題になったような単語の出現数は,多くの場合,同じようにベキ乗関数で減衰して,次第に元の状態に戻ることが知られている。

外部からの刺激などで不安定になった状態が安定な状態に戻る現象は物理学では「緩和」とよばれる重要な問題で,さまざまな研究が行われている。単純な物質や電気回路の基本的な緩和の関数形は,指数関数であり,放射性物質の減衰も指数関数であることがよく知られている。放射性物質の半減期のような量では,指数関数の減衰が特徴づけられる。たとえば,半減期が1日だとすると,2日たつと4分の1になり,10日過ぎると2の10乗で約1,000分の1にまで減衰することになる。しかし,アモルファス物質のようにランダムで複雑な構造をもつ物質や複雑な電気回路の場合には,さまざまな緩和のメカニズムが重ね合わさり,ベキ乗のような関数でゆっくりと緩和する現象も知られている。おそらく,サイバー空間は物質よりもさらに複雑な構造をもっており,そのために,指数関数ではないような緩和が実現していると思われる。

指数関数の緩和であれば,どれくらいの時間で元の状態に戻るかは,半減期の大きさで簡単に推定することができるが,ベキ乗関数の緩和の場合には,元の状態に戻るまでの時間はピークの高さと緩和のベキ指数の関係で決まるので,一概に何日くらいということができない。日常的なニュースで話題になった言葉の多くは,「人のうわさも七十五日」といわれるように,2~3か月で以前の状態に戻るが,「津波」のように極めて大きなピークになった場合には,10年以上の年月がかかることになる。

このように,何日するとうわさや評判が社会から消えるのか,という問題は,時に企業にとっても重要となる。たとえば,不良品が出た場合,リコールなどを行い,商品を回収し,安全安心の役割を社会的に果たすことが求められている。しかし,リコールのような問題を1回起こすと,消費者が商品から遠ざかることもありうる。そのような場合は,SNSなどを利用して対処した場合,いつごろになったら人々の信頼が戻ってくるのかという判断は,重要となる。

国民感情分析とリアルタイム型景気指数

最近は,一般の人がどんなことに関心をもっているかという視点から,サイバー空間の中の書き込み数の多い単語を,テレビのニュースなどの番組で取り上げることが多くなってきた。ブログやTwitterは若者しか関与しないから,観測対象年齢が限定されるという話は,6,7年前はよく聞かれたが,最近の総務省などのデータをみると,現実,50代でも利用者は増加している。おそらく,今後20年くらいすると,全世代が偏りなくSNSを使う時代が到来する。しかし,現状のサンプリングは年齢層にも偏りがあることは承知したうえで,サイバー空間での単語の出現頻度を観測することで,リアルタイムに近い形で人々の声を聞くことができるようになってきたことは,画期的なことである。以前からあるアンケート調査などは,紙であっても電話調査であっても,調査をしてから集計するまでにかなりの日数とお金がかかるが,それに対し,サイバー空間の書き込みの調査は,解析用のプログラムを作っておけば,非常に低いコストで自動的にほぼリアルタイムで処理することができる。

私たちの研究チームでは,サイバー空間の単語の書き込み数を観測することで,国民全体の感情の推移を分析し,リアルタイムで計測する試みを行っている。感情分析では,心理学のPOMSと呼ばれる方法に準拠して,「怒り」「混乱」「抑うつ」「疲労」「緊張」「活力」の6つの感情成分を,それぞれの感情と密接に結び付く単語群の出現頻度から推定している。この方法を使うと,たとえば,東日本大震災の直後には,「混乱」「緊張」の増加が顕著に観測される。それは当然として,一方「活力」も上昇し,「疲労」と「怒り」が減少していることが観測できる。この「活力」は何を意味するのか。

引き続き出現した形容詞を調べた。その結果,「はがゆい」「心細い」「心苦しい」「尊い」「もどかしい」「いたたまれない」という単語が震災後に急増していた。これらのデータを解析していく中でわかってきたことは,「被災した人のために何かをしなければいけない」と感じた国民の声である。自分が直接の被災者でなくても,ニュース映像などの悲惨な状況を目の当たりにして,多くの人が自分の疲労やささいな出来事に対する怒りを忘れて,被災地に思いをはせて行動力が高くなったと思われる。前に述べたコスモ石油のデマの拡散には善意の意味も含まれる。「もし,本当なら,少しでも多くの人が被害に遭わないように」との思いがデマ情報を拡散させた。震災など,おそらく,このような特殊な環境下で非常に強いストレスにさらされている状態では,集団感情が大きく揺らぎ,デマやうわさが拡散しやすいことが推測される。

国民全体の感情は,景気にも大きな影響があるはずである。国の発表する景気指標の中には,アンケート調査に基づくものもあるが,そのアンケート調査の中によく出てくる単語の出現頻度をサイバー空間の中で数えると,かなり高い精度でアンケート調査と同じような結果を得られることがわかってきている。この方法を発展させれば,今は2か月程度遅れて発表されている景気動向を,たとえば,土曜から金曜までの景気指数として週末に公表し,企業はそれを利用して翌週の戦略を立てる,というような形に展開することもできるはずである。

執筆者略歴

  • 高安 美佐子(たかやす みさこ) takayasu.m.aa@m.titech.ac.jp

1987年3月名古屋大学理学部卒業,1993年3月神戸大学大学院 自然科学研究科博士課程卒業。2004年度より東京工業大学 大学院総合理工学研究科准教授,2017年度より同教授。2014年より東京工業大学 帝国データバンク先端データ解析共同研究講座代表。2016年4月より,東京工業大学 科学技術創成研究院 ビッグデータ数理科学研究ユニット代表。日本学術会議連携会員。編著『学生・技術者のためのビッグデータ解析入門』(日本評論社)他。

 
© 2017 Japan Science and Technology Agency
feedback
Top