2013 年 56 巻 8 号 p. 498-505
複雑系のモデル化や数理解析の進展と応用への期待がもたれて久しい。しかし,複雑系研究の現状や今後の可能性は適切に語られていない。本報では,複雑系数理モデルが「現実の問題を解くことがどの程度可能であると考えられるのか」を現実のシステムの実測と数理モデルとの対比を通して論ずる。まず,「複雑系の数理モデル」とは,現実のシステムをありのまま詳細を再現するものではないことを述べる。次に,複雑系数理モデルのベイズの定理に根ざしたいくつかの成功実例や,巷(ちまた)で話題になっているビッグデータ解析の諸問題との関連性にも言及する。さらに,今後の複雑系の数理モデルの可能性に言及する。
20年ほど前,「カオス」のパラダイムが世界中で流行,グリック著『カオス:新しい科学をつくる』(新潮社1),1991年)が爆発的に売れた時代があった。カオスの理論と応用の現状は合原著『カオス学入門』2)にコンパクトに良くまとめられている。熱流体系への応用に関しては文献3)を参照していただきたい。複雑系数理解析の展開に関しては,カオスの熱波が去り,理論と応用の「盛り上がりを欠いた状態が長く続いているのではないか?」というのが非専門家の意見だろう。これはほんとうだろうか。
複雑系のパラダイムに関する著書は1990年代の後半から数多く出版された。蔵本4),リューイン5),カウフマン6),金子・津田7)らの著書にエッセンスがまとめられている。(1)ランダム・ブーリアンネット6),(2)セル・オートマトン8),(3)結合写像格子(Coupled MapLattice)7),(4)結合位相振動子4),(5)複素ギンスブルグ・ランダウ方程式(complex Ginzburg-Landau equation:CGLE)4),(6)自己組織化臨界現象9),10)。これらは現実の現象を部分的に切り取って理想化した簡単な数理モデルであるが,システムの詳細な構造によらない,定性的だが普遍的な特質を数学モデルとして表現することに「ある程度成功したモデル」といえる。ミッチェルは複雑系パラダイム発展の歴史や現状をわかりやすく紹介している(『複雑系の世界』10))。
非専門家の読者の中には,上記(1)〜(6)に示した簡単なモデルは現実の複雑系とは無縁の「おもちゃ」のようなもので,「現実の問題を議論するのは誇大妄想ではないか?」と考えている方もおられるだろう。本報では「複雑系数理モデル」がどの程度現実の問題を解くことが可能であると考えられるのかを,現実のシステムの実測と数理モデルとの対比を通して論ずる。2章ではまず「複雑系数理モデルとは何か」を述べる。3章では,最近,巷で話題になっているビッグデータ解析の諸問題との関連性にも言及する。4章では3章の議論を受けて複雑系数理モデルの可能性に言及する。5章はまとめとする。
自己組織化や進化,創発(emergence),遺伝子,免疫システム,生命,複雑ネットワークのさまざまな現実の諸特性をそのまま詳細に記述し,予測できる簡単な数理モデルが作成可能か?
答えはもちろん「否」である。複雑系の統一理論は存在し得ないだろう。現実に近づけようとしてモデルを精緻化すればするほど,モデルの時間・空間変動をシミュレートするための計算量や解析量,さらにはモデルに含まれる多数のパラメーターを現実との対応で推定する問題の困難さは急激に増大する。(i)そこで,複雑な系(問題)を簡単(抽象)化し,その一部分を切り取ってくる方法が考えられる。この方法では一側面を切り取ってきているので,全体を記述するにはいくつもの物理的特性などの側面を記述する数理モデルが必要となる。(ii)他の方法として,統計的モデルは実体の真の構造の忠実な再現を目指すものでなく,推論の根拠を示すものであるという信念で能動的なモデリングを実現してきた赤池弘次氏(http://www.ism.ac.jp/akaikememorial/)に代表される方法がある。現実の観測データを上記(i)や(ii)などのアプローチで数理的に解析し,予測や制御に使っている簡単な数学モデルを「複雑系の数理モデル」とよんでいる。
2.2 確率・統計を道具として利用する必要性上記のように,複雑なシステムのありのままの詳細な挙動を簡単な力学モデルで記述するのは難しい。現実のシステムの理想化/簡単化により切り捨てられた情報は確率的な要素として影響するから,確率論や統計力学を基礎とするアプローチへの転換が必須となる。(1)分岐理論(解の特性変化を記述する理論)は確率分岐理論(確率分布の特性を記述する理論)に,(2)共鳴は確率共鳴(ランダムな入力に対する共鳴)に,(3)状態の不連続な変化は連続的な変化に,(4)非線形力学はランダムなノイズ入力のある非線形方程式を用いたアプローチに,(5)状態空間(状態変数の組から構成される空間)は自己組織化状態空間に,(6)情報幾何(確率分布の情報を幾何学的にとらえる方法)11)は時間を入れた動的情報幾何に,(7)臨界現象(系の状態が劇的に変化する境目で発生するゆっくりした現象)は自己組織化臨界現象9),10)に,それぞれ置き換える必要がある。
2.3 複雑系数理モデルの実例 2.3.1 メゾスコピック系のモデリングプラチナ単結晶表面上での一酸化炭素の酸化反応の多様な時空パターンの発生機序を説明すべく,反応拡散方程式を基礎としてメゾスコピックなシステム(ミクロとマクロの中間領域)の現象論的モデリングが行われた12)。重要な点は,結晶表面構造の再配列による構造変化をなめらかな非線形関数で表現し,単結晶表面の酸素および一酸化炭素の被覆率に注目し2変数とした簡単化にある。実験結果との厳密な一致は得られていないが,実測されているさまざまな時間空間パターン(回転らせん波,ソリトン,欠陥とよばれるもの)発現の本質的な物理的機構の理解を得るために重要な貢献があった。
2.3.2 熱対流系のモデリング現象を記述する方程式に拡散や流れがあり,非線形の相互作用が重要になってきており,自由度が無限大となっているような熱対流系などのパターン形成などでは,欠陥乱流とよばれる乱れた構造が出現する13)。それらの系では,欠陥が生成・消滅を繰り返しながら運動するが,「1. はじめに」で述べた(5)の空間2次元CGLEが実験との対応で利用されており,定性的な対応関係の存在が認識されている。欠陥パターンの点滅や欠陥の運動法則などの対応も明らかにされている13)。残念ながら長い距離間に相関のあるモデルへの拡張と現実との対応に関する成功例は知られていない。
2.3.3 ベイジアンモデリング14)赤池氏は,統計的モデルは実体の真の構造の忠実な再現を目指すものでなく,推論の根拠を示すものであるという信念で能動的なモデリングを実現してきた。後期の研究ではベイジアンモデリングの展開に努力された。ベイジアンモデリングとはベイズの定理に基礎を置いたモデル化をさす。解析例や成果を列記すると,(1)エルニーニョ現象の発現機序の解析(シミュレーションモデルはZebiak and Canemodel,1987を使っている),また,津波データ(日本海中部地震津波)の解析における海底地質データの不確定性の検証,(2)自己組織化状態空間による,経済・社会現象データ中の季節変動の分離・解析,(3)遺伝子解析や遺伝子制御ネットワークの推定,(4)音声認識,などに適用され成功を収めてきた。上記(1),(2)のようなモデリングによってシミュレーションと実データ両者の情報を統合する作業は「データ同化」14)とよばれる。(3),(4)はマルコフ過程(記憶のない確率系)に隠れた変数を導入するモデル化をしているので「隠れマルコフモデル」とよばれることが多い。(4)の音声認識では声帯の実体や物理的機構を反映したモデルを利用したアプローチは成功していない。
2.3.4 非平衡系における超統計ベックとコーヘン15)は非平衡系に普遍的に現れる「べき乗分布」(指数関数で表せない分布)の出現根拠がシステムの(時間・空間)不均一性に由来することを見抜き,ボルツマン・ギッブス統計を拡張した超統計の概念を提唱している。数理的な観点からみると,このモデル化も数理的には上記のベイズの定理に根ざしている。現象に付随した分布が正規分布にしたがっている場合でも,分散が一定でなくガンマ過程,対数正規過程,あるいは,逆ガンマ過程にしたがっているとベイズの定理を使ってさまざまな非平衡系のダイナミクスを理解することができる15)。典型的なケースではいずれも,裾の厚い「べき乗分布」となることに注意する。図1は米国の株価指標のデータから推定した対数価格差の分布である。縦軸が対数になっていることに注意する。黒丸が実測値で,実線がデータのみから非線形項を有する確率微分方程式を推定し,分布型をあてはめた。点線は正規分布を表し,破線は非線形項がない場合のあてはめた結果である。3次の非線形項があるとき,実測データを非常によく再現している。正規分布の分散が一定ではなく,ガンマ分布にしたがって時間変動すると考えてもこのような裾の厚い「べき乗分布」を再現できる。類似の「べき乗分布」は,地震の振幅分布,津波の振幅分布,心拍の間隔分布の揺らぎ,熱対流の速度揺らぎや温度揺らぎなどでも観測される。
ビッグデータの活用による諸問題の解決可能性が叫ばれている。ビッグデータとは「既存の技術では管理するのが困難な大量のデータ群」の総称であり,単なる量だけでなく,3つのV,量(Volume),多様性(Variety),発生速度や更新頻度(Velocity)で特徴付けられる。ビッグデータの活用に関しては,天気予報での観測データの数値処理,ゲノム解析,NASAの宇宙航空応用(スペースシャトル事故解析など)での分析処理,通信衛星や電波望遠鏡からの画像データ・信号処理などで数多くの実績がある。
城田16)によれば,ビッグデータの活用は4パターン,すなわち,個別最適化/全体最適化,リアルタイム型/バッチ型の組み合わせで決まる。例として下記のようなものが列記されている。特定の個人やモノに関する情報をできるだけ収集して最適なサービスや処理を行うが,そのタイミングは問わないか,あるいはリアルタイムに施すものとして(I)個別最適・バッチ型(one-to-one marketing:顧客離反分析,センサーデータ利用故障予測),(II)個別最適・リアルタイム型(ドコモ ワンタイム保険など)があげられている。また,特定の個人やモノに関する情報をできるだけ収集して,全体最適なサービスや処理を行うが,そのタイミングは問わないか,あるいはリアルタイムに施すものとしては(III)全体最適・バッチ型(グーグル「もしかして」機能,グーグル翻訳,つぶやき情報の資産運用活用),(IV)全体最適・リアルタイム型(自動車の位置情報を利用した渋滞予測,スマートメーターを用いた電力需要予測)があげられている。
上記のような比較的わかりやすい例題は一般的な(1)確率・統計,(2)機械学習,(3)データマイニングの技術で処理可能である場合も多いだろう。しかし,ビッグデータは城田の指摘するような情報科学や経済学の分野のみにとどまらない。生命科学,工学,医学などの多様な現実の諸問題のビッグデータに対応するためにはより幅広い知識が要求されるだろう。すなわち,下記のような現実問題を解くためには(1)~(3)のみでは十分でなく,(4)ネットワーク科学17)~19),(5)非定常確率過程20),(6)非平衡統計力学(大偏差統計や極値統計)20),(7)非線形科学4),(8)流体の科学(乱流理論)12),13),(9)脳・認知科学,(10)行動心理学,などの基礎知識が必要になる。これらに関連した数理工学的知識がないと実データを解析したあと,結果の正しい意味付けや解釈に苦しむことにもなりかねない。
3.1 感染症の数理モデルインフルエンザ,HIV/AIDS(エイズ),SARS(重症 急性呼吸器症候群)などの感染症や噂の広がりの問題は,感染症の数理モデルで有名なSIR(Susceptible, Infected, Recovered)型モデルで記述できる。感染者(I)と感受性保持者(S)の接触により感染が広がるのでモデルの数学的構造は同じようになる。新型インフルエンザやSARSなどの流行で話題になったように,多数の人にウイルスをまき散らす人がいるとSIR型モデルの精緻化が必要となる。また,ウイルス感染の問題でも,コンピューターウイルスの感染問題では現実的には複雑ネットワーク構造を考慮する必要がある。さらに,インフルエンザ感染の問題も全世界的な観点からみると航空網,鉄道網,道路網などのネットワーク構造を考慮した解析が要求されるだろう。複雑な交通網におけるヒトの流れのビッグデータを基礎に感染過程をマルチエージェントモデルでシミュレーションする試みはすでに始まっているが,情報圧縮のためには巨視的な確率SIR型モデルなどの利用が必要となる20)。学級閉鎖,外出禁止や隔離などの大規模対策がとられると,感染率や隔離率は時間の関数として変動することになり,1人の感染者から感染する平均人数R0も時間変動することになる。2次感染などを再現できる優れた数理モデルの構築も重要な課題である。
3.2 ワクチンの割当問題新型インフルエンザの世界的な流行が危惧されているが,ワクチンの製造・配布を動的に計画する問題の重要性が指摘されている。ワクチン製造・配布量は有限であるから,「季節性および新型インフルエンザの同時流行時のインフルエンザの総死亡数を最少にするようなワクチンの割当問題」なども重要な問題の1つである。この問題は最適制御理論の枠組みで最適解の探索は可能であり21),22),数理解析の有効性を示す好例でもある。問題解決のためにはインフルエンザの流行パターン(新型と季節型の混合割合など)の分類,実データを用いた流行パターンの特定とモデルのパラメーター推定,具体的なワクチン割当計算などを逐次実行する必要がある。最も難しいのはモデル選択とそれらのパラメーターの推定であろう。SIR型の力学モデルは確率SIR型モデルと比べてR0を過大に見積もる傾向がある20)。実際,SIR型モデルを作成したケルマックとマッケンドリックはロジスティック近似20)を用いて実データ(ボンベイにおけるペスト流行データ)の解析を行っている23)。ロジスティック近似を採用することは感染率が免疫保持者(R)の関数として減少する状況を考えることに対応する。ケンドールはケルマックらの解析で使われたロジスティック近似の意味を力学SIRと確率SIR型モデルの特性との関連で議論している23)。実問題に対処するためには,流行パターンの整備や実データを用いたモデルの徹底した検証が必要である。
3.3 放射性物質飛散の解析東日本大震災で発生した原子炉事故で大量の放射性物質が放出された。汚染土壌の空間分布を眺めてみると,空間的に「まだら」(まだら状構造や自己相似構造が観察される)である。また,発生源から単調に減少しておらず,かなり遠くにも飛散していることが観察できる24)。放射性物質の発生源である原子炉からの拡散・輸送過程は,流れのある場での乱流拡散(レビー拡散)による記述が適切であると推定される。このような観点から数理モデルを用いた実測との対応関係の検証が必要である。これらの数理解析手法の妥当性が検証されれば,今後の予測や政策提言などに有効に利用できると期待される。
『カオス学入門』2)にはカオス工学(カオス,フラクタル理論の工学への応用)の応用例が列記されている。どのような数理的な解析が成功事例となっているのかをみると,(1)システムの不安定性の指標(リアプノフ指数など),(2)フラクタル次元(相関次元,樋口法によるフラクタル次元など)の複雑性の指標,(3)エントロピーを基礎とした時系列解析やアトラクターの形状の複雑さの指標を用いた応用などであることがわかる。また,(4)レーザー発振など不安定状態を維持可能な新しい発想によるカオス制御法が提案されている2)。
複雑系の時系列解析でも,カオス工学/数理工学で利用されてきた数学的な道具,(1)エントロピー,(2)アルゴリズム情報量,(3)論理深度,(4)熱力学深度,(5)計算能力,(6)統計的な複雑性,(7)フラクタル次元,(8)階層度などが使われている。また,予測不可能性,不安定性の定量化として,(9)リアプノフ指数の分布と揺らぎ(確率過程)なども利用されている。しかし,これらの数学的指標の適用拡大のみで,応用可能性を積極的に語ることは難しい。実体との対応では物理,医学・生理学,脳・認知科学,行動心理学的な中身を入れた議論が要求されるからである。
以下では,「複雑系数理モデルの役割は何か」という問いとの関連で可能性を語ることを考える。私見では複雑系数理モデルには以下に列記する役割がある。
(1) 複雑な事象や現象が発現するメカニズムの解明や普遍法則の発見2.3.1および2.3.2さらには,蟻(あり)社会での局所情報がどのように全体社会に反映されるのかが解明された9),10)。単純化によって本質が浮き彫りにされる。また,バクら9),10)によって提唱された自己組織化臨界現象の概念は,システムの構造の詳細によらない普遍法則として認められている。実世界における空間の不均一性を考慮すると,臨界性の差別化とその応用に発展の余地がある。
(2) 複雑な現象解析を通じた知識の獲得・発見2.3.3および2.3.4でみたようにベイジアンモデリングなどで機能的統計モデルに徹する場合もあるが,データ同化のように物理モデルと併用する立場もある。物理モデルの改良のための情報抽出の方法とも見なせる。音声認識や遺伝子解析などでは優れた機械学習法との組み合わせで,一層強力な道具に発展する可能性がある。
(3) 新たな技術を生み出すヒント合原らの前立腺がん細胞の動態モデリングと間欠的内分泌治療法25)の提案もカオス制御2)の本質を継承し,リミットサイクルを形成させ,がん細胞を増殖させない投薬のタイミング(または閾値)のみを使った制御となっている。その理論と応用の展開に期待が持たれる。一方,メゾスコピック系の反応拡散過程における波動,パターン,乱流的状態の制御12)は空間不均一となる「チューリング不安定系の制御」26)を目指したものである。数理モデルを基礎とした理論展開は,実在のシステムでの実行可能性を具体的に検証するうえで不可欠であり,今後の理論と応用の進展が期待できる。
(4) 新しい物理・数学理論の導出2.3.4でみたように非平衡系におけるボルツマン・ギッブス統計の拡張が行われたばかりでなく,環境揺らぎ,システムの(時間・空間変動の)不均一性の重要性を指摘している点で重要である。物理的な実体を考慮した理論的枠組みと応用の進展が期待される27)。このような非平衡系に対する情報幾何の理論体系の時間変動を入れた一般化を含めた整備が望まれる。
本報では複雑系の数理の可能性に関して言及した。複雑系の統計数理解析とは比較的簡単な本質をついたモデル化,あるいは,統計学的な能動的なモデル化によって,複雑なシステムの動態を定量的に把握,予測,制御する作業である。
複雑な構造を持つシステムを簡略化し,簡単な確率微分方程式に帰着できると,多様な環境変動(パラメーターの時間変動,空間的不均一性など)がモデルに取り込まれ,複雑系に普遍的なべき乗則やべき型確率分布が現れる原因が説明でき,予測や制御の問題にも対処しやすくなる。心室細動時の特異点の生成死滅過程のモデリングと時系列データのみからのパラメーター推定もこの方法で成功している28)。図2は心臓に(a)心筋梗塞(頻脈),(b)心室細動が発生しているときの2次元心筋モデルの不安定状態を数値的に定量化して色を付けたなど高線イメージを示す。ひものような構造が形状を変化させて動き回るのが観察されるが,不安定性が高い色の薄い部分と,不安定性が低い色の濃い部分が複雑な構造を形成している。この状態(b)に対応する「欠陥数」を記述する確率方程式モデルは「時系列データ」のみから推定可能である。このモデルは片側に裾の厚い分布を与え,モデル中の線形係数がランダムな変動をする型になる。将来,非侵襲的に高速で「欠陥」を検出する磁気的方法が開発されるようになれば,このような欠陥の検出は心臓疾患の診断に役立つと考えられる。
上記のような方程式モデルに帰着できない場合でも「赤池流」のベイズアプローチで柔軟な法則や知識の獲得が可能であり,機械学習の手法29),30)を使ったアプローチで解決可能な現実問題31)は数多く存在する。複雑系モデリングの個別の研究成果を詳しく知りたい方はFIRST合原最先端数理モデルプロジェクト(http://www.sat.t.u-tokyo.ac.jp/first/publications)や統計数理研究所データ同化研究開発センター(http://daweb.ism.ac.jp/contents/publications)などのホームページに掲載されている文献を参照することをお勧めしたい。
モデルとは認識装置であり,数理科学や数理工学はそれらを使うときの思想・哲学と使い方を教える。成功の鍵はモデル作成の思想・哲学と,現実との対応で使い方を見極められる広い視野と洞察力であろう。