保全生態学研究
Online ISSN : 2424-1431
Print ISSN : 1342-4327
情報理論からみた生態学的時系列の因果性: Granger因果、CCMからその先へ
鈴木 健大
著者情報
ジャーナル オープンアクセス HTML 早期公開

論文ID: 2309

詳細
Abstract

要旨:生態系の研究では、ランダム化比較実験や、大規模なコンピュータシミュレーションなど、他分野で因果関係の解明に使われている手法が利用できないか、有効でない場合がある。一方で、生態系モニタリングにおいては、センサーネットワークによる経時的な自動観測、衛星リモートセンシング、ドローンによる環境の走査等を通して、大規模データの利用可能性が飛躍的に向上しつつある。さらに、次世代シーケンシング技術による生物群集の網羅的観測技術の発展を通して、微生物実験系が複雑な生態学的ダイナミクスの重要な研究手段となりつつある。こうしたデータ取得技術の日進月歩の向上ととともに、因果関係をデータ駆動的に解明できる手法に寄せられる期待が高まっている。2012年にGeorge Sugiharaらによって提案されたCCM(convergent cross mapping)は、生態学者が時系列による因果推定に注目するきっかけとなった。CCMは1990年代に発展したカオス時系列の研究(非線形時系列解析)を背景としている。一方で、Granger因果や情報理論によるアプローチも、動的システムの因果推定の重要な手法として発展しており、神経科学や経済学などでは早くから利用されてきた。このように、時系列の因果推定は広範な分野を背景としており、それぞれの手法を使い分けるには、その長所と短所を正しく理解する必要がある。本稿では、情報理論によって統一的な観点を導入することで、生態学的ダイナミクスを対象にしたとき、Granger因果は各要素で生じた時間局所的な情報の不均衡を、CCMはアトラクタという大局的な時間構造における情報の不均衡を扱うことを見る。このような統一的な観点から、二つの異なるアプローチの間の技術的な相補性が認識されると同時に、生態学的ダイナミクスの研究にとって因果の多面性という新しい課題が現れてくる。生態系における因果性の解明は、学問領域の垣根を超える広い視点から新しいアプローチを生み出し、現実世界の複雑さに向き合うことによって進展していくのではないだろうか。

Translated Abstract

Abstract: In ecological studies, methods used in other fields to elucidate causal relationships, such as randomized controlled experiments and large-scale computer simulations, may not be feasible or effective. However, the availability of large-scale data generated in ecosystem monitoring is dramatically increasing. Accompanying this recent trend are growing expectations for the development of methods to elucidate causal relationships in a data-driven manner. CCM, proposed by George Sugihara et al. in 2012, has led ecologists to focus on causal estimation by time series. On the other hand, Granger causality and information theoretic approaches have also developed as important methods for dealing with causality in dynamical systems. Time series based causal analysis is based on a wide range of fields, and it is necessary to properly understand the advantages and disadvantages of each method in order to use them appropriately. In this paper, we propose that by introducing a unified perspective through information theory, Granger causality deals with momentary information imbalances, whereas CCM deals with those in the larger temporal structures represented by attractors. From this perspective, technical complementarity is recognized, while a new challenge of the multifaceted nature of causality emerges for the study of ecological dynamics. Thus, the elucidation of causality in ecological systems will progress by developing new approaches from a broad perspective that transcends domain boundaries and confronts real-world complexity.

はじめに

 因果関係の解明は科学全体にとって重要な課題である。再現性のある介入実験はそのための重要な手段である(Pearl 2009)が、生態系のような多要素を含む複雑な動的システムの研究においては、物理的に実施困難であったり、倫理的な問題のために実現できない場合がある。したがって、医学や社会科学の分野で標準的なアプローチであるランダム化比較実験を、マクロスケールの生態系に対して実施することは多くの場合難しい。異なる分野に目を向けると、地球科学ではコンピュータシミュレーションが主な代替手段になっている(Hausfather et al. 2022)。しかし、大規模シミュレーションは時間と費用の両面で高コストである反面、生態系のように多要素のシステムを扱うためにはモデルにかなり強い仮定や制約を置く必要がある。このため、生態系に対するそのようなアプローチの有効性は未知数である。一方で、生態系モニタリングにおいては、センサーネットワークによる経時的な自動観測、衛星リモートセンシング、ドローン等による環境の走査等を通して大規模な時系列データの利用可能性が飛躍的に向上しつつある他、次世代シーケンシング技術による生物群集の網羅的観測も期待される(Besson et al. 2022)。また、次世代シーケンシング技術は、微生物実験系を複雑な生態学的ダイナミクスの重要な研究手段としつつある(Fujita et al. 2022, 2023a, b)。こうした近年の生態学研究の動向のなかで、新しいデータ解析手法がこれまでにない知見をもたらしており(Chang et al. 2020, 2022, Rogers et al. 2020)、データ取得技術の向上を背景に、時系列を因果推定に利用するデータ駆動手法(Runge et al. 2019a)の発展に期待が寄せられている。

 2012年にGeorge Sugiharaらによって提案されたCCM(convergent cross mapping)(Sugihara et al. 2012)は、生態学者が時系列による因果性の推定に注目するきっかけとなった。CCMは1990年代前半に発展したカオス時系列の研究(非線形時系列解析)(合原ほか2000, Kantz and Scireiber 2004)の流れを汲む。一方で、Granger因果(Granger 1969)や情報理論に基づいた時系列解析も、動的システムの因果検出の手法として発展してきている(Kantz and Scireiber 2004)。特に、2000年に発表された移動エントロピー(transfer entropy)(Schreiber 2000)は神経科学や経済学など長い時系列が比較的容易に入手できる分野では早くから利用されており、多くの研究者がその技術的な発展に関わることで利用可能性が高められてきた。

 これらのアプローチは、物理学に連なる数理生物学や複雑系・非線形科学と関連が深く、対象とする系の背後に微分方程式や差分方程式で記述される決定論的力学系を想定する。これは、同じく因果性を扱うが、あくまで確率的プロセスに立脚する統計的因果推論(Pearl 2009)とは異なる自然観に基づくアプローチといえるだろう。2019年にJacob Rungeらによって発表されたPCMCI(Runge et al. 2019b)は、統計的因果推論に基づくアルゴリズム(PCアルゴリズム)によって、各時点の条件付き独立性(MCI; momentary conditional independence)を表すグラフ構造の推定を行う手法である。PCMCIは多変量時系列を離散的なノードとリンクからなるグラフ(時系列グラフ)と見なし、その上で因果関係(因果グラフ)を表現する。このグラフでは、ノードはそれぞれの変数の異なる時間での状態であり、リンクはそれらの状態の間で影響が伝わる方向を表す。時系列について異なる立場をとる2つのアプローチの比較は興味深いが、より広い背景の解説が必要になるため、本稿は前者の物理学的なアプローチを中心に見ていくことにするが、その前に、これらと異なるアプローチに少し言及しておきたい。主にに疫学分野ではHillの基準(Bradford Hill criteria; Hill 1965)と呼ばれる9つの項目が因果性の判定基準として利用されてきた。しかし、近年はこれらの項目を因果性の判定基準として扱うことの問題も指摘されている(Rothman et al. 2005, Kleinberg and Hripcsak 2011)。特に、定量性に関する項目(「強固性」、「時間性」、「一貫性」、「特異性」、「量的反応関係」)には、より現代的な視点(例えばRunge et al. 2018)が必要と考えられる。一方、生物学的なもっともらしさに関する項目(「生物学的説得性」、「現時点の知識との整合性」、「類似性」、「実験的証拠」)は、因果関係が発見法的に得られるデータ駆動手法にとって、結果に関する重要な検討項目と考えられる。

 以降では、まず情報理論の基礎事項を一通り紹介する。Claude Shannonが導入したシャノンエントロピー(情報エントロピー)(Shannon 1948)を中心とする情報理論は、「わからなさ」、「情報」、「予測」などの日常的な概念の定量的な扱いを可能にする。これは、Granger因果、移動エントロピー、CCMといった異なる手法を理解するための共通の基盤となる。次に、Granger因果を取り上げ、情報理論とのつながりや運用上の注意点を整理する。特に、Granger因果の定義そのものから起因する問題と、その実装に起因する問題の区別を強調したい。続いてCCMを取り上げる。CCMについては既に整理された良い解説(中山ほか2015)があるため、煩雑になりがちな数式による定義は行わず、その導入の動機、手法の直観的な意味について述べる。CCMは決定論的な力学系の分離不可能性を扱うために、Granger因果性とは異なる観点から因果性を捉えていることを明確にしたい。また、ここでも運用上の注意点を整理する。これらの後、「情報の不均衡」という概念を導入しGranger因果とCCMの共通点と相違点を整理し、分離不可能性について再検討を行う。最後に全体を総括し、紹介しきれなかったGranger因果性とCCMについて最近の発展を手短に紹介する。全体を通じ、本稿ではGranger因果とCCMについて情報理論という統一的な視点から概観することで、両者を生態系における因果性の解明に相補的に活用していく道筋の一端を示したい。

情報理論

 情報理論、特にシャノンエントロピーを中心とした情報の尺度はGranger因果やCCMを理解するための共通概念となる。そこでまずは、情報理論について移動エントロピーの導入までを目標に基礎事項を一通り説明しておきたい。以下では大文字のアルファベット ( X , Y , Z ) を離散的な確率変数とし、小文字 ( x , y , z ) をその特定の値とする。確率変数が取る値は、 χ で与えられる とする。例えば χ = { 0 , 1 } は0か1がとりうる値であることを意味する。確率変数が取る値を区別する必要があるときは χ X χ Y などと添字で示す。 X がある特定の状態 x を取る確率は P r ( X = x ) と書くことにする。 X , Y がそれぞれ同時に特定の状態 x , y を取る確率、すなわち同時確率は P r ( X = x , Y = y ) と書く。また、 P r ( X = x | Y = y ) Y y の時 X x となる確率で、条件付き確率と呼ばれる。それぞれ、より単純な記法として P r ( x ) P r ( x , y ) P r ( x | y ) を同じ意味で使うこととする。

シャノンエントロピー(情報エントロピー)

 確率性を含む現象にはある種のわからなさ(uncertainty)が含まれている。このわからなさを定量的に測る尺度がシャノンエントロピーである。このことを簡単な例を使って解説してみたい。

 ある池である年の夏にアオコが発生するかどうかについて「発生あり」か「発生なし」という2つの状態だけを考える。ある年の発生は前年にアオコが発生したかどうかとは無関係(独立)で、完全にランダムに決まるとする。A池では発生が1/2の確率で起こる。このことを確率分布を使って表現すると { P r ( = ) = 0.5 , P r ( = ) = 0.5 } なる。B池では、発生が4/5の確率でおき、残り1/5の年で発生しない。これは、 { P r ( = ) = 0.8 , P r ( = ) = 0.2 } となる。

 上記2つの池でアオコが発生するかどうかについて、わからなさは同じではない。常に発生ありと想定するとB池では5年に1回しか外れないが、A池では2年に1回は外れる。この「わからなさ」をシャノンエントロピーにより数値化することができる。ある確率変数 X についてシャノンエントロピーは,

H ( X ) = x χ Pr ( x ) log 2 P r ( x ) . (1)

となる(情報の尺度としては log の底は2とするのが一般的であるため、以下では省略する)。具体的には、 χ = { , } で、A池では 2 { 0.5 l o g 0.5 } = 1 、B池では ( 0.8 l o g 0.8 + 0.2 l o g 0.2 ) 0.72 と計算される。 H ( X ) において、 X は何らかの値域を取る変数ではなく一つの確率分布を表している点に注意が必要である。図1はアオコの発生率に対してエントロピーがどのように変わるかを示している。この結果は、発生確率が1/2の場合にわからなさが最大となり、全く発生しないか常に発生する場合に、わからなさが最小になることを表している。ここでは、解説のためにアオコ発生が2つの離散的な状態をとる場合のみ扱ったが、上記の定義はとりうる状態がもっと多い場合や、連続量の場合にも拡張でき、エントロピー H ( X ) は確率変数 X のわからなさについて普遍的な尺度となる。

 エントロピーはしばしば情報量と同一視されるが、このことの理由についても実例を挙げて説明しておきたい。もしアオコ発生を確実に予測できる「アオコ予報」をつくることが出来たら、この予報はA池とB池のどちらで価値があるだろうか?B池ではそもそも5年のうち4年はアオコが発生するので、毎年半々の確率でアオコが発生するA池で正確な予測ができることの方が価値があるを持つと考えられる。これは、A池のアオコ発生のわからなさが1で、B池の同じ値がおよそ0.72であったことと対応する。予測はアオコ発生のわからなさを減らすことができる。その情報量は、最大で元々のわからなさと等しい量になる。A池のほうがわからなさが大きいので、正確な予測はより大きな情報をもたらす。予測とはわからなさを減らすことであり、その価値はそれが持つ情報、つまりどれだけのわからなさを減らすことができるかによって測られる。これが情報理論における予測と情報の意味である。

結合エントロピー

 結合エントロピーは複数の異なる状態を組み合わせた複合的な状態に関するエントロピーであり、以下のように書かれる:

H ( X , Y ) = x χ x y χ y P r ( x , y ) log P r ( x , y ) . (2)

実際の値は先程と同様に、各状態がどのような確率で起こったのかを代入することで求められる。例えば、夏のアオコの発生は、初夏の気温(平均気温)と関係しているかも知れない。単純化のため、気温について高低の2状態だけを考慮することとする。すると、ある年の池の状態はアオコの発生の有無と気温の高低について、全部で4状態を取りうることになる。この場合の、全体的なわからなさは結合エントロピーとして以下のかたちで書かれる。池Aの場合を例にとると、もしアオコ発生が気温から完全に決定まり、 P r ( = , = ) = 0.5 P r ( = , = ) = 0.5 とすると、エントロピーは1でアオコの発生の有無だけを見た場合と変わらない。しかしもし、アオコの発生が気温とは無関係に(互いに独立に)、確率1/2で決まるとするとわからなさは最大となり 4 { 0.25 l o g 0.25 } = 2 となる。これはアオコ発生と気温の高低それぞれのわからなさを足した量になっている。

条件付きエントロピー

 上の例で、初夏の気温がアオコの発生を決めている場合、初夏の気温を知ることでアオコ発生を予測する(わからなさを減らす)ことが出来そうである。実際に、ある変数 Y について知った後の X のわからなさは、条件付きエントロピーで計算することができる。一方の変数が y であった場合に他方が x となる確率は条件付き確率 P r ( x | y ) で表現できるが、これを利用すると、条件付きエントロピーは、

H ( X | Y ) = x χ x y χ y P r ( x , y ) log P r ( x | y ) , (3)

と定義される。初夏の気温からアオコの発生の有無が完全に決まり、 P r ( = | = ) = 1 P r ( = | = ) = 1 となる場合、条件付きエントロピーは0となる。これは、気温を知った場合のアオコ発生のわからなさが無くなることを意味し、気温がアオコの発生の有無を完全に決定することと一致する。この場合、気温はアオコ発生について完全な情報を持っている。一方で、初夏の気温とアオコの発生の有無が完全に独立な場合、条件付きエントロピーは1で、これは気温を観測していない場合のアオコ発生のわからなさと同じである。つまりアオコ発生に関するわからなさは減ることがなく、これは気温とアオコ発生が独立であることと一致する。この場合、気温はアオコ発生について全く情報を持っていない。

相互情報量

 条件付きエントロピーの項で検討したことを考えると、初夏の気温を知ることでアオコ発生のわからなさをどのくらい減らすことができるか、すなわち気温がアオコ発生について持つ情報を知るためには、「アオコ発生のもともとのわからなさ」から「初夏の気温を知ったあとのわからなさ」を引けばよい。つまり、 H ( X ) H ( X | Y ) を求めればよいことが分かる。これは相互情報量と呼ばれ、形式的には以下のように定義される:

M I ( X ; Y ) = H ( X ) H ( X | Y ) = x χ x y χ y P r ( x , y ) log P r ( x , y ) / P r ( x ) P r ( y ) . (4)

相互情報量はあくまで2つの変数がお互いに持つ情報量を表している。このため、相互情報量が大きいというだけでは、気温からアオコ発生に因果的な関係性があると判断することはできない。相互情報量が M I ( X ; Y ) = M I ( Y ; X ) と常に対称になることは、このことを端的に表している。

移動エントロピー

 相互情報量が上記のように因果性の尺度とならないのに対し、時間方向の関係を考慮することで一方から他方への方向性をもった情報の移動(情報の流れ)を数値化するのが移動エントロピーである(図2; Schreiber 2000)。移動エントロピーを自然に定義するために、ここではアオコの状態( X )と気温( Y )は毎月観測されていることとする。さらに、月毎の状態を区別する必要があるので、観測開始から t 月目のアオコと気温の状態を X t = x Y t = y 、また t 月目までの過去 l 点の観測値ベクトルを X ( t ) = x ( l ) Y ( t ) = y ( l ) と表すことにする。

 移動エントロピーは、次の月のアオコの状態( X t )について、アオコの過去( X ( t 1 ) )と気温の過去( Y ( t 1 ) )の両方を知っているときに、アオコの過去だけを知っているときと比べてどのくらい予測が良くなるか(わからなさが減らせるか)として定義される。条件付きエントロピーを利用すると、前者は H ( X t | X ( t 1 ) , Y ( t 1 ) ) 、後者は H ( X t | X ( t 1 ) ) 、となり、このときわからなさの減少量は H ( X t | X ( t 1 ) ) H ( X t | X ( t 1 ) , Y ( t 1 ) ) となる。つまり、移動エントロピーは以下のように定義される:

T E Y X = H ( X t | X ( t 1 ) ) H ( X t | X ( t 1 ) , Y ( t 1 ) ) = x χ x y χ y P r ( x , x ( l ) , y ( l ) ) log P r ( x | x ( l ) ) / P r ( x | x ( l ) , y ( l ) ) . (5)

移動エントロピー T E Y X は、気温( Y )からアオコ発生の有無( X )への情報の流れ(information flow)を表している。 T E Y X は、相互情報量と異なり一般に非対称( T E Y X T E X Y )で、条件付き相互情報量(conditional mutual informatiom)(Vejmelka & Paluš 2008)の特殊な場合に相当する。(上の(5)式の計算は最も単純には X Y が取りうる状態について組み合わせ的に行う必要がある。例えば、 χ x = χ y = { 0 , 1 } で、 x ( l ) y ( l ) について l = 3 の場合、 P r ( x | x ( l ) , y ( l ) ) は、 P r ( 0 | ( 0 , 0 , 0 ) , ( 0 , 0 , 0 ) ) など、全部で 2 7 = 128 通り考慮する必要がある。)

エントロピーの計算方法

 ここまでは、基本的に X Y が離散的な変数であるとして説明を進めてきた。一方で、実際の適用上はこれらが連続量である場合も多い。 X が連続量の場合のエントロピーは、以下のように書くことができる:

H ( X ) = Pr ( x ) log 2 P r ( x ) dx . (6)

この表式において Pr ( x ) は確率密度関数であり、それが事前に分かっている場合を除いて H ( X ) を直接計算することはできない。そこで、連続量を扱うための計算方法をいくつか紹介しておきたい。まず最も単純な方法として、観測量の値域を幾つか領域に分け、それぞれを一つの記号と対応付けて離散化する方法がある(Cover 1999)。しかし、前節の最後で示した計算からも分かるように、この方法は相互情報量や移動エントロピーの中でベクトル(時系列の状態列)を扱う場合、とりわけ、それを多変量に拡張した場合に、生じうる組み合わせを爆発的に増やし計算結果の信頼性を損ねてしまう(Runge et al. 2012)。このような問題に対処するために、Schreiber (2000) は、相関積分(correlation integral)を使う計算方法を推奨した。また、その後の発展では、時系列の大小関係に基づく記号化(Bandt and Pompe 2002; Staniek and Lehnertz 2008)、近傍法(Kraskov et al. 2004)、バイアス補正(Faes et al. 2011)などが提案されている(全体的なレビューとして、Hlaváčková-Schindler (2007)とVejmelka and Palu š (2008)を挙げておく)。また、CCMは相関係数を利用することで、エントロピーに関する計算を回避している。

Granger因果

 Wiener (1956) は時系列の因果性について、「2つの信号が同時に測定されたとき、2つ目の信号の過去の情報を使うことで、2つ目の信号を使わずに予測するよりも、1つ目の信号をよりよく予測できる場合、2つ目の信号から1つ目の信号に因果関係があると呼ぶ。」と記している。Granger (1969) はここから着想を得て、より一般性のある因果性の定義を導いた(Hlaváčková-Schindler 2007)。

Granger因果の基礎

 Granger因果の定義には、ある変数 X Y を含む系 U (Granger (1969) によればこれは宇宙が含む全変数となる)が現れる。そして、変数 Y X に与える因果的な影響は、系 U そのものを利用する場合と、系 U から Y を除いた U Y を利用する場合で予測の良さを比較することで得られる。すなわち X の予測への Y に固有の貢献度を求めていることになる。もちろん、実用上は U を宇宙の全変数とするのは現実的ではないため、考慮する動的システムが含む変数の集合やその部分集合とする必要がある(Eichler 2013; Shojaie and Fox 2022)。以下で述べる未観測共通原因が存在する場合などを考えると、Granger因果は厳密には真の因果関係と区別し、Granger因果性(因果的な結びつきを示唆する関係性)と呼ぶべきである(Eichler 2013; Runge 2018)が、本稿では一般的な慣習にならい基本的にGranger因果で統一する。

Granger因果の実装

 Granger因果の定義を情報理論の概念を使って表してみたい。まず、 U ( t 1 ) による予測の良さとは、 U ( t 1 ) を知ることで減らすことができるわからなさ H ( X t ) H ( X t | U ( t 1 ) ) に相当する。同様に U ( t 1 ) から Y のみ除いた場合は、 H ( X t ) H ( X t | U Y ( t 1 ) ) と書くことにする。すると、 Y について知ることで増える予測の良さはこの2つの差から、

H ( X t | U Y ( t 1 ) ) H ( X t | U ( t 1 ) ) . (7)

である。これが0でない場合に、 Y から X にGranger因果がある( Y GC X )ということができる(GCはGranger Causalityを意味する)。式 (5)と見比べると、この式は U = { X , Y } としたとき移動エントロピーの定義と一致することが分かる。つまり情報理論の概念で表現したGranger因果は、移動エントロピーの一般化と見なすことができる。これがGranger因果と移動エントロピーの情報理論を介した結びつきである。

 Granger因果で、系 U から影響を評価したい変数を除くという一見迂遠な方法が取られる理由について考察しておきたい。気温とアオコ発生の例で見ると、気温からアオコの発生が予測できるからといって、気温がアオコの発生に直接影響していることが示されるわけではない。まず、アオコ発生の直接の要因となっているのは、気温ではなく水温かも知れない(図3a)。または、アオコ発生の直接の要因となっているのは日照量で、気温とアオコは共通に日照量の影響を受けているが、直接は関係していないかもしれない(図3b)。このとき、気温がアオコ発生に直接影響しているかを判定するためには、過去の(アオコ発生、気温、水温、日照量)のデータを使って翌年のアオコ発生を予測する場合に、(アオコ発生、水温、日照量)だけからアオコ発生を予測する場合よりも、よく予測できるかを問う必要が生じてくる。初めの例では、水温は気温に関する情報を持っており、それだけでアオコの予測には十分である。従って、 U から気温を除くことが予測に与える影響はない。次の例でも、日照量がアオコ発生を説明する十分な情報を持っていて、気温から得られる新しい情報はない。従って、やはり U から気温を除くことの予測への影響はない。 U から気温を除くことの影響(気温に固有のアオコ発生予測への貢献)があって初めて、気温からアオコ発生への直接の影響(因果性)がある可能性が示唆される(図3c)。ただし、後述する理由から、これは必ずしも先の2つの可能性を完全に排除するものでは無い。

Ganger因果に関する注意点

 Granger因果の運用上の注意点は、定義そのものに起因する問題、観測に基づく問題、実装に関する問題の3つに整理することができる。以下、それぞれをさらに細かく見ていきたい。これらのうちの多くは、Runge (2018) のなかで、時系列に基づく因果性の推定手法一般の問題として検討されている。

 Granger因果の定義そのものに起因する問題の要因として、分離不可能性と複合性がある。分離不可能性については後の「CCMの基礎」で詳しく述べるが、決定論的力学系(微分方程式や差分方程式で記述される系)では、一つの変数が他の全ての変数の完全な情報を持つことができる。この場合、影響を判定したい変数 X U から除いても他の変数が X の情報を保持しているため、 X の影響を評価することができない。また、もう一つの問題である複合性は、変数 X の予測において Y と交互作用を持つ変数 Z が存在する(例えば大型の魚類がいるかどうかが気温とアオコ発生の関係に影響する)場合に相当する。このような場合、変数 X Z それぞれの Y の予測への貢献度の和に比べ、それらを同時に除いて評価した貢献度が大きくなる可能性がある。変数を一つずつ除く操作だけでは、そうした複合的な影響は評価できない。Williams and Beer (2010)はこのことを詳しく検討している。

 観測に起因する問題として、未観測共通原因と不均一な観測誤差の問題がある。例えば、図3bや3cで日照量がデータに含まれていない場合、日照量が未観測共通原因となる。この場合、気温からアオコ発生への直接の因果関係( GC )という事実と異なる関係が検出される可能性がある。また、例えば測定手法の違いなどを理由に、変数ごとに観測誤差が異なる場合も類似の問題が起こる可能性がある。さらに、図3bや3cで日照量が観測されていてもその観測誤差が大きい場合には同様の問題が生じる可能性があると考えられる。

 実装に関連する問題は、さらに予測の良さの評価手法に関する問題と U の決定方法に関する問題の2つに分かれる。Granger因果の定義は、ある変数を使ってもう一方の変数を予測するという操作を含んでいる。従って、利用する予測手法によって問題が生じる場合がある。Granger自身がその実装にベクトル自己回帰モデル(multivariate vector autoregressive model; MVAR)を利用したため、しばしば非線形性や非定常性の扱いなど、MVARに起因する問題が、Granger因果の定義そのものの問題と混同されることがある。MVARに基づくGranger因果検定は経済学分野などでは古くから使われており(Eichler 2013; Shojaie and Fox 2022)、 データがガウス分布に従う場合にGranger因果が移動エントロピーと等しいことを示す研究もある(Barnett et al. 2009)。しかし、非線形・非定常性が重要な役割を果たす生態学的ダイナミクスに対して、MVARのような線形モデルが不適切であることは明らかである。現在ではより進んだ選択肢があるため、MVARで実装されたGranger因果に関してはこれ以上詳しく触れない。そのような選択肢の一つである移動エントロピー(Schreiber 2000)は、特定のモデルを仮定することなく求められる(ノンパラメトリックな)予測への貢献度を評価しており、非線形・非定常性について問題を生じない。しかし、特に多くの要素からなる系で要素全てを考慮すると、データの要求量や計算コストが大きくなり(Runge et al. 2012)、実質的に移動エントロピーを計算できなくなる。そこで、 U をどのように決定するかが問題となる。例えば、 U の決定方法として、非一様埋め込み(non-uniform embedding)と呼ばれる非線形時系列解析の方法論と漸進的な変数選択を組み合わせた手法(Vlachos and Kugiumtzis 2010; Faes et al. 2011)やグラフィカルモデリングを利用する手法(Runge et al. 2012)が提案されている。ただし、このような方法を利用したとしても、特に多要素の系で正確な値を得るには数百点以上などと、生態学の観測データとしては長い時系列が必要になる可能性がある。

Convergent cross mapping (CCM)

 CCMは2012年にGeorge Sugiharaらによって因果性の検出手法として提案された。その導入にあたってSugihara et al. (2012) は、まず時系列間の相関が因果性の直接の証拠とならないことを挙げ、それに対する既存のアプローチとしてGranger因果とその近年の発展を紹介した。その上で、SugiharaらはGranger因果によって生態学的ダイナミクスを取り扱う上での問題として分離不可能性を挙げ、Granger因果に代わる手法としてCCMを提案した。

CCMの基礎

 微分方程式や差分方程式で記述される決定論的力学系は、個体群動態や生態系のみならず、多様なスケールの生命現象を説明するために利用されてきた(Murray 2002; 金子 2019)。決定論的力学系が示す特徴的な振舞いとしてカオスがある。カオスは決定論的な規則によってランダム性のある振舞いが生じる現象である(図4a)。ここで、それぞれの変数を軸とした空間(相空間)に同時点の各変数の状態をプロットすると、系の状態は時間とともにある幾何学的な構造に収束していく。このとき、状態が時間変化と共に辿る曲線は「軌道」、軌道が収束する幾何学構造は「アトラクタ」と呼ばれる。アトラクタにはカオス(例えば蝶の羽のような構造を持つストレンジアトラクタ; 図4b)のような複雑な構造だけでなく、平衡状態に対応する「点」、周期的な振動に対応する「リミットサイクル」などがあり、系の時間変化の大局的な特徴を表す構造ということができる。

 分離不可能性について説明するために、少し詳しい条件を定めておきたい。系の状態はアトラクタ上の軌道として変化しているとする。式のかたちで定義した場合、変数 Y の動態を記述する式に別の変数 X が現れる場合に X Y は因果関係 X Y で結ばれる。ここで、系に現れるどの変数を選んでも、このような因果関係の矢印を辿って他の全ての変数に到達できるとする。このような条件で、本来のアトラクタの幾何構造が1つの変数だけから再構成できることを保証するのが、Takensの定理(Takens 1980)である。アトラクタの再構成は、一つの変数の時系列から一定間隔開けてn個の点を取得していく遅延埋め込み(delay embedding)を使い、n次元空間のアトラクタを再構成する状態空間再構成法(state space reconstruction)によって行われる(合原ほか2000; Kantz and Scireiber 2004)。このとき上の条件が成り立つなら、Takensの定理から、どの変数も他の変数について完全な情報を持つこと、言い換えれば元のアトラクタや再構成したアトラクタの間に互いの予測を可能とする1対1の対応関係があることが言える。これが分離不可能性である。この性質を、具体例を使ってもう少し詳しく見てみたい。

 3つの変数 x , y , z からなる系のアトラクタについて、その同時点の状態 ( x t , y t , z t ) をデータとして保持することとし、記録した状態点の数を L とする。新しく時刻 T (ターゲット点)の y z だけを観測したとき、同時点の x を類推することを考えてみる(本稿では、過去の状態から将来の状態を推測する場合を予測、ある時点の一部の状態から同時点の他の状態を推測する場合を類推と呼び分ける)。最も単純な方法は、観測された ( y , z ) に対して y , z の距離が近い順にデータベースの点を数個選び、それらの x の平均値を予測値とすることだろう。このような手法はk-近傍法(Hastie et al. 2009)と呼ばれる。この方法が不十分なことはすぐに分かる。アトラクタを y z 平面で見たとき、軌道が重なる部分では同じ(y,z)に互いに離れた x の値が対応するため、 x を一意に決めることができない(図4c)。つまり、この単純な方法では、アトラクタ構造が交差や重なりを持つように潰れてしまうことがあるため、類推がいつも上手くいくとは限らない。状態空間再構成はこのような問題を解決することができる(図4d)。この方法ではアトラクタの幾何構造が復元できるので、重なりが生じず類推は上手くいく。Sugihara et al. (2012) はこのような類推に、k-近傍法でなくシンプレックス投影法(simplex projection)を使っている点を注意しておきたい。これは、k-近傍法と似ているが、単純な平均でなくターゲット点との近さに応じた重みづけをする手法である。

 分離不可能性が成り立つ系で一つの変数から他の変数を復元できることは、一つの変数がその変数が含まれる系の完全な情報を持つことを意味する。Granger因果は系 U から Y を除いたときの影響をもって Y から X への因果を評価していたが、分離不可能性が成り立つのであれば Y が持つ情報は他の変数に含まれている。特に、移動エントロピーを定義する(5)式から、 X 自身の過去が完全な情報を持てば分母と分子が一致し、 T E Y X = 0 になるとことが分かる。これは、 X の予測には X 自身の過去さえあれば良いことを意味する。従って、Granger因果の定義では決定論的力学系の因果性を評価することができない。このことからSugiharaらは、Granger因果に基づく手法が決定論的力学系だけでなく、現実の生態学的ダイナミクスに対しても適切でないと主張し、それに代わる手法としてCCMを提案した。

CCMの実装

 Sugihara et al. (2012) は、変数 X Y について以下が成り立つとき、YからXに因果性がある( Y CCM X )としている:

i. 十分大きい L において、 X の状態空間再構成から類推した Y である Y X Y の相関係数 ρ が0より大きい

ii. L を大きくすると Y X Y の相関係数 ρ は上昇する

上記で、 L は状態空間再構成を行うための時系列点数であり、 Y X X によって類推した Y を指す。また、 X Y はカオスアトラクタの変数であることが要請される。i, iiの統計的な有意性を判断するためにはブートストラップ法を使う方法(Clark et al. 2015)と、時系列を一部の特徴を保ちつつランダム化するサロゲート法で疑似データを生成し比較する方法(Sugihara et al. 2012)がある。こうした判定基準には一定のコンセンサスがあるものの、実装の詳細は論文毎に異なっている。

 CCMでは、上記のように変数 Y の状態を時間毎に類推していく際に、その時点から見て過去と未来の情報が等しく利用される。つまり、類推に利用する変数 X の近傍点は、時間的に近いかどうかに関わらず再構成したアトラクタ上の距離の近さをもとに選ばれる。この意味で、CCMはGranger因果のように局所的(瞬間的)な時間の前後関係から因果性を捉えるのではなく、アトラクタという大局的な構造を基に因果性を捉えていると考えることができる。

 再びアオコの例に戻って、 Y CCM X であることの意味をもう少し詳しく検討したい。ここでは、アオコの原因となる植物プランクトンの毎年の存在量を考慮する。A池とB池の二つがあり、A池からB池に川が流れているとする(図5a)。それぞれの池で毎年の植物プランクトンの存在量( X A , X B )はカオス的な変動を示す(図5b,c)。A池からB池には河川水の流入を通じ一方的な影響がある。ただし、流入の効果はB池のダイナミクスをA池と同期させるほど強くはない。このときB池の状態は、A池の状態を類推するために必要な情報を持っている。これは河川水の流入により、B池の変動が、それ自体の過去だけでなく、A池の過去も反映するからである。言い換えれば、B池のアトラクタはA池の状態も含む複合的なアトラクタとなっている(図5e)。一方で、A池はB池の状態を類推するために必要な情報を持たない。上流にあるA池にはB池の過去の状態が反映されないからである。A池のアトラクタは、それ自体のプロセスのみで決まり、B池のように複合的ではない(図5d)。このように、影響の方向性からアトラクタの包含関係が決まり、ターゲットとする変数の類推された値と実際の値の相関係数の高さ(i)がそれを判定するための基準の一つとなる。A池にとっての系はA池のみを含むが、B池にとってはA池とB池を合わせたものが系となる。分離不可能性の下で、 X A X B はその過去だけから予測できても、 X A から X B X B から X A の類推には非対称性が存在する。

 特に野外の観測で得られる時系列は季節性などの外的な要因から周期性を示す場合がある。すると、A池とB池に直接関係が無くても、共通の影響因子(例えば平均気温の年変動)によって相互の類推の可能性がある程度上手くいくと考えられる。このような状況でも、アトラクタがカオスであるという前提は、 L が大きくなるほど ρ が大きくなること(ii)を保証するので、上記のような包含関係のテストとしてCCMの信頼性を保証する役割を果たしている。また、結果の信頼性を上げるためには次節に述べるサロゲートデータの生成方法を時系列の特徴に合わせて適切に決めることも重要である。

 上で既に情報という言葉を使ったが、ここまでの議論を情報理論の言葉に置き換える最も単純な考え方は、相関係数 ρ を相互情報量に置き換えることである。例えば、変数 Y を使って予測した X X Y と書くことにすると、 M I ( X A ; X A X B ) X B X A について、 M I ( X B ; X B X A ) X A X B についてどれだけ情報を持つかを表しており、 MI ( X A ; X A X B ) MI ( X B ; X B X A ) であることによって因果の非対称性が表現される。つまり、CCMもまたある変数が他の変数について持つ情報によって因果性を評価していることになる。ただし、この場合の因果性は、それぞれの変数が暗に含んでいる(状態空間再構成によって復元される)アトラクタ構造をもとに判断される。これは、CCMの提案以前から研究されてきた、埋め込みを相互情報量や移動エントロピーの計算に利用する方法(Vlachos and Kugiumtzis 2010; Faes et al. 2011)とも関連が深い考え方である。また、Granger因果や移動エントロピーでは Y X の因果は Y X の予測に貢献することで確認されたが、CCMでは X Y の情報を持つことから確認されるという点にも注意が必要である。最近、この観点から、CCMを情報理論の概念で定義し、拡張する方向性がOsada et al. (2023)によって示された。この論文は、 Y CCM X であることと、以下の式:

P r ( y t p , x t , 𝐱 t ( E , τ ) ) log P r ( y t p | x t , 𝐱 t ( E , τ ) ) / P r ( y t p ) , (8)

に従う相互情報量が0でないことの対応関係を示し、上式を拡張した、

P r ( y t p , x t , 𝐱 t ( E , τ ) ) log P r ( y t p | x t , 𝐱 t ( E , τ ) ) / P r ( y t p | 𝐱 t ( E , τ ) ) , (9)

から得られる情報量をUIC(unified information theoretic causality)と定義した。

さらに、この式をベイズ則 Pr ( y t p | x t , 𝐱 t ( E , τ ) ) = Pr ( x t | y t p , 𝐱 t ( E , τ ) ) Pr ( y t p | 𝐱 t ( E , τ ) ) / Pr ( x t | 𝐱 t ( E , τ ) ) により変形すると、移動エントロピーの形式と等しくなることが示される。これは、移動エントロピー(Granger因果)とCCMを情報理論によって結びつける重要な結果である。

CCMに関する注意点

 CCMについて運用上の注意点を2つ挙げておきたい。一つ目として、原理上、再構成したアトラクタが持つ情報は因果性の矢印を遡る方向に包含的である。例えば、池がA, B, Cの3つあり、上流から下流にA, B, Cと繋がっているとする。このとき、A、B、Cの再構成アトラクタはそれぞれAのみ、AとB、AとBとCの情報を持つことになる。従って、A→B→Cという関係では、Cの再構成アトラクタはAの情報も持つため、A→Cの因果性を排除できない。このことはSugihara et al. (2012) でも触れられているが、もっと多数の要素からなる系では注意が必要である。上記を一般化すると、あるアトラクタ(変数)は、因果の矢印を遡る方向の全てのアトラクタ(変数)の情報を持つことになる(Pecora 1995, Cummins et al. 2015)。従って、ある2変数が実験系などの外部から独立した環境にあるわけでない限り、 X CCM Y であることは、 X から Y に直接的な関係があることの証拠にはならない。このような問題に対応するために、Ye et al. (2015) は一定の幅で類推元と類推先の変数の時間をずらしながらCCMを使うことで、因果性が直接的か間接的かを区別する方法を提案した。また、Leng et al. (2020) はもっと直接的に、偏相関の計算式を利用して、因果性が直接的か間接的かを区別できるPCM(Partial Cross Mapping)を提案している。

 もう一つの問題は、CCMの実装方法に関係している。あるデータにCCMを適用する際には、状態空間再構成をする際の変数ごとの埋め込み次元( ε )の決定方法、有意性の判定方法、 L に対する相関係数の上昇の判定方法などに選択の余地がある。CCMの計算では、多くの場合1ステップ先予測で埋め込み次元が決められているが、非線形時系列解析では擬近傍法(false neighbour method)(Kennel et al. 1992; Cao et al. 1997; 合原ほか2000)が使われることが多く、実際これをCCMに利用した論文もある(Mønster et al. 2017; Ye et al. 2019)。有意性の判定方法については、選択肢としてブートストラップ法かサロゲート法があることは既に述べたとおりだが、サロゲート法としては、時系列のパワースペクトルを保つ方法(Ebisuzaki 1997; Sugihara et al. 2012)、アトラクタ構造を保つ方法(Thiel et al. 2006; Ushio et al. 2018)、季節性を保つ方法(Deyle et al. 2016; Matsuzaki et al. 2018)などが使われている。また、 L に伴う相関係数の上昇の判定には相関係数が使われる場合(Chang et al. 2020)と、2つの分布の平均値の差の検定が利用される場合がある(Clark et al. 2015)(ただし、Osada et al. (2023) が提案したUICでは上昇の判定は必要ない)。これらに加えて、時系列のサンプリング間隔( τ )は、通常、データ量に制限があることから観測された時間間隔のまま利用されるが、厳密には自己相関が無くなるように再サンプリングする必要がある(合原ほか2000; Kantz and Scireiber 2004; Sugihara et al. 2012)。CCMの結果は、しばしばこうした実装の詳細に対して安定ではない。また、類推を行うための手法としてSugihara et al. (2012) がシンプレックス投影法を利用したことから、その後の研究もそれに準じているが、これも選択肢の一つに過ぎない。例えば、Ma et al. (2014) が提案したCMS(cross map smoothness)は動径基底関数ネットワーク(radial basis function network)を用いるアプローチである。非線形時系列解析では、ダイナミクスに応じて予測に適した手法が異なることが指摘されており(Judd and Mees 1995; 合原ほか 2000)、実際、CCMを結合ロジスティックマップに適用した際にも、パラメータ空間の中でダイナミクスが不連続に変化するために、一部のパラメータ領域で上手く機能しないことが指摘されている(Mønster et al. 2017)。これは必ずしもCCMに限った問題ではないが、実装方法に対して結果が不安定なことは、解釈に都合のよい結果になる実装方法が選択される余地を残してしまう。また、共通の解析パッケージを利用することなどで実装方法を統一したとしても、その安定性が評価されないままでは、結果の信頼性は十分保証されているとはいえないだろう。CCMはGranger因果に比べれば歴史が浅いため、こうした実装面の研究が十分進んでいない点に注意が必要と思われる。この点では、上で挙げた非線形予測手法の選択(Judd and Mees 1995)だけでなく、相互情報量の計算手法(Kraskov et al. 2004)や、埋め込みに利用する変数の選択(Vlachos and Kugiumtzis 2010; Faes et al. 2011; Runge et al. 2012)など、Granger因果/移動エントロピーの文脈で蓄積されてきた知見が、CCMの拡張に貢献する部分も多くあるように思われる。

Granger因果とCCM

これまで、Granger因果とCCMの概要を確認してきた。以下では、「情報の不均衡」という視点から両者を比較することで、その共通点と相違点を整理したい。

情報の不均衡

 情報の不均衡について説明するために、身近な例を挙げてみたい。「かくれんぼ」は誰もが経験のある遊びかと思う。鬼以外の参加者はそれぞれ見つかりにくいと思う場所に隠れ、鬼はその場所を知らない。鬼はわからなさを一手に引き受け、動き回って探索し、他の参加者を見つけることでそのわからなさを無くしていく。つまり、かくれんぼは鬼と他の参加者の間で情報の偏り、不均衡を作り出し、それを無くしていくことが遊びになっている。また、私たちが日常行っている会話も、お互いに持っているわからなさを均すために行っているとみなせる場合が多いのではないだろうか。

 Granger因果もCCMも変数の間にある情報の偏り、情報の不均衡を扱っていると捉えることができる。ただし、それが時間について局所的な偏りか、大局的な偏りかかという点で両者は異なっている。Granger因果は、各時点で変数が持つ情報に不均衡があり、それが変数間の相互作用を通して情報の流れとして移動することを利用する。 Y GC X は、少なくとも観測データ内で変数 Y から X に直接の相互作用が存在することを示唆する。一方で、決定論的力学系では、分離不可能性のためこのような情報の不均衡は存在しない。そこで、CCMは、アトラクタの構造という大局的な時間構造における情報の不均衡を利用する。変数 Y から X に一方向に影響がある場合、 Y のアトラクタ( Y の遅延埋め込みによって再構成したアトラクタ)は X の情報を持たない。一方で、 X のアトラクタは Y X の影響を通して Y のアトラクタの情報を持ちうる。このような情報の不均衡があるため、 X から Y の類推は上手くいくが、 Y から X の類推は上手くいかず、このことを通して因果の方向性が確認される。ただし、ある変数によって再構成したアトラクタはその変数に対して因果関係の矢印を遡る方向にある全ての変数の情報を持ちうるため、 Y CCM X であることは、観測データ内でも、 Y から X に直接の影響(例えば生物間相互作用)があることを意味しない。

情報の不均衡と分離不可能性

 CCMについては特に決定論的力学系という、理想化された状況でその導入が行われている。一方で、現実の生態学的時系列が決定論的力学系で記述されるような非線形ダイナミクスを反映することは否定しがたい(Turchin and Taylor 1992; Clark and Luis 2020; Rogers et al. 2022, 2023)ものの、それは力学系の解そのものではない。

 「CCMの基礎」で説明したように、分離不可能性は、一つの変数がその変数を含む系について完全な情報を持つために生じる。このため、変数が持つ情報が不完全な場合には、この前提条件は成立しないと考えられる。以下では、Pennekamp et al. (2019) による生態学的時系列の研究を手掛かりに、現実の生態学的ダイナミクスで分離不可能性が成立しないと考えられる理由を検討したい。

 Pennekampらは、生態学的時系列の「冗長な情報(redundant information)」と「新規情報(new information)」の区別に着目した。冗長な情報は時系列の過去が現在の状態について持つ情報であり、新規情報とはそれぞれの変数で新しく生み出される情報である。決定論的力学系が冗長な情報を持つことは、その観測データによって予測や類推ができることから確認できる。一方で、新規情報は、例えばデモグラフィックな確率性や、生物が依存する微小環境の揺らぎによって生じると考えられる。新規情報だけからなる時系列は、サイコロ投げのように完全に確率的で予測可能性を持たない。現実の生態学的時系列は、冗長な情報と新規情報が混ざったものになると考えられる。このことから生態学的な時系列では以下のことが推察される。新規情報は個々の構成要素(ここでは種としておく)の単位で独立に生成され、それが生じた段階では種に固有のものである。したがって、それぞれの種が互いに持つ情報に不均衡が生じる。その後、そのような情報の不均衡は生物間の相互作用を通して他種に伝わりながら、冗長な情報として均一化されていく。しかし、新規情報は常に生成され続けるため、情報の生成とその均一化がある種の平衡状態としてバランスし、分離不可能性が少なくとも完全には成り立たない状況が維持される。このことが相互作用ネットワーク上で情報の流れを保つため、Granger因果はその検出に利用できるだろう。したがって、Sugihara et al. (2012) の指摘に反し、現実の生態系ダイナミクスの時系列解析では、Granger因果に基づく手法も十分に有効といえるのではないだろうか。

おわりに

 Granger因果とCCMは、それぞれ、各時点で変数が持つ情報の不完全さに起因する時間局所的な情報の不均衡と、時間変化の大局的な特徴をあらわすアトラクタ構造についての情報の不均衡という異なる観点で動的システムの因果性を分解すると考えることができる。一般的に、生態学的ダイナミクスは決定論的な性質と確率性を異なるバランスで含むと考えられる(Higgins et al. 1997; Bjørnstad and Grenfell 2001)。このことを前節の考察と併せると、因果の多面性を実際に両方のアプローチから探っていくことは、生態系ダイナミクスの研究にとって一つの新しい課題と言えるだろう。この問題提起は、Granger因果とCCMを統一的な観点から捉えることで得られた恩恵である。また、より技術的な側面として、これまでGranger因果/移動エントロピーの研究で提案された手法がCCMに貢献する可能性が示される一方、Osada et al. (2023) のようにCCMの側から移動エントロピーの計算方法に新たな視点をもたらす仕事も現れている。このような技術的な相補性の認識も、共通の基盤で捉えることの恩恵と言える。このように、生態系における因果性の解明は、学問領域の垣根を超える広い視点から新しいアプローチを生み出し、現実世界の複雑さに向き合うことによって進展していくのではないだろうか。

 本稿の内容に連なる近年の発展に少しだけ触れておきたい。移動エントロピー(Schreiber 2000; Runge et al. 2012)と同様にGranger因果を非線形・非定常性なダイナミクスに適用できる枠組みとして、ニューラルネットワークの予測を利用する手法が現れている(Huang et al. 2020; Duggento 2021; Tank 2021; Suzuki et al. 2022; Wang and Fu 2022)。その中でもEcohNet(Suzuki et al. 2022)は再帰的ニューラルネットワーク(recurrent neural network)の1種であるエコーステートネットワークを利用し、時系列の予測可能性を各変数の貢献度に分解する手法であり、既存の手法と比べダイナミクスの違いに対して性能がロバストである可能性が示されている。CCMについては、本文で紹介した時間遅れ(Ye et al. 2015)や偏相関の計算式(Leng et al. 2020)を利用して直接の関係を検出する手法だけでなく、もうひとつの非線形時系列手法であるS-mapと組み合わせてスパース化し、直接の生物間相互作用と対応付ける試みがなされている(Cenci et al. 2019; Chang et al. 2021)。ただし、S-mapを生物間相互作用の検出に利用する際に、必ずしも事前にCCMを適用する必要はないかもしれない(Suzuki et al. 2017)。

 時系列データ分析の発展につれ、本稿で紹介した、決定論的力学系に重きをおく物理学的な時系列観と、確率性に重きをおく統計学、確率的時系列解析の対象は接近し、その境界はあいまいになりつつある。本稿は、主に前者に主眼を置いたが、広範な分野にまたがる時系列の因果性へのアプローチを理解するための一助となれば幸いである。

謝 辞

初めに、本稿を査読していただいた匿名のお二方に感謝を申し上げます。本稿は、2022年2月に行われた第21回つくばE3セミナー「『それってあなたの感想ですよね?』にならないための因果推論フェス in 生態学」での講演を元に作成しました。同セミナーを主催された、竹下和貴博士、中西康介博士、林岳彦博士、横溝裕行博士に厚く感謝の意を表します。また本稿の一部は、杉山将博士、松本裕治博士、城石俊彦博士、桝屋啓志博士との議論に基づいており、桝屋博士からはその後、本稿について詳しいコメントを頂きました。貴重なご意見とコメントに、この場を借りてお礼を申し上げます。

図1

. アオコ発生率(アオコ発生ありとなる確率)を0から1まで変化させたときのシャノンエントロピー. 0.5で最大値1となる。

図2

移動エントロピーの概念図. 点線で示したYの過去(Y(t-1))がXtの予測に及ぼす影響(破線)を、条件付きエントロピーを利用して計算する 。

図3

物理的要因とアオコ発生の関係性。 (a) 気温が水温を介してアオコ発生に影響する場合。 (b) 気温とアオコ発生は 日照量に影響されるが直接関係しない。 (c) 気温からアオコ発生に直接影響がある場合(破線)のみ、気温を除くことがアオコ発生の予測に影響する。

図4

アトラクタの一例(ローレンツアトラクタ)と状態空間再構成。(a) x,y,zの時間変化。(b) アトラクタ(黒)とアトラクタに収束する軌道(赤)。(c) yz平面でみたローレンツアトラクタ。xの値の正(黄)、負(青)で色分けをした。y軸0付近の一部でxの正負が重複しており、k最近傍法によるxの類推が上手くいかないことが分かる。(d) yを100点おきに3点サンプリングすることで再構成されたアトラクタ。点の色はxの値の正(黄)、負(青)を示すが、アトラクタ上でその領域がきれいに分かれていることから、全体的に類推が上手くいくことが分かる。

図5

因果の方向とアトラクタの包含関係。(a)A池からB池への一方的な影響伝播を仮定する。(b)A池のダイナミクス。(c)B池のダイナミクス。(d)A池のアトラクタ。 X A の前後する状態 ( X At , X A t + 1 ) を2次元平面にプロットすると、アトラクタが曲線上に拘束されていることが分かる。B池の状態 X B との対応関係を示すため、時刻tの状態 X At を0.2毎に分けて異なる色でプロットした。(e)B池のアトラクタ。点の色は同時点のA池の状態がどの領域にあるかに従っており、B池の状態 ( X Bt , X B t + 1 ) とA池の状態 ( X At , X A t + 1 ) の対応関係を示している。それぞれの領域が X Bt 方向で0-1の範囲に広がっていることが分かる。色分けする領域をどれだけ細かくしても、各領域は X Bt 方向の同じ範囲に広がっている。このとき、 X B のアトラクタの X B t + 1 の方向の厚みが X A X At 方向の位置を表すという対応関係があるため、任意のtについて点 ( X Bt , X B t + 1 ) の位置から点 ( X At , X A t + 1 ) の位置を特定することができる。一方で、 X A でどれだけ領域を狭くとっても、それは X A のアトラクタ全体に広がっている( X A で近くにある2点が X B で近いとは限らない)ため、A池の状態 ( X At , X A t + 1 ) からB池の状態 ( X Bt , X B t + 1 ) を特定することはできない。すなわち、状態の類推はB池からA池の方向にのみ可能である。

References
 
© 著者

この記事はクリエイティブ・コモンズ [表示 4.0 国際]ライセンスの下に提供されています。
https://creativecommons.org/licenses/by/4.0/deed.ja
feedback
Top