2023 年 63 巻 6 号 p. 325-329
大腸菌の走化性応答はこれまで定量的実験により詳細に特徴づけられてきたが,応答が示す確率性や非線形性からその適応的意義を理論的に調べることに困難があった.部分観測最適制御理論を活用することで,大腸菌の走化性応答の最適性を検証し,その適応的意味を示した理論を紹介する.

生物は時々刻々と変化する環境の状態を感知し,感知情報に基づいて応答を制御することで,環境の変化に適応的に応答する.多くの生き物でその適応応答の振る舞いは極めて巧妙で,進化の過程を経て何らかの意味で最適化されていることを示唆する.しかしそのことを検証するには,最適な適応的システムが持つべき性質や振る舞いを明らかにし,実際の現象と定性的・定量的に比較する必要がある.これまでに神経科学や生物物理学の分野で,最適な感知や運動制御をベイズ推定理論や最適制御理論などを用いて導き,実際の生物の振る舞いと比較することで適応性の議論がなされてきた1),2).
実際の生物の中で推定や制御を実現する化学反応や細胞ダイナミクスは高い非線形性を示し,それを最適理論の枠組みで扱うことは容易でない.そのためこれまでの多くの研究は,説明する現象を非線形性が無視できる線形応答領域に絞ることで理論を適用してきた.入力が弱く感知・制御系が大きく変化しない範囲では,応答が入力の強さに比例する線形応答が仮定できる.しかし応答の性質が分子機構も踏まえて詳細に整理されているにも関わらず,線形応答を大きく超えた理論がない故に適応性の議論が行き届かない系があった.本稿で扱う大腸菌の走化性はその一例である.
大腸菌の走化性を担うシグナル伝達系は,早くから工学・物理学的な発想を取り入れた定量的な研究が進められてきた.1980年代にはすでに,弱い入力に対する応答が系統的に測定され,その領域の振る舞いは線形応答で説明できることが確認されている3).2000年代には,大腸菌の示す線形応答領域の性質が推定・制御の観点から見て適応的なものであるのか,線形応答の理論に基づき議論された4)-6).非線形応答まで含めた性質についても,遺伝子欠損株を用いた定量測定と物理化学的な理論を組み合わせた特徴づけが進められ,2010年頃までに分子機構を踏まえた生物物理モデルに整理されている7).しかし非線形応答の領域に見られる性質がどのような適応的意義を持つのかについては定まった見解がなく,特に最適な推定・制御の観点から説明することは未解決問題として残されていた.この課題を克服したのが本稿で紹介する著者らの研究である8),9).
著者らは線形応答に限らない応答の最適化を扱いうる理論を開発し,最適な推定・制御則が大腸菌走化性の分子機構を踏まえた数理モデルと対応して非線形応答まで含めて説明できることを示した.また我々は推定と制御の最適性を包括的に扱う部分観測確率制御の理論10)を用いることで,大腸菌は自ら下した制御が走化性運動に与える影響を織り込んだ上で最適な推定をしている可能性を見出した.本稿では未だ生物学への応用に乏しい部分観測確率制御の理論が,非線形応答を示す大腸菌走化性にどう適用されて何を明らかにしたのかを解説する.2節で大腸菌走化性の概要を説明した上で,3・4節では部分観測確率制御の理論で扱えるように定式化する過程を説明する.5節では部分観測確率制御の理論から帰結する内容を説明し,6節では実際の大腸菌と比較して明らかになったことを解説する.
大腸菌はべん毛の回転方向を切り替えることで,直進するrun状態とランダムに方向転換するtumble状態をとる.両者を組み合わせた運動パターンはrun-and-tumble運動と呼ばれ,tumbleの起こる頻度(tumbleレート)を受容体で感知するリガンド濃度の時間変化に基づいて制御することで走化性を実現している.濃度が増大するのはリガンド勾配を上っているときなので,tumbleレートを下げれば上り続けることが期待される.逆に濃度が減少するのは勾配を下っているときなので,tumbleレートを上げればさらに下るのを防ぐことが期待される.濃度の時間変化の正負に応じた制御が走性を実現する肝になるが,正負の判定はリガンド感知に伴う確率性のために容易でない.濃度勾配を上っているのにリガンドとレセプタの結合回数が減少するというような,相反する観測が確率的に得られる.感知の確率性のもとで,濃度の時間変化の正負をどうすれば良く推定できるのか,また推定の不確実性を加味してtumbleレートをどう制御すれば良いのか,という問題を生物自身が解く必要がある.
最適な感知・制御の問題を理論的に扱う第一歩は,推定・制御問題を定式化する一般的な枠組みである状態空間モデルに落とし込むことである.状態空間モデルでは,推定・制御したいが直接は観測できない状態変数の時間発展と,状態変数に関する観測の確率的な得られ方を定式化する(図1).

Run-and-tumble型走化性における感知・制御過程.
まず大腸菌の運動をモデル化する.リガンド濃度の時間変化の正負に基づく制御を捉えた単純な設定として,濃度が単調に変化する軸に沿った1次元空間上でのrun-and-tumble運動を考える.時刻tにおける大腸菌の位置と方向をそれぞれξtとXtで表し,位置ξtは一定の速さvで方向Xtに動くと仮定することで,ξtの時間発展がdξt/dt = vXtと表せる.方向Xtの時間発展については,tumbleレートRtの頻度で確率的にtumbleが起こり,その度に方向がランダムに振り直されて確率1/2でXt = +1かXt = –1になると仮定する.数理的には,十分小さい時間幅dtで方向の反転する確率が
| (1) |
に従う連続時間マルコフ連鎖でモデル化できる.
次に確率的なリガンド濃度感知を観測過程としてモデル化する.観測対象であるリガンドが拡散等で指数的に分布している状況を考えると,時刻tの大腸菌の位置ξtにおける濃度[L]tについて
| (2) |
が得られ,これは状態Xtが与えられた元で観測変数dYtがとる値の確率
以上で大腸菌走化性を,状態変数の時間発展
TumbleレートRtを因果的に制御するために,原理的には時刻tまでの観測履歴Y0:t = {Ys|0 ≤ s ≤ t}を使うことができる.Y0:tが持つ情報を大腸菌が保持できるかは非自明であるが,比較の基準となる最適な制御則を考えるため,Y0:tに依存しうる制御
最適化の基準となる目的関数として,制御コストを低く抑えつつ濃度勾配を素早く上る設定を考える:
| (3) |
e–γtは時間割引因子と呼ばれ,定数γ > 0が大きいほど最適化にあたりより近い未来を重視する設定を表す.第1項vXtは時間積分されることで勾配を正味上る距離を,第2項はtumbleレートRtの制御に伴うコストを表す.1/βは制御コストに対する重みづけである.
制御コストをモデル化するために,多くの制御問題では二乗コストが使われる.しかしRtが大きく変動する非線形応答まで考える本稿の設定では,二乗コストのもと最適化するとRtの非負性が破れるという不自然な結果が現れてしまう.非負性の破れを解消しつつ解釈しやすい定式化として,著者らはKullback-Leibler(KL)制御を用いた.KL制御では非制御状態の存在を仮定し,制御を加えることで非制御状態から乖離する度合いを制御コストと捉えてKLダイバージェンス
状態空間モデルに基づく以上の定式化に部分観測確率制御の理論10)を適用することで,式(3)の目的関数を最大にする意味で効率的に勾配を上る最適制御則が導出される.最適制御則は,時々刻々と得られる観測変数dYtに基づいて逐次的に推定を更新する部分と,推定に基づいてtumbleレートRtを決める部分で構成される(図1).
まず最適な制御の実現に求められる推定は,事後確率
| (4) |
ここで
tumbleレートRtの最適な制御は,式(4)に従って観測履歴Y0:tの持つ情報を要約した事後確率Ztに基づいて実現される.具体的には以下の最適制御関数によりRt = R*(Zt)と制御できる:
| (5) |
V(Zt)は価値関数と呼ばれ,最適制御理論でHamilton-Jacobi-Bellman方程式と呼ばれる2階の微分方程式を解いて得られる.V(Zt)の微分がexpの引数に現れる形はKL制御に基づくコストの導入から帰結しており,最適化で現れるRtの非負性が保証されている.V(Zt)を数値的に求めて式に代入することで,図2Aに示すR*(Zt)が得られる.R*(Zt)はZt = 1/2でR0を通るZtの増大関数であることがわかる.これは無情報の推定状態Zt = 1/2では非制御状態Rt = R0をとり,Zt = 1に近づき勾配を下っている可能性が高いほどtumbleレートRtを上げるという,直感的にも理解できる結果である.

最適制御則に現れる関数の形.(A)tumbleレートを決める最適制御関数(B)負のフィードバックを担う関数Fの最適な形と実験データとの比較.最適制御では縦軸と横軸にF*とZtを,実験データでは縦軸と横軸にFとatをそれぞれプロットした.
理論的に導かれた最適な推定・制御則を実際の大腸菌の応答と比較することで,大腸菌が効率的に走化性をしているかを検証できる.先述の通り大腸菌の応答は詳しく測定されており,背後の分子的機構も踏まえて定量的に応答を再現する生物物理モデルがすでに整備されている.もし最適な制御則が生物物理モデルと対応すれば,生物物理モデルで説明される大腸菌の応答は最適制御を実現する性質を持っているといえる.
著者らは最適制御則を適切に等価変形することで,実際に両者が対応することを見出した.まず式(4),(5)で表される最適制御則は,Ztと1対1対応する新しい座標θt: = log{(1 – Zt)/Zt}を導入し,予測項を新しい変数μtで表すことで次のように書き直すことができる.
| (6) |
| (7) |
| (8) |
| (9) |
κ > 0は任意定数である.対して大腸菌の濃度[L]tに対するtumbleレートRtの応答は,以下の生物物理モデル[7]で再現できる.
| (10) |
| (11) |
| (12) |
| (13) |
このモデルは多数のレセプタ分子からなる大腸菌レセプタの状態を,活性分子の割合であるレセプタ活性atと各分子の平均的なメチル化度合いであるメチル化レベルmtの2変数に縮約して説明したものである.またftはatを決める活性/非活性状態間の自由エネルギー差,N,αは生化学定数である.
生物物理モデルの4変数(at, ft, mt, Rt)は,最適制御則の4変数(Zt, θt, μt, Rt)とそれぞれ対応している.レセプタ活性atは自由エネルギー差ftを通して対数濃度log[L]tとメチル化レベルmtから定まり,tumbleレートを増大させる.これはZtがθtを通してlog[L]tとμtで定まり,最適制御関数R*が増大関数であることと対応する.関数F(at)で決まるメチル化レベルmtの時間発展は,レセプタ活性を平衡点at = āに収束させる負のフィードバックを構成している.これはμtの時間発展がZt = 1/2をゼロ点に持つ減少関数F*で表され,事後確率をZt = 1/2に収束させる負のフィードバックを構成していることと対応する.
著者らは以上の対応を足がかりに,さらに最適制御から導出されたZt全域にわたる関数形F*をShimizuら11)がat全域で計測したFと比較し,その整合性を検証した.その結果が図2Bである.両者は平衡点(Fのゼロ点)から離れた非線形応答の領域まで含めて良く整合している.
特に着目すべき点は,Zt = 1/2を挟んで左側Zt < 1/2に比べて,右側Zt > 1/2ではFの絶対値がより大きいという非対称性である.この性質は,自らの制御が走化性運動に与える影響を式(1)の運動モデルに基づいて予測している結果と解釈できる.実際,仮に制御関数R*(Zt)が定数だった場合のF*はZt = 1/2に対してその絶対値が対称であり,F*の非対称性はR*(Zt)が増大関数であることで初めて現れる.TumbleレートRtが大きいほど方向Xtのランダム化が速く進むため,制御によりRtを増大させるZt > 1/2の領域では推定の信頼性がより速く失われると予測できる.そのためZt > 1/2ではF*の絶対値を大きくし,Ztをより速く無情報の状態Zt = 1/2に収束させることで,制御の影響に関する予測を推定に織り込んでいると解釈できる.
生化学的な観点からは,Fの非対称性はレセプタのメチル化を担う酵素CheRと脱メチル化を担う酵素CheBのうち,後者のCheBのみが活性状態のレセプタ分子によるリン酸化修飾を受けることで現れると考えられている.CheRにはなくCheBのみに存在するリン酸化制御の機能的役割は未解明であるが,本モデルはtumbleレートの制御を考慮した最適な推定に貢献しているという新たな仮説を提示している.
本稿では線形応答に限らない推定・制御則の最適性を部分観測確率制御やKL制御に基づいて定式化することで,大腸菌走化性の生物物理モデルと良く対応し非線形応答を説明する最適制御則が得られたことを紹介した.部分観測確率制御の理論は,本稿の例に限らず制御下の状態遷移