2024 Volume 64 Issue 6 Pages 291-294
データ駆動型解析により,タンパク質のダイナミクスと進化に共通する特徴の物理的起源が明らかになり,頑健性と可塑性のトレードオフが示された.さらに,AlphaFoldによって予測されたタンパク質構造データベースを基に,タンパク質進化の統計的傾向を分析し,進化的次元削減を実証し,生物学的複雑性の普遍的法則を強調した.
Proteins exhibit structural variations due to thermal noise (dynamics) and genetic mutations (evolution). Using extensive protein structure databases, it is observed that native-state dynamics of proteins exhibit long-range correlations, resembling critical points in physical systems, which contribute to significant conformational changes like allosteric regulation. Additionally, data-driven analysis revealed correspondences between protein dynamics and evolution, shedding light on the robustness-plasticity tradeoff of proteins. Furthermore, based on AlphaFold structure predictions, the statistical trends in protein evolution were observed, highlighted by evolutionary dimensionality reduction. These findings underscore the universal principles of biocomplexity and may lead to advancements of protein engineering technologies.
タンパク質は生細胞内のダイナミックな分子であり,その天然構造(ネイティブ構造)は,遺伝子によって決定されたアミノ酸配列によって主に形成され,遺伝型と表現型の間の複雑なリンクに関与する,構造生物学の中心的な課題である1).天然変性タンパク質は,タンパク質の折り畳みに関する従来の見解に挑戦してきたが,この総説では,天然構造を持つタンパク質(球状タンパク質と膜タンパク質)のみを対象としている.これらのタンパク質は外部環境の変化に敏感であり,金属イオンや他の生体分子のようなシグナルを検出して反応するために重要な構造変化を引き起こす可能性がある.一方で,タンパク質のアミノ酸残基をコードする遺伝子配列に突然変異が起きることがある.このような変異は,天然構造とそれに対応する動きを変化させ,生物学的機能に影響を与える可能性がある.しかし,タンパク質はさまざまなアミノ酸の置換に耐える顕著な能力を示し,その熱力学的安定性と折り畳み経路を維持し,突然変異に対する頑健性を補強している.タンパク質がその機能を維持するためには,内部変異や外部ノイズに適切に対処することが不可欠であり,それには環境の変化に対する感受性・可塑性と,遺伝的変異に対する回復力・頑健性のバランスが必要である.
本総説では,データ駆動型の研究に基づき,タンパク質のダイナミクスと進化の関係を探る.広範なタンパク質構造データベースを活用することで,ダイナミックな構造変化と進化的適応との関連性をより深く理解することができる.このようなデータ駆動型の洞察,特にAlphaFoldのようなAIモデル2)からの統計力学的解析により,タンパク質の進化的傾向を明らかにすることができる.
実験と分子シミュレーションにより,タンパク質の熱揺らぎが局所的な構造変化や大域的な構造転移を引き起こすことが示されている.これは触媒作用,リガンド結合,生体分子認識,および輸送を含む生物学的機能の基礎である.この機能の主な特徴は,タンパク質の天然構造における長距離相関揺らぎであり,局所的な摂動が遠隔の残基に影響を与えることを可能にする.これはアロステリック調節の重要なメカニズムである.
相関運動の特徴を明らかにするために,あるアミノ酸残基の動きが特定の距離にある別の残基とどのように相関しているかを示す.核磁気共鳴(NMR)によって決定された構造アンサンブルに基づき,タンパク質の残基間の相関運動を定量化する相関関数を決定した.その統計的な結果から,長距離相関(相関の長さはタンパク質のサイズのスケールである)と高い感受性(磁気研究における「磁化率」という概念の一般化であり,外部の摂動に対する高い感度を意味する)の存在を確認し,一箇所での摂動がタンパク質全体に影響を与えることを示した3).
さらに,X線結晶構造解析で得られた構造を使用し,弾性ネットワークモデル(Elastic Network Model, ENM)に基づいて基準振動(ノーマル・モード)解析を実施し,その平衡ダイナミクスを予測した4).ENM(図1A)は,アミノ酸残基をノードとし,空間的に隣り合う残基をバネで繋いで,タンパク質をネットワークで表現する.このモデルでは,タンパク質のダイナミクスは,元来の天然構造に対する残基の集団的な線形応答・緩和として記述できる(図1B).基準振動解析の結果に基づいて,ある残基の動きが他の残基の動きとどのように相関しているかを測定することができ,その結果は行列として表すことができる(図1C).2つの残基間の距離が長くなるにつれて,残基間の相関はまず減衰し,その後,より遠い残基間で逆方向に動く(反相関が増加する)ことが観察された(図1D).これらの結果は,前述のNMRで観察された長距離相関と一致している.
タンパク質のダイナミクスにおける長距離相関.(A)弾性ネットワークモデルの説明図(PDB ID: 1MEK).(B)アミノ酸残基の相関運動.(C)残基運動の相互相関行列.ϕijは残基ペアiとjの間の相関.(D)同じ相互距離rの残基ペアの平均相関関数ϕ(r)(ξは相関長であり,タンパク質の回転半径に近い).
ENMに基づく,タンパク質のトポロジー的特徴を調べることで,タンパク質の折り畳みの充填率のサイズ依存性が明らかになった.統計的な結果から,ある鎖長のタンパク質には,最も可能性の高い形状係数が存在する.形状係数は,タンパク質の構造が球状・楕円体状からどの程度ずれているかを表す.鎖長が短いタンパク質は比較的安定した構造を持ち,球状に折り畳まれる可能性が高い.しかし,鎖長が長くなると,タンパク質は複数のモジュールを持つ可能性が高くなり,あるいは構造が球形から外れる可能性が高くなる.この研究は,タンパク質の構造とダイナミクスの関係に新たな視点を提供し,異なるサイズのタンパク質進化における普遍的原則を明らかにした5).
統計物理学では,長距離相関と高感受性は,秩序と無秩序の微妙なバランスにある「臨界点」と特徴づけられるシステムの特性である.天然タンパク質の熱揺らぎは,相転移の臨界点に位置している系に似ている.注目すべきことに,臨界状態にあるかのように振る舞う生物学的システムは数多く存在する6).タンパク質の場合,外部のシグナルを感知して反応し,状況に応じて異なる構造に切り替えられるだけの感度が必要である.一方で,機能的特異性と構造的頑健性を保証するために十分な安定性を維持する必要がある.この微妙なバランスは,タンパク質の振動スペクトルをべき乗則(臨界状態の特徴)に導く7).
タンパク質研究において,ダイナミクスは生化学反応や環境変化への分子適応といった短期的プロセスに関連しており,一方で進化は遺伝子の突然変異と自然選択の長期的影響に関連している.生物システムのダイナミクスと進化の間のリンクを探ることは生命科学における重要なテーマである.特に,以前の研究では,進化におけるアミノ酸の置換とタンパク質ダイナミクスの熱揺らぎとの間に相関があることが示された.また,タンパク質の機能ダイナミクスはしばしば,遅いモードによって特徴づけられる低次元の動きに制限されることが示された.同様に,タンパク質ファミリー内で突然変異によって誘発される構造変化も低次元であるように見える.これらの発見は,他の生物系で観察された傾向と一致して8),9),タンパク質のダイナミクス(表現型)と進化(遺伝型)の間の潜在的なリンクを示唆している.このような結果は,安定性と機能性の間の進化的トレードオフを反映している.
本研究10)では,数百のタンパク質ファミリーからなる数十万個のタンパク質のデータベースを用いて,熱揺らぎと突然変異によるタンパク質の構造変化の間の相関を解析した.その結果,多種多様なタンパク質ファミリーについて,そのダイナミクスと進化の間に高い類似性があることを見いだした.タンパク質内の数百個の残基間で,熱揺らぎと進化による変動の相関をそれぞれ行列で表すと,その両者は高い類似性が見られた(図2).これは,熱揺らぎにより構造が大きく変化しやすいアミノ酸残基は,突然変異による配列変化でも大きく変化しやすいことを示している.また,残基の運動間の相関を残基間の距離の関数として求めると,長距離の相関が観察される.その相関関数は,タンパク質の進化における突然変異による構造変化に見られるものと似ている.この結果は,(i)ある残基への局所的な摂動が,タンパク質の空間的に離れた他の残基によって感知されること,(ii)ある残基における突然変異が,離れた残基における変化をもたらし得ること,そしてさらに重要なことに,(iii)上述した2つの変化の間に対応関係があることを示す.この対応関係は,タンパク質の機能的な動きを理解し,進化における制約を分析するための統一的な枠組みを提供する.
さらに,天然タンパク質の線形応答を研究することで,残基の動きの緩和方向(集団座標)が変異による変位に対応していることが示された.この対応関係は,構造が擾乱に対して頑健でありながら,機能のためには敏感な応答も必要という要求から説明される.この頑健性と感受性の要求により,アミノ酸残基の配列変化に伴う構造変化は低次元空間に制限され,したがって進化もその方向に制約される.この低次元拘束はデータと理論モデルからも確認され,ダイナミクスと進化の対応関係の起源が明らかになった.さらに,タンパク質モジュール構造がこの低次元化に関係しており,大きなタンパク質は緩和が遅く,突然変異による変形がこの遅いダイナミクスと重なりやすいことも見いだされた.
最近の人工知能の発展は,タンパク質の構造とダイナミクスの統計分析のための新しく強力なツールを提供している.Google DeepMindによって開発されたAlphaFold 2(AF2)は,タンパク質構造の予測において驚異的な進歩を遂げ,生命科学研究を革命的に変えた2).DeepMindはAF2が可能にする広範な構造予測を利用して,2億以上のタンパク質を含むデータベースを構築した11).このデータベースは,多くの生物の完全なプロテオームを網羅している.生物の進化とタンパク質の進化との間の関係をさらに研究するため,AF2予測タンパク質構造データベースを基に,異なる生物のタンパク質について比較分析を行う.
AF2で予測された構造の統計12)によると,複雑性が高い生物の構成タンパク質は,同じアミノ酸残基の数でも,より大きな回転半径(すなわちより高いランダム・コイルの割合),そして統計的に遅い振動を示す(図3A).ENMに基づく解析から,生物学的複雑性が高い生物の構成タンパク質は,モジュラリティが高まることによって反映されるように(図3B),構成タンパク質の構造とダイナミクスの両方で,フラクタル次元が低くなる傾向があることが示された.モジュラリティは,ネットワークをモジュールやコミュニティに分割する能力を定量化する.モジュラリティが高いということは,ネットワークをより簡単に分割できるということだ.モジュール化された構造はタンパク質の主振動モードを形成し,この主振動モードの相対的な重要性が増すことで,タンパク質の機能特化に寄与する(図3C).その結果,構成タンパク質の機能的特殊性が高いほど,生物学的複雑性が高いことが示された.タンパク質が機能的特化し多様化することで,より複雑で多様な細胞環境で機能できるようになる.その結果,複雑な生物は生物学的機能をより効果的に発揮し,複雑で多様な外部環境に適応するための可塑性を獲得することができる.生物の複雑性と構成タンパク質の機能特化との両立は,生物系や他の種類の複雑系における全体と部分の相互依存性を示唆している.一般的に,システムがより複雑になるにつれて,その構成要素は特性を変化させるはずである(例えば,より可塑的になったりモジュール化されたりする).
タンパク質の構造進化の統計的傾向.異なる生物における,鎖長が似ている(225 < N ≤ 275)タンパク質の(A)回転半径Rgと(B)モジュラリティQの分布.(C)生物の複雑性(生物のプロテオーム中のタンパク質の異なる種類の総数,あるいはタンパク質の鎖長の総和で評価)と,鎖長が似ているタンパク質のモジュラリティとの相関.図は文献12より引用.
また,残基接触ネットワークとアミノ酸配列の進化における統計的傾向も確認された.生物の複雑性が増すにつれて,構成タンパク質の残基接触ネットワークはより同類選択的となり,これらのタンパク質は配列内の親水性·疎水性の分離度が高くなる.さらに,ホモログタンパク質の系統樹とプロテオーム間の統計的構造類似性を比較することにより,プロテオーム間の統計的構造類似性が間接的に系統的近接性を反映することが示された.これは,生物の進化と並行したタンパク質進化の統計的傾向を示すものである.この研究は,進化の過程でタンパク質の機能の多様性がどのように増加し,タンパク質ダイナミクスの次元がどのように削減されるかについての新たな洞察を提供し,生命の起源と進化の理解に貢献するものである.
この研究は,タンパク質のダイナミクスにおける長距離相関と臨界現象の機能的重要性を強調し,タンパク質の頑健性と可塑性のトレードオフを示すものである.データ駆動型の研究を利用し,タンパク質のダイナミクスと進化の対応関係を示した.さらに,AF2構造予測に基づき,進化的次元削減によって強化されたタンパク質進化の統計的傾向が観察された.
これらの発見は,タンパク質のダイナミクスと進化,そして生物学的複雑性に関する普遍的な原理を示すものであり,タンパク質工学に革新をもたらす新たな視点を提供するものである.さらに,これらの原理は,タンパク質のダイナミクスにとどまらず,脳や生態系などの生物学的実体から,ニューラルネットワークや電力網などの人工的構造体に至るまで,さまざまな複雑系に及ぶ.タンパク質で観察される頑健性と可塑性のトレードオフは,これらのシステムがダイナミックな環境で進化し,学習し,機能するために不可欠な安定性と適応性の重要なバランスを反映している.この研究は,タンパク質のダイナミクスと進化に関する理解を深めるだけでなく,よりレジリエントな人工システムを設計するための重要な知見を提供し13),多様な分野にまたがる革新的なアプローチを開拓することで,科学の普遍的な原理が相互に関連しており,広範な応用が可能であることを示している14).
本稿で紹介する研究は,東京大学(現デンマークNiels Bohr Institute)金子邦彦教授,東京大学(現東京工業大学)畠山哲央博士をはじめとする多くの共同研究者のご協力により実施されました.この場を借りて,心からの感謝を申し上げます.