2024 年 64 巻 6 号 p. 295-298
データサイエンスは「分子古生物学」に応用できる.分子系統樹から推定した遺伝子の配列から祖先型タンパク質を再現し,様々な実験により物性を解明することが可能である.本総説では,この方法をクジラやアザラシなど海洋再進出した動物種のミオグロビンの潜水適応メカニズムの解析に応用した例を解説する.

Data science techniques can be used for “molecular archeology”. The ancestral gene/protein sequences are statistically deduced from a molecular phylogeny, and they are further used to resurrect the ancient molecules for laboratory experiments to elucidate their properties and structures. In this review, the researches, which applied this method for analyzing deep sea diving re-adaptation of whales or seals via the evolution of myoglobins, are described.
およそ46億年とされる地球の歴史の大部分は,その表面で栄枯盛衰を繰り返した生物の歴史で区分されている.なぜそれが分かるかというと,地面を掘ると現存しない生物の化石が出てくるからだが,多くの場合,押しつぶされた生物の姿形の一部分である化石から得られる情報はかなり限定される.近年では高速シークエンサを利用した化石DNAの解析により,古代遺伝子の直接解読の成功例も多数報告されている.ただし,現状この方法ではおよそ100万年前(1 Ma = Million years ago,megaannum,以降この表記を用いる)まで遡ることが限界である.
しかし,この限界はデータサイエンスによって超えることができる.塩基配列やアミノ酸配列を解読し,分子系統樹を推定することで,生物進化の歴史を定量的に解析することが可能になった.代表的な系統樹推定法である最尤法は,配列アラインメントAから尤度L(A|T)を最大化する(つまり結果としてAが実現する確率を最大にする)系統樹Tを探索する方法である1).尤度L(A|T)は残基置換確率と進化距離から計算され,系統樹T内のノードjの親ノードs(j)における配列サイトiの残基ai,s(j)がブランチs(j)→jの進化距離ds(j),jの間にノードjの残基ai,jに置換される確率をp{ai,s(j), ai,j, ds(j),j}として以下のように定義される.
つまりこの計算過程では祖先型配列ai,jが尤度分布として算出されることになる.各サイトで最大尤度を持つ残基を選んで祖先型配列を推定すれば,その分子を合成し様々な実験を施すことで,化石から再現不可能な様々な情報を得ることができる2).
例えば,化石情報からホタルは約100 Maに出現したとされるが,祖先ホタルが何色の蛍光を発していたかは,化石からは当然知ることができない.ホタルの蛍光はルシフェラーゼによるd-ルシフェリンの酸化反応で発生することが知られている.そこで,祖先型ルシフェラーゼの配列を上記の方法で推定し合成したところ,深緑色の蛍光を発することが示された3).この蛍光色は現代のホタルの卵や幼虫の発する蛍光に近く,本来ホタルの蛍光が捕食者に対する警告シグナルであったとする説を裏付けるものであった.この方法は,より生物物理学的に興味深い課題にも適用できる.以降本総説では,この方法をミオグロビン(Mb)の潜水適応進化の解析4),5)に応用した例について解説する.
脊椎動物(両生類)は約385 Maに陸上進出したとされる.その後陸上で進化した動物の中で,鯨類(クジラ)と鰭脚類(アザラシ)はおよそ50 Maに海洋に再適応した.これは海洋大型爬虫類の絶滅により空白となったニッチに進出したものとされている.海洋再進出には多くの遺伝子の進化が必要であったと考えられるが,その一つが酸素を貯蔵するMbの進化である6).すでに鰓を失っているので,潜水時に海面で呼吸したO2を大量に貯蔵する必要のため,これらの動物の筋肉には極めて高濃度にMbが溶解されている.実際,潜水哺乳類の筋肉中のMb濃度は陸生哺乳類に比べて著しく高い(図1)4),7).これらのMbは分子表面の塩基性アミノ酸の頻度を上げて表面電荷ZMbを高くすることで,静電反発により高濃度での凝集を防ぐことにより潜水適応しているとされる8),9).

哺乳類筋肉組織中のMb濃度.横軸括弧内の数字はデータとして使用した生物種の数である.文献4より一部改変.
このシンプルで説得力のある説は広く受け入れられているが,実験的検証はほとんどなされていない.そこで潜水適応前の祖先型Mbを復元して(図2),溶解度や安定性,分子間相互作用などを実測した4),5).推定したアミノ酸配列を持つ祖先型Mb(クジラ4種類,アザラシ3種類)を遺伝子工学的手法により合成した.X線結晶構造解析から,全ての祖先型Mbで主鎖構造は保存されていることが確認された.それらの立体構造から分子のZMbを計算したところ,クジラでは最も古いパキケタスMb(aMbWp)から現存マッコウクジラ(swMb)への進化に伴って,ZMbは+0.1から+3.9へと増加していた.この電荷の変化はアザラシでも同様で,最も古いプイジラMb(aMbSp)から現存ゾウアザラシMb(esMb)への進化に伴って+1.92から+4.50へと増加した.

続いて,実際にMb同士が凝集しないように反発力が働いているか測定を行った.小角X線散乱では溶液中の分子間相互作用に由来する散乱(S(q),qは散乱角のパラメータ)が観測される.S(0)–1 = 1 + 2MA2c(Mは分子量,cは濃度)の関係から,第二ビリアル係数(A2)が求まる.分子間力V(r)とA2の関係は,

Mbの反発力の向上.陸生の古代クジラのMb(aMbWp)から水生の現存クジラのMb(swMb)への進化に伴う第二ビリアル係数A2の変化.文献4より一部改変.
さらに,合成したMb溶解度を沈殿剤依存性により評価した(図4).一般的に,タンパク質の溶解度は添加したポリエチレングリコール(PEG)濃度に依存して減少するので,一次関数で近似することによりy切片からPEG濃度ゼロのときの溶解度log S0,傾きから沈殿耐性に相当するβが求まる10).先に述べたMb潜水適応の定説からの予想は,進化と共にlog S0が増加し,溶解性が向上するというシナリオだった.しかし,パキケタスaMbWpが最もlog S0が大きく,早々に予想は裏切られた.一方で,沈殿耐性を示すβにはZMbとの相関が見られた.細胞内は,生化学実験で用いられる希薄緩衝水溶液と異なり,様々な生体高分子で満たされたクラウディング状態にある11).PEG添加に対する沈殿耐性は細胞内での溶解度を反映していると考えられる12).図4に示すように,クジラではaMbWpから中間段階のバシロサウルスaMbWbの進化に伴いβが顕著に増加したのに対して,aMbWbからswMbへの進化ではほぼ変化が無かった.アザラシでも同様に,aMbSpからesMbまでの進化の前半でβが増加し,後半には変化が観測されなかった.では進化の後半には何が起こったのだろうか?

そこで,合成したMbのアポタンパク質の変性実験を行って,各Mbの熱力学的安定性を測定した(図5).その結果,どちらの動物の進化においても,前半で安定性の変化は僅かであったが,後半に顕著な安定性の向上が見られた.

これらのMbの再現実験で得られたパラメータに,立体構造から計算により得られた水和自由エネルギー,表面物性,分子内相互作用などのパラメータを加え主成分分析(PCA)した結果を図6に示す.第1主成分軸(PC1)に沿って陸上祖先から潜水適応種が分布(図6の各Mbを結ぶ点線)することから,この軸は潜水適応軸であると考えられる.潜水適応軸PC1に主として寄与する(すなわち適応の主要因と推定される)パラメータは,前述の実験で示された沈澱耐性(β)や分子内相互作用の安定化要因(ΔG,水素結合,静電相互作用など)であり,Mb潜水適応の定説が述べる溶解度log S0ではないと示唆される.また第2主成分軸(PC2)に沿ってクジラとアザラシが分離することから,この軸は両者の潜水適応メカニズムの違い(適応メカニズムの多様性)を示していると解釈できる.

PCA解析.再現実験されたMbが,各種分子パラメータの主成分分析により第1(横軸PC1,潜水適応軸)-第2(縦軸PC2,クジラ-アザラシ差軸)主成分平面にプロットされている.ベクトル(矢印)は各分子パラメータの主成分寄与率であり,寄与率の高さにより潜水適応軸(赤),クジラ-アザラシ差軸(青),その他(黒)に分類されて示されている.各軸の数値はそれぞれのMbの当該軸の主成分得点を示す.文献5より一部改変.
表面電荷ZMbは潜水適応軸PC1の主要な寄与パラメータであり,クジラでもアザラシでも正電荷が増加する.最後に,主要な適応寄与パラメータである沈殿耐性βとZMbの関係から,何故正電荷に偏る必要があるのか検討する.swMbとウマMb(hsMb)の水溶液のpHを変えることによりZMb値を変化させ,溶解度のPEG濃度依存性βを測定した13).得られたパラメータをpHに対してプロットしたところ,βはpHの二次関数で近似されることが判明した(図7).これは静電反発が沈殿耐性に相関することを示している.一方,log S0はpHに対して明確な相関を示さなかった13).

沈殿耐性のpH依存性.実線はhsMb(赤)の等電点をpI = 7.1,swMb(青)のpI = 8.2とした場合の近似曲線β = 0.017(pH – pI)2 – 0.084を示している.薄灰色は筋組織中pHの変動範囲である.点線はpI = 6.0を持つ仮想Mbの推定挙動を示し,筋肉の活動によりpHが低下すると沈殿耐性が低下することが分かる.文献13のFigure 3を許可を得て一部改変.
現存するほとんどのMbは,7以上の等電点(pI)を示し中性pHで正電荷を持つ.これは負電荷を持つものが多い球状タンパク質としては例外的である.この事実と,潜水哺乳類Mbの沈殿耐性が静電反発により獲得されたことは関係があるように思える.筋肉の活動により筋組織中のpHは低下することが知られているが14),Mbが7より小さいpIを示し,中性pHで負電荷を持っていれば,pHの低下と共にβが低下しMbが沈殿しやすくなってしまう(図7の点線).つまり筋組織中のMbが正の電荷を獲得するのは沈殿耐性の点からは理に適っていると考えられる.
データサイエンスの進展により,古代のタンパク質を再現することが可能となった.タンパク質の復元を通じて古代の生物の栄枯盛衰に思いを馳せるだけでもロマンに満ちて楽しい研究である.
それだけでなく,過去に実存したタンパク質がどのように現れ,消え,生き残ってきたのか知ることには実用的側面もある.例えば,本総説で一端を明らかにした哺乳類の潜水適応に伴うMbの沈殿耐性の獲得は,タンパク質の溶解性・沈殿耐性という極めて普遍的な課題,例えば沈殿しやすいバイオ医薬品を如何に高濃度化して投与するかを解決するヒントとなるだろう.
本稿で紹介したMbはタンパク質科学の代表的モデルタンパク質であり,配列・構造・機能の相関が最も解明されているものの一つである.それでも詳細な物性や機能は実際に作ってみるまで分からず,本総説で述べたように,Mbの潜水適応の定説に一部修正を求める実験結果が得られた.機械学習による構造予測法の進歩は目を見張るものがあるが,物性予測までカバーするゴールはまだ先にあることを感じさせられる.