Journal of Computer Chemistry, Japan
Online ISSN : 1347-3824
Print ISSN : 1347-1767
ISSN-L : 1347-1767
Letters (Selected Paper)
Developments of Rare Event Sampling Methods for Proteins
Ryuhei HARADAVladimir SLADEKYasuteru SHIGETA
Author information
JOURNAL FREE ACCESS FULL-TEXT HTML

2019 Volume 18 Issue 5 Pages 199-201

Details
Abstract

Nontargeted parallel cascade selection molecular dynamics (nt-PaCS-MD) is a rare event sampling method of proteins, which does not rely on knowledge of the target structure. nt-PaCS-MD is an extension of targeted PaCS-MD (t-PaCS-MD). In nt-PaCS-MD, it makes use of cyclic resampling from some relevant initial structures to expand the searched conformational subspace. Reliable identification of these initial structures is the key to using nt-PaCS-MD. In the present study, we introduce the moving root-mean-square deviation (mRMSD) as a metric for identification of these statistical conformation outliers. mRMSD can be calculated for any ith geometry in the trajectory generated by short MD runs. The reference to which the mRMSD relates is the close surrounding of the ith conformation, often the (i-1) st one. Based on mRMSD, we show that it increases its effectiveness compared to the conventional MD.

1 目的

計算機の演算性能と分子動力学シミュレーション(MD)の信頼性向上に伴い, 生体機能を解明するための理論的研究が盛んに行われている. MDは, 実験により観測困難な反応中間体や遷移状態を推定できるため, 生物物理学における重要な研究手法である. 特に, MDに基づく反応経路解析は, 生体機能を理解する上で重要である. しかしながら, MDを用いても解明困難な生体反応が数多く存在している. 何故ならば, 現状におけるMDが到達可能な時間スケールが, 生体機能が機能発現する時間スケールと比較して非常に短いからである. 一般的にマイクロ秒以上の時間スケールで確率的に誘起されるタンパク質のダイナミクスは「レアイベント」と呼ばれ, 通常のMDで抽出することが困難な場合が多い. 原理的には高機能な計算機を用いて長時間MDを実行すれば, レアイベントを抽出することができる. 実際に, 米国のDESRESが開発を進めているMD汎用計算機 (Anton) などを用いたミリ秒スケールの長時間MDでタンパク質のフォールディング過程を抽出する研究例が盛んに報告されている [1, 2]. 1つの初期構造から長時間MDをスタートするAnton型の戦略に対し, 複数の異なる初期構造から短時間MDを繰り返す戦略は「分散型MD」と呼ばれ, タンパク質の長時間ダイナミクスを直接抽出することは困難であるが, タンパク質の構造空間を広く効率的に探索することができるため, 信頼性の高い統計量を得ることができる. このため, 分散型MDを合理的に実行できれば, タンパク質の構造変化に対する自由エネルギーなどの物理量を高精度に見積もることができる. 本研究では, 分散型MDの戦略をタンパク質の長時間ダイナミクス (レアイベント) の抽出に応用できないか思案し, 様々なサンプリング手法を開発 [3, 4] したので, 概要を報告する. 本項では, 開発手法より, Parallel Cascade Selection MD (PaCS-MD) [5] とその拡張版であるnontargeted PaCS-MD (nt-PaCS-MD) [6, 7] について取り上げ, サンプリング戦略を解説する.

2 方法

時間スケールの問題点を解決するため, これまで長時間MDに代えて多数の異なる初期構造から短時間MDを独立・並列に繰り返し実行するPaCS-MD [5] を提案し, タンパク質機能に関係する遷移経路の探索に成功してきた. PaCS-MDは, 構造遷移における始・終構造が与えられた条件のもと, 始構造から終構造へ至る遷移経路をレアイベントとして探索する. 具体的には, 終構造に遷移する確率が高い重要な分子構造を初期構造に選択し, 短時間MDをリスタートするサイクルを繰り返す. 重要な初期構造を選択するためには, タンパク質の構造遷移を特徴付ける適切な反応座標を定義しなければならない. 最も単純な反応座標として, 終構造から測定した平均自乗距離 (RMSD終構造) が考えられる. ただし, RMSDは一つの反応座標の候補であり, 他の反応座標でも良いことに注意されたい. ここで, RMSD終構造の値を参照しながら, 終構造に類似した構造を遷移確率が高い初期構造として選択し, 短時間MDをリスタートする経路探索により, 終構造へ遷移する「稀にしか起こらない構造揺らぎ」の出現確率を上昇させる. 遷移確率の高い重要な初期構造から逐次的に短時間MDをリスタートする「構造リサンプリング」を繰り返すことで, 探索領域が終構造へ近づき, 遷移経路を効率的に探索でき, レアイベントを抽出できる.

PaCS-MDは, 構造変化の始・終構造が予め既知であることが適用条件である. 本項では, 終構造が未知の場合にも適用できる様に拡張した nt-PaCS-MD [6, 7] を解説する. nt-PaCS-MDは, 短時間MDの時系列を考慮して短い時間間隔の平均構造から瞬間的に大きく構造が変化した分子構造を遷移確率が高い重要な初期構造とみなし選択し, 短時間MDを繰り返す. 具体的には, 短い時間間隔に含まれる分子構造を用いて平均構造を計算しておき, 平均構造から測定したRMSDを見積もる. 実際の計算では, トラジェクトリに沿って時間間隔をずらしながら平均構造を動的に計算し, 時間間隔ごとにRMSDを計算するmoving RMSD (mRMSD) 計算の概念図をFigure 1に示す.

Figure 1.

 Concept of mRMSD in nt-PaCS-MD

Figure 1においてk番目のスナップショット (赤丸) に着目した場合, その前後l, l+個のスナップショット (青丸) を用いて平均構造を計算する. その後, それぞれのスナップショットに対して平均構造から測定したmRMSDを計算する. mRMSDの値が大きい分子構造は, 時間間隔の平均構造から瞬間的に大きく構造が変化したことを意味し, 近傍に存在する準安定状態へ遷移する可能性が高い重要な分子構造と見なすことができる.

3 結果・考察

ここで, nt-PaCS-MDを用いて加水分解酵素T4リゾチーム (T4L) のOpen-Closed遷移を抽出した計算例を示す. 性能評価として, T4LのOpen構造から経路探索をスタートし, Closed構造への構造遷移を抽出できるか確かめた. サイクルあたり, mRMSDが大きい順に10個の初期構造を選択し, 短時間MD (100 ps) を繰り返した. 故に, サイクルあたりの計算コストは1 nsとなる. Figure 2に, サイクル毎にnt-PaCS-MDが探索した分子構造に対してClosed構造から測定した最小RMSD (Cα RMSDclosed)を示す.

Figure 2.

 Profile of minimum Cα RMSDclosed

Figure 2に示す様に, 25サイクルでRMSDclosed (Closed構造から測定したRMSD) の値がRMSDclosed < 1.0 Å と小さい領域に収束しており, Open構造から出発してClosed構造を参照することなく (blind predictionとして) Open-Closed構造遷移を抽出することができた. つまり, 計算コストとして, 25サイクル (25 ns) 程度でレアイベントを検出できている. 一般的に, T4LのOpen-Closed遷移はマイクロ秒以上の計算コストが必要となるため, nt-PaCS-MDを用いることで, マイクロ秒オーダーからナノ秒オーダへの計算コスト削減に成功した.

次に, nt-PaCS-MDの短時間MDが採取したトラジェクトリからマルコフ状態モデル (Markov state model: MSM) を構築し, Open-Closed構造遷移に関する自由エネルギー地形を計算した. MSMを構築する手順として, 反応座標空間において状態を定義し, 状態間の構造遷移をカウントすることで遷移行列 (T) を推定する. MSMの定常状態の集合をπと仮定すると, π = T π が成立するので, 固有値が1の固有値問題に帰着する. 故に, Tの対角化により, 固有ベクトルとしての定常状態ベクトル (π) が得られる. 以上より, nt-PaCS-MDとMSMを組み合わせることで, それぞれの状態の出現確率が分かるので, 自由エネルギーを計算することができる. Figure 3にnt-PaCS-MDとMSMから計算したT4LのOpen-Closed遷移に関する自由エネルギーを示す.

Figure 3.

 Free energy for the open-closed transition of T4L

Figure 3に示す様に, 準安定状態としてOpen構造とClosed構造が検出されており, 状態間をつなぐ遷移経路を確認することができる. 故に, nt-PaCS-MDとMSMを組み合わせることで, 遷移経路の抽出から自由エネルギーの定量的評価まで極めて容易に実行することができた. 今後は本手法を様々なタンパク質システムへ適用し, 生体機能解析を進めていく予定である.

謝辞

論文に掲載されているシミュレーション結果は, 筑波大学計算科学研究センターの学際共同利用プロジェクトのもと, Cygnusを用いて計算された.

参考文献
 
© 2019 Society of Computer Chemistry, Japan
feedback
Top