Journal of Computer Chemistry, Japan
Online ISSN : 1347-3824
Print ISSN : 1347-1767
ISSN-L : 1347-1767
総合論文
ABINIT-MPプログラムの現状と今後
望月 祐志中野 達也坂倉 耕太土居 英男奥脇 弘次加藤 季広滝沢 寛之大島 聡史星野 哲也片桐 孝洋
著者情報
ジャーナル フリー HTML

2024 年 23 巻 4 号 p. 85-97

詳細
Abstract

The fragment molecular orbital (FMO) program ABINIT-MP has a quarter-century history, and related research and development of the Open Version 2 series is currently underway. This paper first summarizes the current status of the latest Revision 8 (released on August 2023). It then describes future improvements and enhancements, including GPU support. The connection with coarse-grained simulation (dissipative particle dynamics) and the possibility of cooperation with quantum computation are also touched upon.

Translated Abstract

The fragment molecular orbital (FMO) program ABINIT-MP has a quarter-century history, and related research and development of the Open Version 2 series is currently underway. This paper first summarizes the current status of the latest Revision 8 (released on August 2023). It then describes future improvements and enhancements, including GPU support. The connection with coarse-grained simulation (dissipative particle dynamics) and the possibility of cooperation with quantum computation are also touched upon.

1 序論

1999年にKitauraによって創案されたフラグメント分子軌道(FMO)法 [1]は,その相互作用解析の利便性から生物物理学や創薬科学の分野でよく使われてきている [2, 3].応用計算が可能な汎用FMOプログラムとしては,GAMESS [4,5,6],PAICS [7, 8],それに本稿のABINIT-MP [9,10,11,12]がある.また,並列性能を追求したプログラムとしてはOpen-FMO [13, 14]がある.2015年度から整備が続いているABINIT-MP のOpenシリーズに関しては,本誌で継続的に状況を報告してきた [15,16,17,18,19,20,21].最新の版は,2023年8月25日リリースのVersion 2 Revision 8 (以下,Ver. 2 Rev. 8) [21, 22]である.本稿では,先ずVer. 2 Rev. 8の特徴をまとめる.その後,GPU化対応を始めとする今後の改良について記す.また,開殻系・多参照系の扱いに向けた仕掛中の作業に触れる.さらに,関連する話題として粗視化分子シミュレーションへの展開,量子コンピュータとの接続の試行例も紹介する.

2 Ver. 2 Rev. 8でのFMO計算の現況

これまでの報告 [18,19,20,21]と重複する部分もあるが,この章ではABINIT-MPのVer. 2系最新リリース版のRev. 8の現状を,紙数制限のために難しかった文献の引用を多めにしつつ記述する.

2.1 速度の向上,大規模系への対応

FMO計算で最もよく利用される計算レベルは,ハートリーフォック(HF)では考慮されない電子相関を2次のメラープレセット摂動論(MP2) [23]で考慮するFMO-MP2である.MP2は,平均場近似の1体のHFポテンシャルと元の2体クーロン反発項の差に対応する揺動ポテンシャルを摂動として扱う最低次の補正法である.その計算コストを決しているのは,基底関数添字の2電子積分から分子軌道添字への変換である.ABINIT-MPでは,独自の並列化-積分直接使用型の実装 [24,25,26]によって小型サーバから「富岳」のようなスーパーコンピュータまで高速処理が可能である; flat MPI並列とOpenMP/MPIの混成並列の両方に対応している.ここで,相関振幅の部分再規格化(PR) [27]によって相互作用エネルギーの過大評価傾向が若干是正できるため,PR-MP2が相関エネルギー補正のデフォルト設定となっていることを記しておく.なお,2電子積分のコレスキー分解(CD) [28]に基づく近似的なMP2 [29]も別途利用できる.

Ver. 1系の最終版はRev. 22 [18]で2020年6月3日にリリースされ,2020年度の「富岳」の試行的利用による新型コロナウイルス(SARS-CoV-2)によるパンデミックの特別プロジェクトでの大規模応用計算に利用された [30,31,32,33,34].報告 [30]は,メインプロテアーゼ-N3複合体(PDB ID: 6LU7)の古典分子動力学(MM-MD)シミュレーションの軌跡由来の千サンプルもの液滴モデルを,基底関数を6-31G* [35]としてFMO-MP2ジョブを同時並行的に実行するcapacity computingの好例となり, [31]では得られた時間変化を含む相互作用エネルギーのデータに対し,データ科学的手法である主成分解析(PCA)と特異値分解(SVD)を適用した事例となった.これに対し,報告 [32]は総数3.3千残基の巨大なスパイクタンパク質(PDB ID: 6VXX, 6VYB)を6-31G*より柔軟性の高いcc-pVDZ基底 [36]を使い,MP2を超えて電子対間の相互作用を考慮する3次摂動 [23, 37]のFMO-MP3レベル [38]で扱ったcapability computingの例となった; 3本のタンパク質鎖間の6-31G*基底での相互作用エネルギーのテンソル分解(高次SVD)による解析は, [34]で別途報告している.ただ残念ながら,Ver. 1 Rev. 22のメモリ要求の制約からスパイクタンパク質は液滴状態では扱えなかった.

2020年度の新型コロナ関係の応用計算では一定の成果が得られたが,ABINIT-MPの計算速度の向上の必要性と大規模系への対応力の不足が顕在化した.そこで,2021年度から計算機科学の高性能計算(HPC)分野の方々とのコラボレーションによってVer. 2系の整備開発を進めている.最初の成果物は2021年9月16日にリリースしたVer. 2 Rev. 4である.詳細は [19]を参考にしていただきたいが,「富岳」等の富士通A64FX系スーパーコンピュータでは,Obaraの垂直漸化式関係(VRR) [39]に基づいてコード生成ツールで書かれた2電子積分生成ルーチン群に対してSIMD化等の改良を施し,FMO-MP2ジョブの速度に関して従前のVer. 1 Rev. 22に対して1.2~1.4倍の高速化を達成した.加速は対象系と基底関数に依存するが,1s関数の縮約の長いcc-pVDZ基底の方が6-31G*基底より顕著となる.

大規模系の扱いでは苦渋の選択となったが,BioStation Viewerによる可視化解析を諦めて関連配列を削除した [19].この結果,総数で1.1万フラグメントのインフルエンザウイルスのヘマグルチニンとFab抗体の複合体(PDB ID: 1KEN)の液滴モデルの扱いがFMO-MP3/cc-pVDZレベルで可能となった.

Ver. 2 Rev. 4のリリース後,2電子積分ルーチン群のループ分割(レジスタスピル対策),Fock行列構築からのif分岐の除去,モノマーHF段階での積分のバッファリング等の地道な改良を続け(主に2022年度) [20],2023年の8月25日にVer. 2 Rev. 8をリリースした [21].FMO-MP2ジョブの速度は,A64FXスーパーコンピュータ上ではVer. 1 Rev. 22に比して1.5倍~2倍となった.なお,Fock部分の改良と積分バッファリングは,Intel Xeonでも有意な加速を与える.

大規模系の扱いでは,タンパク質本体から離れた水分子を4,5個でクラスターにまとめ,実効的フラグメント数を減らすPythonスクリプトを作成した [20].スパイクタンパク質のクローズ型の新しい構造(PDB ID: 6XLU)のMM-MD由来の液滴モデルの素のフラグメント総数約2万を実効1万以下にまで削減でき,1つのサンプル構造に対するFMO-MP2/6-31G*ジョブは「富岳」の8ラック(3072ノード)では2時間程で処理可能となった.2020年からの懸案であった数千残基のタンパク質の液滴モデルのFMO計算の道が拓かれたことになる.ここで付記すると,ABINIT-MP内蔵のフラグメント分割機能は,糖鎖を纏ったタンパク質,あるいはCRISPR-Cas9のようなタンパク質/DNA/RNAの混在系には対応していない.そのため,Pythonスクリプトでの分割処理の環境も順次改良して整備している(後出); 上記のスパイクタンパク質の液滴モデルも糖鎖を含めて計算している.

大規模系の実際の処理では,MM-MD軌跡からの液滴へのシェーピング,フラグメントの分割,ジョブの投入,計算結果の回収,そして解析までの流れの中で(自主開発した)様々なPythonスクリプト群が使われている.特に,多数の液滴サンプルを扱うと結果データは容易にTBオーダーとなるため,人手での相互作用エネルギー解析は困難であり,事例 [31, 34]で活用したSVD系の「情報圧縮」の技法 [40]が必要になり,関連スクリプトの整備と試験的な利用を進めている.未だ途上であるが,抗原-抗体の複合体を対象と想定し,3体のタンパク質間の相互作用エネルギーを時間変動も含めた4階テンソルとして構成して解析するツールも開発している.

相関エネルギー補正に話を戻す.報告 [32]のFMO-MP3計算では,MP2.5スケーリング [41]を実際には用いていた.これは,MP3の相関エネルギーを0.5倍してMP2エネルギーに加えるもので,高次相関法 [37]の中で信頼性が高い3電子励起の摂動補正を含む1,2電子励起結合クラスター展開(CCSD(T) [42])に近い信頼性を与えるとされる.ABINIT-MPにはCCSD(T)までの様々な高次相関計算がファイルレスで並列化実装 [43]されているが,実タンパク質では実行コストがFMO-MP2に比べて百倍超と過大になる [17].その点,スーパーコンピュータ上ではFMO-MP3ジョブの相対コストはFMO-MP2に比して2~3倍で十分に実用レベルであるため,MP2.5スケーリングは有用である.なお,PAICSにもMP3計算の機能が導入されている [44].

この節の最後に,ベクトル化の対応について述べる.国内のHPCI拠点では,東北大学と大阪大学,それに海洋研究開発機構(JAMSTEC)にNECのベクトル型のスーパーコンピュータSX-Aurora TSUBASA(以下SX-ATと略記)が導入されている.ベクトル化は,報告 [26]でJAMSTECの初代地球シミュレータ(ES), [38]で二代目(ES2)に対して,2電子積分生成とFock行列構築のベクトル化,MP2/MP3計算でのDGEMM多用で対応していた.しかし,SX-ATではハードウェアの変更によってB/Fバランスが変わったため,特に積分生成ルーチン群でのレジスタスピル対策としてのループ分割等の再チューニングが必要となった.FMO-MP2計算のVer. 1 Rev. 22とVer. 2 Rev. 4での作業については [19]と [20]で各々報告しており,再チューニング前に比べて約5倍の高速化を達成している.また, [21]では最新のVE30ベクトルエンジンでのFMO-MP3での試行にも触れているが,MP2に比べて加速が十分ではないため,Fock様処理を伴う「4粒子-2空孔」のパート [38]を対象に2024年度も改良を続けている.

2.2 機能の強化

フラグメント間の相互作用エネルギーは,GAMESS [5, 6]ではPIE [45],ABINIT-MP [9, 10]とPAICS [7, 8]ではIFIE [46]と呼ばれて相互作用解析で重用されており,生物物理や理論創薬の分野でFMOがよく使われている理由となっている.実際には,PIE/IFIEのHFエネルギー部分をKitaura-Morokumaのスキーム [47]により,静電項(ES),交換反発項(EX),電荷移動とその他寄与の項(CT)に分け,MP2等による相関エネルギー補正を便宜的に分散力による安定化相互作用の項(DI)とするPIEDA [45, 48]も常用されている.MM-MD由来の液滴として顕に水和を考慮しない場合,連続誘電体近似で水和項が追加で考慮されることもある; ABINIT-MPではポアソンボルツマン(PB) [49, 50]の誘電体モデルに拠る [51].

上記のようにPIEDAでのDI項には相関エネルギーが使われるのが慣例ではあるが,実際には分散力系の安定化だけでなく,HFでの過剰なイオン性を緩和する寄与も含まれており,例えば水素結合とπ/π相互作用では相対的な重みも異なるはずである.そこで,局所応答分散(LRD) [52]によって分散力系の安定化エネルギーをHF電子密度をベースに算定することにした.SMASH [53]の数値ライブラリを一部移植して用いたLRD単体の実装は [17]で報告しているが,PIEDAで利用できる形にはなってはおらず,応用計算の [33]ではFMO-LRDジョブとして別途実行する不便さがあった.そこで,Ver. 2 Rev. 8ではキーワード指定だけでDI(LRD)として利用できるように整備した [54]; スタック塩基対の例では,水素結合とπ/π安定化では前者に対しては「DI」を称するのは妥当でないことが示された.創薬分野のFMO計算で活性相関を調べる際にPIEDAの中でDI項を重視する場合(例えば文献 [55])があるが,今後は注意が必要かもしれない.

IFIE/PIEでは,静電相互作用がしばしば過大評価されることが知られており,PIEDAでES項の寄与を解釈するには注意が要るケースもある.統計力学的な多体補正によるSCIFIE [56]はこの問題に対する是正策だが,並列処理できないために大規模系への適用は困難である.そこで,環境静電ポテンシャル(ESP)を再現するようにフィットされたFMO-RESP電荷 [57, 58]を使って古典的な点電荷間のクーロンエネルギーの和をフラグメント間で計算してES(RESP)として参考値を示す機能も追加し, [54]で併せて報告した; 塩基対の水素結合による過剰安定化で改善が見られた.

次に,多層FMO近似 [59, 60]による注目・重要領域でのHFを超えた取り扱いを述べる.Ver. 2 Rev. 4では,ファーマコフォアでの相互作用解析を想定してMP2 とMP3がサポートされた [18].Ver. 2 Rev. 8では,蛍光タンパク質や機能性光学材料の凝集体の扱いを意図し,1電子励起配置間相互作用(CIS) [61]による励起エネルギーの算定 [62],ならびに2電子励起を摂動論的に考慮するCIS(D) [63]による軌道緩和エネルギーと差分相関エネルギーの補正 [64]をローカル版からの移植でサポートした [21].さらに,CIS(D)に対して高次の寄与を実効的に繰り込む翻案 [65, 66]も使えるようになっており,元のCIS(D)よりも実験値との対応が改善される.また,2次グリーン関数(GF2) [23, 67]によるイオン化エネルギーの算定も可能となった.元のGF2では,孤立電子対等の局在性軌道からのイオン化での緩和エネルギーが過剰評価となる場合が多いが,pGW2スケーリング [68]によって修正されるため,同時に算出できるようになっている.

機能性分子の凝集体の励起状態では,隣接分子間のカップリングが重要とされる.そこで,Ver. 2 Rev. 8では,FMO-LCMO [69]スキームに基づいてCISレベルでカップリング係数を算出する機能 [70]も追加された.FMO-HFの線形応答による動的分極率の算定 [19, 71]と併せ,これらの励起状態系の機能は材料開発での応用計算で有用と思われる.

2.3 HPCI拠点でのライブラリ整備

ソフトウエアの公益化の観点から,北海道大学から九州大学までのHPCI拠点のスーパーコンピュータ群でライブラリプログラム(バイナリ)としてABINIT-MPを提供している.このポリシーの背景には,2020年の新型コロナウイルスのパンデミック時の「富岳」の利用経験 [30,31,32,33,34]がある.もちろん起こらないことが強く望まれるが,「次のパンデミック」がもし発生した際,計算化学的な貢献としてFMO計算が役立つ可能性があり,国内のHPCI拠点群にて複数の研究グループがABINIT-MPを使って件のウイルスの関連タンパク質やDNA/RNAのFMO相互作用解析を行うための基盤構築としての意味も伴っている.

Table 1に,2024年7月時点のHPCI拠点でのABINIT-MPのライブラリ整備の状況をまとめた; 分子科学研究所(IMS)と計算科学振興財団(FOCUS)も含めている.ここで,版名は略記で示し,WIPは仕掛中,SH24は2024年度内の作業完了予定の意である.煩雑となるのでTable中には記していないが,名古屋大学の「不老」や東京大学の「Wisteria」のように構成の異なるサブシステムを持つ拠点でもなるべく個別に対応するようにしている.*印の付いているシステムはSX-ATである.計算速度面で不利なVer. 1 Rev. 22を温存している理由は,BioStation Viewerによる可視化解析の希望者のためのサポートである.また,Ver. 2 Rev. 4が無いケースがあるのは,Rev. 8が上位互換となるためである.

Table 1.  Status of library installation at HPCI sites as of July 2024.

3 Ver. 2 Rev. 8リリース後の整備開発

Ver. 2 Rev. 8のリリース後も,様々な改良・拡張が進められている.この章では,仕掛段階の内容,計画段階の内容も含め,今後のABINIT-MPの整備についてまとめる.更新の幾つかは,次にリリースされるVer. 2 Rev. 12に入ることになる.

3.1 GPU処理の対応

国内HPCI拠点のサブシステムでGPUを搭載するものが増えつつある.Top500 [72]のランキングでも明らかなようにスーパーコンピュータでのGPUによる加速は世界的なトレンドであり,ネクスト「富岳」でも「演算加速器」が搭載されるのは間違いない(ようである).商用の分子軌道計算ソフトウエアのGPUへの対応では,Petachem (旧TeraChem) [73]が高名であるが,BrianQC [74]のモジュールをQ-Chem [75]に導入した例もある.フリー系では,GAMESS [76, 77]が先行しており,FMO計算のためのGPUコード [78]も別途開発されている.国内では,論文 [14, 79,80,81,82,83,84]で取り組み事例が報告されている.いずれも,GPUによる加速の要所は2電子積分関係の処理である.こうした中,ABINIT-MPでも2022年度下期からGPU向けの改造を始め,HF計算のみを切り出したミニアプリケーションでの積分生成とFock行列構築のサブルーチン群の再構成,ならびにOpenACC指示詞 [85]の挿入による試行を前報 [21]で記している.

2023年度下期からはVer. 2 Rev. 8をベースとし,改造箇所の多いFMO-HFレベルでのGPU化を先ず進めている; MP2の積分変換はDGEMMベースで直截と想定している.ミニアプリケーションの改造では,VRRアルゴリズム [39]に基づいて自動コーディングされた{s, p, d}関数に対する34=81種の2電子積分生成のサブルーチン群が26種に再構成されたが,ABINIT-MP本体では対称性的にユニークな21種にまで絞り込んだ.暫定的なデータとなるが,Table 2に6-31G基底での10残基のChignolin (PDB ID: 1UAO)の個々のモノマーHF計算の積分生成時間の総和に対するGPU加速をまとめた; 実行環境は東京大学のWisteria-Aである.積分のタイプに依存するが,30~70倍程度の加速が得られている.2024年7月時点では,Fock行列の構築までのGPU対応の作業 [86]が一段落し,ESP関係 [10]のサブルーチンが仕掛中となっている.

Table 2.  Acceleration of integral generation for Chignolin (HF/6-31G).

3.2 開殻/多参照系への対応

ここまで記しているようにABINIT-MPは閉殻系に対しては速度と機能の両面で整備が進んできているが,今後取り組むべき対象として開殻系と多参照系が残されている.これらが整備されれば,例えばP450のような遷移金属の活性中心を持つ酵素のFMO計算が可能となる.

前の報告 [21]の最後で触れているように,非制限HF(UHF) [87]はエネルギー微分も含めて実装 [88]し,相関計算もUMP2 [89]が可能となっているが,スピン汚染の問題から応用計算は困難であった.そこで,2023年度下期から制限付きのROHF [90]の実装を行っている.αスピンとβスピンのFock行列の混合定数セットについては,文献 [91, 92]を参考にプリセットで選択できるようにしている.現状の反復計算では,開殻電子を一旦除去した正荷電の作業的な閉殻HFを収束させた後,開殻部分をアドオンして収束させる2段階法を取っているが,収束性は未だ改善が必要である.FMOスキームとしては,既存のUHFと同様に開殻フラグメントと閉殻フラグメントを組み合わせて和を取るやり方,多層FMOで注目領域に適用するやり方の2つとする.

ROHF配置を参照する電子相関補正では,UMP2モジュールの積分変換ルーチンを共用できるRMP2 [93]を実装する.RMP2法は,ROHF軌道を再度UHF的な軌道に(4回の部分変換で)転換するが,スピン汚染の問題は無く,軌道エネルギーが一意に決まるメリットがある.

多参照系の扱いでの静的相関の記述では,完全活性空間型の自己無撞着場(CASSCF)法 [94, 95]が第一選択肢となる.CASSCFの適用は,多層FMOのスキーム [60]で系の活性・重要領域を対象に行う.

CASSCFのCASCIパートは,行列式展開でなくスピン対称性を厳密に満たせる配置関数(CSF)展開ベースの並列化エンジン [96]によって解く.ハミルトニアンの2体部分は,恒等分解によって1体の行列要素から効率よく処理するようにデザインされている.Table 3に,CH2分子のDZP基底で25軌道/6電子問題のスピン3重項(CSFの総数は2,466,750)と1重項(同1,495,000)の設定でMPI並列の性能を評価した結果を示す; サーバはXeon Gold 6248で求解完了までの時間を計測した.この問題規模では8並列まで加速が良好である.CSF総数が数千万に達する問題では,16並列や32並列でも有効な加速になると期待される.

Table 3.  Acceleration of CASCI calculation for CH2 (DZP).

CASCI求解が完了すると,活性軌道に関する1体と2体の密度行列が得られる.軌道最適化のパートは,これらの密度行列と分子軌道添字の2電子積分との積和による行列要素を構築して行われる.コスト的にはMP2類似の積分変換が支配的となるが,ABINIT-MPではこの種の処理はきわめて高速に行えるため,先ずは文献 [94, 95]をベースとする1次的収束法のプロトタイピングを準備している.動的相関の補正法に関しては,CASPT2 [97]と異なり,励起振幅の最適化のための反復計算,活性軌道の4体密度行列の生成が共に不要なNEVPT2 [98]を検討している.NEVPT2で必要となる3体密度行列 [99]の計算のため,上記のCASCIエンジンの拡張を行う.

3.3 その他の整備

ABINIT-MPでは4体のFMO展開(FMO4) [100]が可能であり,フラグメント分割を細分化して相互作用解析の解像度を高められる [101].また,固体表面への吸着問題も扱える [102, 103].(通常の2体の)FMO-MP2計算の高速化が一段落しつつあるので,FMO4についても「富岳」等でベンチマークを行い,必要であればチューニングを施すことを考えている.

MM-MDシミュレーションの軌跡からの液滴モデルを扱うスクリプトに関しても追加整備を行った.前出のスパイクタンパク質のクローズ型がオープン型となった構造(PDB ID: 6XM0)では,対イオン回りのダイマーHFでの未収束の続出によってジョブの完走率が著しく低下した.原因は,MMでは交換反発が考慮されないため,イオン周りの距離が近くなりすぎる箇所があるためであった.そこで,液滴構造のPDB形式ファイルから対イオンの情報を別ファイルとして取り出し,古典的な点電荷に置き換えるPythonツールを作成した.これに併せ,ABINIT-MP本体も点電荷群からの静電的な寄与を取り込めるように改修した.こうした対応により,オープン型のスパイクタンパク質の完走率も90%以上に改善された; 他の系でも有効である.

2024年度になり,基底関数をcc-pVDZより上質なcc-pVTZ [36]に上げる試行が進行中である.TZになるとESPに関するMulliken近似 [10]の妥当性が低下し得るためにCDによる高速近似評価 [104, 105]を導入し,さらに線形従属性を除去するために基底関数の正準直交化 [23]を使用する等の作業を行っている.

ヨウ素を含むチロキシンの受容体,白金製剤のシスプラチンがクロスリンクしたDNA等を扱うには,対象の重原子に対して相対論効果を考慮する必要がある.ABINIT-MPではモデル内殻ポテンシャル(MCP) [106]を導入 [107]して応用計算に供してきた; ウラニル(UO22+)とタンパク質の複合体の液滴モデルをMP2.5レベルで計算して統計的な相互作用解析を行った最近の例 [108]もある.しかし,MCPは(むしろ)マイナーでパラメータの追加整備が止まっている状況に加え,他の分子軌道ソフトを併用する都合からメジャーな有効内殻ポテンシャル(ECP)であるLANL2DZ [109,110,111]を使いたいという要望があるため,SMASH [53]から当該モジュールを移植してローカル版でテスト中である.なお,ECPのパラメータセットは内蔵,追加関数を含むファイルの読み込みの両方が可能である.

FMOの全エネルギーの核座標による微分,すなわち力の計算はHFレベル [112]で先鞭が切られ,直ちにMDシミュレーションに応用された [113]; MDパートはPEACHプログラム [114]による.その後,ABINIT-MPとPEACHとの連動によってFMO-MDとしてのワークフロー [115]が整えられ,3体のFMO展開(FMO3)による補正 [116],MP2レベルの微分 [117]が導入された.2023年度には, FMO-MP2微分をVer. 2 Rev. 8で「富岳」上でも可能としており, [105]のCDによる加速も併せ,FMO-MDの応用シミュレーションを検討している.

最後に,FMOによるタンパク質の構造最適化に触れる.ファーマコフォア等の重要領域のみを最適化の対象とし,残りの領域はPDB由来の構造で凍結する(FD)アプローチはGAMESSで提案された [118]; フラグメント分割部分の微分の寄与 [119]も考慮される.ABINIT-MPグループは [120]でTrp-Cage (PDB ID: 1L2Y)を例に簡便な部分構造最適化を報告したが,FDアプローチの再実装が最近なされた [121].これまで述べているように,MM-MD/FMOの連携シミュレーションで構造揺らぎを考慮した統計的な相互作用解析が主流になりつつあるが,一方で重要部分の構造をFMOによって第一原理的に決めて得られる静的な解析結果を1つのリファレンスとする価値は不変ではある [122].構造最適化については,MP2エネルギー微分の計算速度向上等の改良を続けていく必要がある.

4 関連領域との関係

この章では,ABINIT-MPによるFMO計算の広がりとして2015年度から取り組んでいる粗視化シミュレーションへの展開,ならびに2023年度から始めた量子コンピュータを使った量子化学計算への接続について簡単に記す.

4.1 粗視化シミュレーションへの展開

原子単位の通常のMDと異なり,原子団を集団として粗視化するメゾスケールのシミュレーション手法の1つに散逸粒子動力学(DPD) [124]がある.DPDの保存力のパートには粗視化粒子(セグメント)間の有効相互作用を表わす(χ)パラメータが用いられるが,相溶性指標等の実験値を元にフィッティングするか,MMベースで算定 [124]されることが多い.しかし,分極が重要な系や新規の分子構造を持つ系では,経験的パラメータの信頼性・汎用性が十分でない場合が知られている.そこで,論文 [124]のスキームでのセグメント対の相互作用エネルギーをFMO計算によって非経験的に算定し,さらに非等方性を考慮するスキーム [125]をシステム化(FCEWS) [126]した.FCEWSのワークフローは,Pythonスクリプト群で(準)自動的に行える.FMOベースのχパラメータを用いるDPDシミュレーションをFMO-DPDと称し,これまで脂質膜/ベシクルや電解質膜,あるいはペプチドに対して適用してきた; 奥脇弘次氏が,本特集号にFMO-DPDの解説論文を書かれているので詳しくは其方を参照されたい.

χパラメータ計算の総コストを決しているのは,粗視化セグメント対あたり2千配置分行われるFMO計算である.2成分系でも自身の対を含むために6千回のジョブが必要なので,多成分系では数十万回に達し得る.このため,機械学習を用いてセグメント対の相互作用エネルギーを予測し,FMO計算の数を減らす連携システムpre_fcews [127]を開発した.これにより,χパラメータの精度を保持しつつ,総数を1/3程度に削減できるようになった.

生成された粗視化構造をナノスケールの原子単位の構造に復元するリバースマッピングのシステムDSRMS [128]も最近整備したが,これによりナノ⇔メゾのスケールの双方向性が確立された.復元構造をFMO計算の相互作用エネルギー解析の対象としたり,通常のMDシミュレーションの初期構造とすることもできる.

「富岳」の豊かな計算力を前提とし,capacity computing的にFCEWSを使う産学連携のプロジェクトを企画し,HPCI産業課題で2023年度から本格的に進めている.この活動の中では,基礎研究から製品に直結する応用研究まで様々な成果が出てきつつある.

4.2 量子計算との接続

量子コンピュータの応用領域としての量子化学のポテンシャルはAspuru-Guzikによる画期的な論文 [129]によって2005年に初めて示され,以来,手法・アルゴリズムの研究開発が活発に行われてきている; 例えば,総説 [130,131,132]を参照されたい.特に,FeMocoのように多数の開殻d軌道を持ち,近接縮退/静的相関が顕著な生体内の複合金属クラスターをCASCIによる配置数爆発を回避して扱える量子計算の潜在力 [133,134,135]に期待が寄せられている.また,量子回路の深度を浅く保つ観点から分割系のアプローチ [136, 137]が注目されており, [138]ではFMOスキームで水素分子(H2)のクラスターが1,2電子励起ユニタリー結合クラスター(UCCSD)を変分的量子固有値求解(VQE) [130,131,132, 139]で解いて計算されている.

こうした中,Sugisakiとのコラボレーションにより,UCCSDの多参照化 [140],量子位相推定(QPE)によるスピン-軌道分裂エネルギーの評価 [141]の経験を活かし,水素結合による3量体のFMO計算の電子相関パートをVQE-UCCSDで扱う試みを報告した [142].これらの量子計算は,量子コンピュータの実機ではなく量子シミュレータを利用したものである; 特に, [141, 142]ではGPU加速が得られるcuQuantum [143]を使用した.論文 [142]で得られた結果で「驚き」となったのは,UCCSDからの期待に反し,量子化学の根本的な要請であり,FMOでのフラグメントエネルギーの総和式 [1,2,3]の前提でもあるsize-consistencyとorbital-invariance [23]が共に壊れることで,その原因は指数因子のトロッター分解 [130, 131]によるエラー [144]であった.Sugisakiにより,このトロッターエラーの影響がQPEでも示された [145]が,量子計算を多電子系に実際に応用していく際の留意事項として極めて重要である.

5 まとめ

本稿では,ABINIT-MPの最新のリリース版Ver. 2 Rev. 8の特徴,GPU対応等その後の追加改良,ならびに今後の開殻・多参照系への対応等を記した.また,粗視化シミュレーションや量子計算との接続にも触れた.

ネクスト「富岳」の計画では2030年頃の稼働が想定されており,それまでは「富岳」がFMO応用計算の主プラットフォームとなるはずである.FMOの創薬分野での大規模応用では,標準化された構造調製 [146]による系統的な計算結果のデータベース(FMODB)の構築と蓄積 [147, 148]が産官学のコンソーシアム(FMODD) [149]によって進められてきており,「富岳」のHPCI産業課題の成果としても評価が高まっている.また,FMO計算によるχパラメータ算定/FMO-DPDに関する産業課題の活動に関連し,「富岳」上で自動化された高分子シミュレーションで高名なRadonPy [150]のコンソーシアムとの連携も始まりつつある.こうした産業課題でのABINIT-MPを使ったFMO応用計算の広がりは,当面続く「富岳」の時代に一定の価値を持つと考えられる.一方,前述のようにGPU搭載スーパーコンピュータの増加は今後も続く [72]と考えられ,その流れに乗ったABINIT-MPの改造を着実に進めていく必要がある.いずれにせよ,量子化学・計算化学分野と計算機科学のHPC分野の共同作業を通じて今後も改良を進め,HPCI拠点でのABINIT-MPのライブラリ公開を継続して公益に供していきたい.

謝辞

ABINIT-MPのVer. 2系の改良は,JHPCN課題{jh210036-NAH, jh220010, jh230001, jh240001}を通じて進めてきています.SX-AT向けのベクトル化チューニングは,日本電気(株)との共同研究に拠ります.GPU対応は,2022年度下期の東京大学情報基盤センターのGPU移行推進プログラムの中で始まったもので,エヌビディア合同会社の成瀬彰氏と古家真之介氏,同センターの中島研吾先生,下川辺隆史先生,芝隼人先生(現兵庫県立大学)に感謝します.

LRDやECPに関し,SMASH [53]のサブルーチン群のABINIT-MPへの移植を承諾いただいた(株)クロスアビリティの石村和也氏に深謝します.分子凝集体での励起カップリングのパラメータ算出機能は,量子科学技術研究開発機構の藤田貴敏氏がABINIT-MPローカル版のCIS機能をベースに開発したモジュールを移植したものです.開殻・多参照系の計算手法については,CASCIエンジン[96]の主開発者でもある田中皓先生(北海道大学名誉教授)と議論させていただいています.χパラメータ算定・FMO-DPDに関しては,(株)JSOLの小沢拓氏との長年のコラボレーションに負うところが大きいです.量子コンピュータ関係の計算は,慶應義塾大学の杉﨑研司先生との共同研究であり,関連で交流いただいているblueqat(株)の湊雄一郎氏にも謝意を表します.

「富岳」上のテストと応用計算はHPCI課題{hp210026, hp210261, hp220025, hp220229, hp220352, hp230016, hp230017, hp230375, hp240013, hp240030}を利用しました.MM-MDシミュレーションの実行は,慶應義塾大学の山本詠士先生,平野秀典先生,泰岡顕治先生にお願いしています.また,MM-MD/FMO連携計算によって生成される大量の相互作用データに関する高次SVD等のデータ科学的な解析では,神戸大学の田中成典先生と連携しています.

ABINIT-MPの研究開発と普及活動に長年ご支援いただいてきた東京大学の加藤千幸先生(現日本大学)と吉村忍先生に改めて感謝いたします.Table 1にまとめたHPCI拠点でのライブラリ整備では,高度情報科学技術研究機構にお世話になっています.最後に,Ver. 2系の研究開発では立教SFR,ならびに複数の民間企業様からのご支援を受けていることを記します.

参考文献
 
© 2024 日本コンピュータ化学会
feedback
Top