Journal of Computer Chemistry, Japan
Online ISSN : 1347-3824
Print ISSN : 1347-1767
ISSN-L : 1347-1767
速報
分子軌道エネルギーと機械学習による分子物性の予測
寺前 裕之松尾 哲秀庭月野 一眞井上 竜太野口 晋治玄 美燕山下 司高山 淳岡﨑 真理坂本 武史
著者情報
ジャーナル フリー HTML

2020 年 19 巻 2 号 p. 43-45

詳細
Abstract

The values of the internuclear distances and the dipole moments of 14 small molecules have been estimated by machine learning with only molecular orbital energies as the explanatory variables. We use four regression methods, partial least square (PLS), random forest (RF), Radial Basis Function Kernel Regularized Least Squares (krlsRadial), and Baysian Regularized Neural Networks (BRNN) and we report only BRNN results for the internuclear distances, and PLS results for the dipole moments. The coefficients of determination for the internulear distances and the dipole moments are 0.9318 and 0.7265, respectively. It has been proved that the internuclear distances and the dipole moments can be predicted by the molecular orbital energies only.

1 はじめに

寺前らは日本で認可・販売されているベンゾジアゼピンおよびチエノジアゼピン系の抗不安薬について,ab initio分子軌道法によるエネルギーとエネルギー勾配を用いた高次元アルゴリズムによる分子動力学計算を行い,薬物の抗不安性と抗痙攣性の強さと分子軌道のエネルギー値に相関があることを初めて見いだした [1].

HF/3-21G計算によりコンフォメーション解析ならびに構造最適化を行い,得られた構造におけるHF/6-31G (d, p)分子軌道のエネルギー固有値と抗不安性や抗痙攣性の強度を比較したところ,いずれもnext-HOMOの軌道エネルギー固有値との間に強い相関関係を見いだした.

近年,寺前ら [2]はフェルラ酸(FA)の抗酸化作用 [3, 4]を同様な手法を用いることで,説明できることを示した.DPPHフリーラジカル消去濃度(IC50)とフェノール性水酸基から水素を取ったFAラジカルの電子状態とIC50との関連性が考察された.ただし抗不安薬の場合と異なり,ただ一つの軌道エネルギー固有値では強い相関関係を得ることはできなかったため,ラジカル種とニュートラル種の各軌道エネルギー値とIC50との関係をrandom forestモデルにより機械学習を試みたところ,αSOMO-1が6%,αSOMOが24%,αLUMOが45%の寄与があると計算された [2].

このように抗不安性や抗酸化性などのように複雑な過程の相関関係を簡単に得ることができるので,より簡単な分子物性を分子軌道計算と機械学習により,相関関係を得ることが可能ではないかと考えた.本研究では,2原子分子ClF, HCl, HF, CS, LiF, LiCl, NaF, NaCl, N2, NP, SiO, F2, P2, Cl2 の14種類の平衡核間距離および異核2原子分子,ClF, HCL, HF, CS, LiF, LiCl, NaF, NaClとPH3, NH3, HCP, H2S,H2O, H2CO の14分子の双極子モーメントを分子軌道エネルギー値のみを説明変数として機械学習を試みた.

2 計算方法

分子軌道計算プログラムGaussian16を使用し [5],6-31G (d, p)基底を用いて構造最適化を行った.構造最適化を行った構造による分子軌道固有値を説明変数として用いた.機械学習はR言語により多くの回帰法が実装されているcaretパッケージ [6]を用いた.核間距離と双極子モーメントについての文献値はNISTのデータベースのものを用いた [7].

3 結果と考察

機械学習における回帰法としては,partial least square (PLS), random forest (RF), Radial Basis Function Kernel Regularized Least Squares (krlsRadial)とBaysian Regularized Neural Networks (BRNN)の4種類について試みた.

基底関数の関係から,同一レベルで計算できる分子数が14種類と限られているが,最初に10+4の2つのグループに乱数を使用して分割し,前者で教師付の機械学習を行い,その結果を用いて後者で予測を行い,どの程度の精度が得られているかを確認した.分割はいくつかのパターンを試行して大きな差が出ないことを確認した.また過学習を避けるために教師付学習においてはValidationを行っている.

説明変数としての軌道エネルギーの数は核間距離の場合で被占軌道ではHOMOから下の5軌道とLUMOから上の5軌道,合計10軌道とした.これは計算された分子の中で最も電子数の少ないHF分子の電子数から決定した.双極子モーメントの方はHOMOから下の3軌道,LUMOから上の3軌道,合計6軌道とした.こちらについては特に理由は無く適当に決定した.

ここでは,最も良く文献値に合致していた回帰法,核間距離ではbrnn,双極子モーメントではplsを用いた結果のみを報告する.ただし他の回帰法を用いた場合も概ね同様な結果が得られている.

Figure 1に機械学習の結果を示した.Figure 1 (a)に核間距離の教師付機械学習,Figure 1 (b)には,核間距離の予測値,Figure 1 (c)に双極子モーメントの教師付機械学習,Figure 1 (d)には双極子モーメントの予測値を示した.教師付機械学習の結果は核間距離は,決定係数R2が0.9834,双極子モーメントの場合で0.8033といずれも強い相関関係を示している.特に双極子モーメントの場合はさらに複雑な回帰法,例えばkrlsRadial,により,文献値と完全に合致させることも可能であるが,過学習により予測値は却って合致しなくなってしまうことには注意を要する.

Fig.1

 Plots of Training and Predicted Values of (a), (b) Internuclear Distances and (c), (d) Dipole Moments. Regressiion Methods are (a), (b) BRNN and (c), (d) PLS, respectively,

予測値の決定係数では,核間距離の場合で,0.9318, 双極子モーメントで0.7265となっている.核間距離はほぼ完全に予測可能,双極子モーメントもかなりの確率で予測が可能であることを示している.

4 結論

機械学習を用いていくつかの小さな分子の核間距離と双極子モーメントの値を分子軌道のエネルギー値を説明変数として予測することを試みた.

4種類の回帰法を使用したが,いずれの方法でもある程度の相関が得られ,分子軌道計算と機械学習の組み合わせは強力なツールであり,様々な分子物性の予測が期待できるであろうことがわかった.ただし,本研究の核間距離や双極子モーメントはあくまでテスト目的であり,実用性はないため,エントロピー,モル熱容量,融点,沸点などの,分子物性への適用を今後行っていく予定にしている.

参考文献
 
© 2020 日本コンピュータ化学会
feedback
Top