2019 年 18 巻 5 号 p. 211-213
Ferulic acid is known to have strong antioxidant properties. In the present study, we investigate the electronic structures of ferulic acid and its radical species extracting the hydrogen atom from its phenolic hydroxyl group. The relation of the results by several machine learning models using R/caret package, such as partial least squares, random forest, radial basis function kernel regularized least squares, and baysian regularized neural network, with the radical scavenging activity with the DPPH reagent, IC50, measured by Sakamoto et al. is discussed. We found all four methods gave reasonable correlation coefficients which means the possible prediction of the IC50 values with the results of the molecular orbital calculations only.
酸化ストレスは,神経変性疾患や虚血性脳障害の発症・進展に深く関与していることが知られており [1, 2],抗酸化物質による酸化ストレスの軽減が近年注目を集めてきている.
フェルラ酸(FA)はケイ皮酸誘導体の一つであり比較的強い抗酸化作用を示す [3, 4].FAの抗酸化作用はフェノール性水酸基によってフリーラジカルに水素を供与することでもたらされていると考えられている.
友野ら [5]はFAよりも高い効果を示しかつ毒性の低いFA誘導体の探索を目的として種々の置換基を導入したFA誘導体を合成し,フリーラジカル消去能の測定を行い,消去能は置換基に大きく依存することを見いだしたが,そのメカニズムは不明であった.我々はDPPHフリーラジカル消去濃度(IC50)とフェノール性水酸基から水素を取ったFAラジカルの電子状態とIC50との関連性を考察してきた.特に最近の研究ではラジカル種とニュートラル種の各軌道エネルギー値とIC50との関係をrandom forestモデルにより機械学習を試みたところ,αSOMO-1が6%,αSOMOが24%,αLUMOが45%の寄与があると計算された [6].本研究ではR言語により多くの回帰法が実装されているcaretパッケージ [7]を用いて,さらなる機械学習を試みたので報告する.
分子軌道計算プログラムGaussian16を使用し [8],FAとその誘導体をRHF/6-31G**レベルで,FAとその誘導体のフェノール性水酸基から水素を取り去ったFAラジカルをUHF/6-31G**レベルで構造最適化を行った.最適化された構造に対して振動数計算を行い,安定構造であることを確認した.ただし,本研究ではコンフォメーション探索は行っていないためエネルギー最小値であることは確かめていない.将来的にはGAMESSプログラム [9]に組み込んだ高次元アルゴリズム [10]によるコンフォメーション検索を行う予定にしている.
最初にFAのラジカル消去能に関しては,個々のFAのラジカルへの変化しやすさが関係しているのではないかと考えて,元のFA類とOH基からHラジカルを取り去ったラジカル種とのエネルギー差について計算した.比較対象として抗酸化物質であるコーヒー酸(CA),アスコルビン酸(VC),トロロックス(Trolox)の3つの化合物の計算も同様に行った.化合物は合計26種類となった.結果としてあまり大きな相関は見られなかったが,説明変数として量子化学計算から得られる計算値を加えることで,より良い相関関係が得られるのではと考えて教師付機械学習を試みた.
ラジカル種のαSOMO, αSOMO-1, βSOMO, αLUMO, βLUMO, ニュートラル種のHOMO-1, HOMO, LUMO, LUMO+1の各軌道エネルギー値を説明変数としてlogIC50との関係を各種モデルにより機械学習を行った.
各説明変数間の相関係数を計算をしてみると各軌道エネルギー間には相関が高い変数があることがわかる.このような場合に線形重回帰(LM)は適しておらず部分最小自乗法(PLS)を用いるべきだと言われているため,本研究ではPLS, Random Forest (RF), Radial Basis Function Kernel Regularized Least Squares (krlsRadial), ニューラルネット法の一種であるBaysian Regularized Neural Network (brnn)の4種類の回帰法を用いた.
Figure 1にはIC50値の実験値とこれらの回帰法を用いて教師付の学習を行って得られた予測値を示した.いずれの方法によっても相関関係があることがわかる.なお計算に先立ってデータ値の平準化を行っている.Figure 1ではデータ値が-2から2の間になっているのはこのためである.
Plots of Predicted IC50 values versus Experimental IC50 values
おそらくは過学習された結果とは思われるが,random forestおよびbrnnのR2値が0.8以上でkrlsRadialの結果ではR2値はほぼ1となっている.このことから分子軌道計算によるエネルギーや軌道エネルギーを説明変数として使うことでIC50値の予想が行える可能性が高いことがわかり,ドラッグデザイン分野に応用できる可能性があると考えられる.
フェルラ酸の抗酸化作用をあらわすIC50値について分子軌道計算から得られるラジカル体とニュートラル体のエネルギー差および得られた分子軌道エネルギーを説明変数として教師付機械学習を試みた.
4種類の回帰法を使用したが,いずれの方法でもある程度の相関が得られることがわかり,この分子軌道計算と機械学習は強力なツールとなり,ドラッグデザインへの応用が期待できることがわかった.今後は他の誘導体への適用や,より単純な分子物性への適用を予定している.