Journal of Computer Aided Chemistry
Online ISSN : 1345-8647
ISSN-L : 1345-8647
アンサンブル学習による有機化合物の変異原性予測
荒川 正幹船津 公人
著者情報
ジャーナル フリー

2011 年 12 巻 p. 26-36

詳細
抄録

本研究では、有機化合物の変異原性を予測するためのクラス分類モデルの構築を行った。変異原性を評価するための標準的な方法である復帰突然変異試験を対象とし、その評価結果を高い精度で予測することの出来るモデルの構築を目指した。クラス分類モデル構築のための手法として、複数のSupport Vector Machine(SVM)モデルをサブモデルとして構築し、それらを組み合わせることで予測を行うアンサンブル手法を提案する。データセットから一部の化合物および構造記述子をランダムに抜き出し、SVMを用いてサブモデルを構築する。このとき、SVMのパラメータについても乱数によって無作為に決定する。この操作を複数回繰り返した後、精度の高いサブモデルの予測結果を統合することで変異原性の予測を行う。Hansenら[K. Hansen, et al., J. Chem. Inf. Model., 49, 2077-2081] が収集・整理した、6,512化合物からなる復帰突然変異試験のデータセットを用い、モデルの構築および評価を行った。その結果、テストセットに対する予測正解率79.6%のモデルを構築することに成功した。これは、通常のSVMによって得られるモデルと比較し高い精度を示すものであった。また、The Area Under ROC-Curve(AUC)は0.866であり、Hansenらの結果と同等以上の結果であることが確認された。これらのことから、変異原性の予測にあたってはSVMおよびアンサンブルモデルを用いることが有力であるとの結論が得られた。

著者関連情報
© 2011 日本化学会
前の記事 次の記事
feedback
Top