主催: 日本化学会ケモインフォマティクス部会
共催: 奈良先端大データ駆動型サイエンス創造センター
会議名: ケモインフォマティクス討論会
回次: 43
開催地: オンライン
開催日: 2020/12/09 -
p. 1A07-
現在、約13,000化合物に対するAmes試験データを対象としたThe 2nd AMES/QSAR International Challenge Projectが開催されている。本研究は、このAmes試験データを用いたQSAR解析による予測ベンチマークの提示を目的とした。我々は、分子グラフからEnd to End学習により特徴抽出を行うGraph Neural Network、及び化学構造記述子に基づいた機械学習モデル(LightGBM, XGBoost, Neural Network)を用いてQSAR識別モデルを構築した。本研究におけるモデル化スキームとして各モデルの予測値を統合するStacking ensemble法を導入した。本法は、異なる分類器及び分子構造の入力表現を組み合わせることで、予測精度の向上を図れることに動機づけられている。化学構造記述子に基づいた機械学習及びGNNともに良好な予測パフォーマンスを示すモデルを構築することに成功した。これらのモデルのStackingモデルでは予測精度のさらなる向上が確認された。本研究で得られた知見は、変異原性データベースに対するQSARモデルのベンチマークとすることが可能である。