抄録
生化学的特徴を上手く表現するためにこれまでに、分子フィンガープリントのような様々な化学的記述子が考えられている。しかしながら、分子構造から生物活性を予測することは、それらの化学的記述子の選択に依存するので、依然として非常に難しい問題である。近年、与えられた訓練セットからの分子特徴抽出のためのモデルを自動的に最適化することができるグラフ畳み込みネットワーク(GCN)に基づく手法が提案されている。本研究では、植物における二次代謝産物群の一つであるアルカロイドの代謝経路を予測するために用いた。アルカロイド化合物についてGCNモデルを適用したところ、予測の平均精度が約95%という結果が得られ、非常に高い精度で予測可能であることが確認できた。この結果により、本研究で用いたGCNを用いた代謝経路予測の手法は、生物が固有に有する代謝系の進化を理解することにつながると期待される。