近年の深層学習の発展は毒性学の分野にも大きな影響を与えつつある。特に2017年に提案されたノードやグラフの潜在ベクトルを学習する標準的なGCN(Graph Convolutional Networks)によって畳み込みのみで実用的な計算量でのグラフ構造の学習が可能になった。化学構造をグラフとして捉えることで化学構造そのものをAIが学習することができる。さらに最近の研究によってこれまで外部からは観測不可能とされてきたAIの判断プロセス、つまり予測の根拠を可視化する問題が部分的ではあるが解決しつつある。本研究では小島・奥野らが開発したkGCNを用いて化合物の構造から遺伝毒性(AMES)を判別するAIモデルの構築を試みた。kGCNでは可視化の手段としてIntegrated Gradients法を採用しAIモデルが注目している化合物構造の位置を視覚的に表示させることができる。今回3種類の公開AMESデータ(Benchmark set, NTP-AMESデータ、PubChem GeneTox)を収集して3種類のデータセット(Benchmark set, All, NTP-AMES S9_minus)を構築した。kGCNを用いてこれらのデータの解析を実施した。その結果高いaccuracyを持つ判別モデルを得ることができた。本解析結果について可視化された化合物構造と共に報告する。
謝辞:本研究はAMEDの「創薬支援推進事業-産学連携による次世代創薬AI開発-(DAIIA)」(課題番号21nk0101111h0102)の支援を受けた。