現在、医薬品をはじめとする化学物質の安全性は主に動物実験やヒト臨床試験の結果をもとに評価されているが、動物愛護・動物福祉、開発コスト、開発の効率化などの観点からインビトロ試験やインシリコ手法による動物実験代替法の開発が望まれている。特に、近年の機械学習法技術の発達に伴い、スループットが高く、化学物質の合成を必要としないインシリコ手法による代替法に期待が寄せられている。一方で、機械学習モデルの構築には多数の教師データが必要であるが、入手可能な動物実験データの数は限られており、機械学習が応用されている他の領域に比べると、毒性データの数は圧倒的に少ない。例えば、我が国で開発された有害性評価支援システム統合プラットフォーム(HESS)に含まれる反復投与毒性試験のデータは1000程度であり、試験期間や評価項目の統一性などを考慮すると使用可能な試験・物質数はさらに少なくなる。また、社会的背景から、今後動物試験データが劇的に増える可能性も低い。このような背景から、インシリコ手法とインビトロ試験を組み合わせた毒性予測が現実的な手法と考えられ、演者らもそのような研究に取り組んでいる。では、限られた毒性試験データを用いてインシリコ手法で何ができるのであろうか。演者らは、HESSのラット反復投与毒性試験データを活用して、貧血を誘発する化学物質の構造的特徴の解析と予測モデルの構築を試みている。アニリンは貧血を誘発する典型的な化学物質であるが、置換基が貧血発現に及ぼす影響はよく分かっていない。他方、米国FDAが公開している薬剤誘発性肝障害データ(約600化合物)と分子記述子を用いた同様の解析も進めている。本講演ではこれらの取り組みを紹介しするとともに、毒性スモールデータで何ができるのか、何ができないのか、この問題を解決するにはどうすべきかなどを議論したい。