抄録
常に100%分類を実現するKY法(K-step Yard sampling method)を開発し、このKY法を大量のAmes試験データの2クラス分類(Mutagen/Non-Mutagen)に適用した。この結果、完全分類に成功したので報告する。
コンピュータによる化合物の安全性予測に求められる最大の要求事項は、高い予測率の実現である。この予測率を上げる前提条件として分類率の向上がある。これは、データ解析において予測率は分類率を越えることが無いという大原則に基づいたものである。
湯田は完全分類実現を目的とし、従来とは全く異なるアプローチを取るKY法を開発した。このKY法を、約7000サンプルのAmes試験データに適用し、実際に100%分類を実現することを示した。KY法の基本原理より、サンプル数がどんなに増えても常に100%分類が可能であることがわかる。今後、環境関連の政府規制強化等に伴い、サンプル数や安全性データの急激な拡大が見込まれるが、このような環境にも適用可能な手法である。
ポスターではKY法の説明と、7000サンプルを用いたAmes試験データの100%分類結果の考察と、更なる予測率向上に向けた新たなアプローチとなる「テーラーメード・モデリング」について概要を簡単にまとめて発表する。