Journal of Computer Aided Chemistry
Online ISSN : 1345-8647
ISSN-L : 1345-8647
遺伝的アルゴリズムとカウンタープロパゲーションニューラルネットワークによる構造活性データの非線形モデリング
長谷川 清細田 武宏船津 公人
著者情報
キーワード: PLS, CNN, GA, QSAR, Phenylalkylamines
ジャーナル フリー

2001 年 2 巻 p. 11-20

詳細
抄録

部分最小2乗法 (PLS: Partial Least Squares Regression)は、パラメータ間の共線性が強いあるいは解析化合物の数がパラメータ数より少ないといった場合でも威力を発揮し、現在多くのQSAR研究に利用されている。PLSは有用な手法であるが反面、化学構造と生物活性が線形関係の場合にしか適用できないという問題点を持っている。構造活性データは非線形関係を内在的に有していることが多く、そのようなデータを包括的にモデリングできる手法が求められてきた。このような流れの中で、代表的な手法としてバックプロパゲーションニューラルネットワーク(BNN: Back Propagation Neural Network)が利用されるようになり、さらにBNNと比較して学習の収束時間が短くかつ再現性が高い方法としてカウンタープロパゲーションニューラルネットワーク(CNN: Counter Propagation Neural Network) が注目を集めている。本研究では、非線形の構造活性データを解析するためにCNNを採用した。さらに、膨大な変数組み合わせの中から効率的に最適解を導くために、遺伝的アルゴリズム(GA: Genetic Algorithm)と組み合わせ、変数選択を行なうことを考えた。GAの評価値として、予測セットに対する予測的相関係数値(Rpred2)を用いた。解析データとして、フェニルアルキルアミンの幻覚作用データを用いた。GAにより、全15変数から9変数まで変数を減らすことができ、予測セットに対する予測能力は飛躍的に向上した。さらに得られた最適CNNモデルで外部バリデーションを実施したところ、全変数を使った場合に比べて予測値は実測値に非常に近いものとなった。

著者関連情報
© 2001 日本化学会
前の記事 次の記事
feedback
Top