標的タンパク質の受容体のタンパク質構造を特定し,対象となる被験物セットを定めたとき,
in silico法の1つであるDOCKによるスクリーニングを行うと,単純に
in vitro試験を用いるのに比べて,活性化合物選択がどれくらい効率化できるか,またそのためにはDOCKの出力変数をどのように利用するのがよいかを統計学的に検討した。検討では,327個の化合物のDOCK出力データと,ある基質に対して酵素反応を起こさせて生成物を測定する
in vitro試験のデータを用い,
in vitro試験で活性が50%以上のものを活性化合物とした。各被験物に対する108個のDOCK出力変数の中で相互に相関が高いものを一つの変数で代表させ,ロジスティック回帰モデルの変数増減法でゆるやかな変数選択,あるいは厳しい変数選択を行ったところ,それぞれ16個,3個の変数が選ばれた。これらの変数を用いてロジスティック回帰式でスクリーニングをしたときの性能評価を,ジャックナイフ法 (1個の測定値を除いた残りの測定値で除いた測定値を予測する性能評価法) で行ったところ,DOCKを用いた
in silicoスクリーニングで被験物を約80%削減しても,感度80%,偽陽性率15%が確保できるという結果を得た。ロジスティック回帰による予測モデルを用いた
in silicoスクリーニングは有用である。
抄録全体を表示