抄録
SELDI-TOF-MS(表面増強レーザー脱離イオン化-飛行時間型質量分析計)では、一つのサンプルの測定結果に対し、数十から100以上のピークが得られるため、疾患判別モデルの構築に先立ち、有用なピークを抽出する属性選択が必要である。一般的な属性選択法はフィルター法とラッパー法に大別することができ、前者はある閾値以上のクラス分離能力を持つものを単変量的に抽出する方法であり、後者は実際に判別モデルを構築して判別能力の高い属性の組み合わせを探索するものである。
本研究では、フィルター法とラッパー法を組み合わせることにより、効果的な疾患判別モデルの構築を試みた。フィルター法では2群の平均の倍差を評価するfold-changeと、ノンパラメトリックな検定法の一つである並べ替え検定を用いた。また、ラッパー法では、フィルター法で得られた属性セットに対し、推定エラー率の減少が見込めなくなるまで属性の絞り込みを行った。推定エラー率は、各種判別手法(線形サポートベクターマシンや重み付け多数決)と.632 ブートストラップ法を組み合わせることで求めた。
手法の評価には、千葉大学医学部付属病院 検査部から提供を受けた、2種類の条件(常習飲酒-非飲酒群、肝癌患者-肝硬変患者-健常人)、各群約30(範囲: 29から32)の血清サンプルをSELDI-TOF-MSにより測定したマススペクトルを用いた。それぞれのサンプル群を学習データとテストデータに二分し、学習データにより得られた判別モデルをテストデータに適用することにより、バリデーションを行った。その結果、元の半数以下の属性だけを用いた判別により、全ての属性を用いた場合とおおむね同等の感度および特異度が得られた。