DNAマイクロアレイデータに基づく未知サンプルの病理学的診断の試みは、遺伝子発現情報解析の主要トピックの一つである。ここでいう外れサンプルとは、間違ったラベルがつけられるか或いは他のサンプルに比して極端に異質性が高いものを指し、その遺伝子発現プロファイルはそれ以外のサンプル群に比べて極端に異なっていることが確認されている。そのため、外れサンプルは、診断に用いる“疾患感受性候補遺伝子群の抽出”に悪影響を及ぼすことが想定される。本論文では、赤池情報量規準にヒントを得た外れ値検出法を適用し、検出された外れサンプルについてその影響評価を行ったので報告する。今回用いた方法の主な長所は、危険率設定(5%、1%等)の手続きを必要とせず、統一的且つ客観的な検出が行える点である。本手法を癌及び正常サンプルのアレイデータ(計62例)にそれぞれ適用した結果、計7例を外れサンプルとして検出した。これらを除く残りの55例をもとに、抽出した疾患感受性候補遺伝子群の二群間で発現プロファイルが異なる度合い及びそれらを用いた交差確認による診断精度は、全62例を用いた場合に比べて高いことが確認された。さらに、検出された7例中5例は以前の解析結果から異質性が示唆されたものであった。このことから、アレイデータを用いた病理診断を行う上で、予め外れサンプルを検出することの重要性、及びそれを達成する上で本手法が有効であることが示された。
抄録全体を表示