抄録
近年、臨床検体を用いた質量分析機による定量的なプロテオーム解析が盛んに行われ、疾患の早期診断、治療奏効性予測に有用なバイオマーカーの探索が進められている。特にこれら情報に多変量解析による統計技術を応用することで、従来では考えられなかったような高い診断精度が得られることが明らかになってきた。
このようなアプローチを行う場合には、少数例の解析でみられるような症例間の個人差に起因する再現性のないマーカーの混入を防ぐために、大多数症例の測定が要求される。そのため長期間安定的に質量分析機を稼動させ、得られた大量のスペクトラムデータを臨床情報とともに、自動的に整理・保存する必要があることに加え、日常的に計測日間の再現性の確認と補正、質量分析装置の機械間誤差補正などを行う必要がある。
われわれのグループでは、早期膵がん検出血漿マーカー(Honda, et al. Cancer Res. 65:10613, 2005)、食道がんに対する術前科学放射線療法奏効性予測血漿マーカー(Hayashida, et al. Clin. Cancer Res. 11:8042, 2005)、腎細胞がん血清腫瘍マーカー(Hara, et al. J. Urol. 174:1213, 2005)などの開発を手がけてきた。
このような大規模な臨床プロテオームプロジェクトを遂行するにあたり、質量分析装置によって取得された膨大なプロテオーム情報から効率よくマーカー候補を選別するためのコンピューターシステムとソフトウエアの開発にせまられた。今回われわれは、研究グループ内でデータが共用でき、様々なメーカーの高分解能質量分析装置から得られたスペクトラムに対応し、臨床情報とスペクトラムを統合させて保存し、スペクトラ画像の可視化、ベースライン補正、ピーク検出を行い、総強度補正されたピーク強度のデータから機械学習法を使ってマーカー候補を抽出できる統合ソフトウエアNCC-ProteoJudgeの開発を行ったので、その詳細を報告する。