抄録
DNAマイクロアレイは生理活性化学物や遺伝子の機能解析に広く用いられている。Gene Expression Omnibus (GEO) 等のアレイデータの一次データベースには既に多様な実験データが公開されている。羅病による遺伝子の発現変動のような、研究ターゲットとするプロファイルと、これらの公開データの遺伝子発現プロファイルの比較解析は、創薬や遺伝子機能を推定するin silicoスクリーニング法として有効と考えられる。しかしながらマイクロアレイデータには実験環境やサンプルに起因する多くの情報(ノイズ)が含まれているため、大規模な実験セットの横断的な解析は精度が低い。
そこで、処理特異的に変動するマーカー遺伝子群 (module) の発現プロファイルを用いて実験データの類似性を調べるCo-module解析を発展させ、実験データの生理的なつながりを網羅的に表すネットワーク型解析法を開発した。モデルには、均質で大規模なマイクロアレイ実験データAtGenExpressが整備されているシロイヌナズナを用いた。解析の結果、本手法は従来型のクラスター解析では検出できなかった部分的な相似性や負の関係性も検出し、既知の植物ホルモンと阻害剤の関係性などが精度よく検出されることを実証した。本解析結果を公開したデータベース及び、これを用いたスクリーニングによって得られた新奇知見についても報告する。