抄録
我々は、2300枚を越える公的に利用可能なAffymetrix ATH1 GeneChipを整理し、特異値分解 (SVD) によるデータ次元圧縮を施すことが、個々の遺伝子間共発現関係の強調化に対応することを見出した。これは次元圧縮が、遺伝子機能の予測向上へ寄与することを示唆している。具体例として、次元圧縮の目安である特異値の上位40個によって再構成したデータ行列では、主要な概日時計関連遺伝子群やPMG1 (Myb28) といった転写因子遺伝子群の共発現関係がより強まっていた。また、選択した特異値と元のアレイデータセットとの対応付けを行い、これによってshoot, root, stamenといった組織特異的なデータセットの重要性も示された。
遺伝子間共発現関係の推定は計算の元となるデータセットの質と多様性に大きく依存している。現存する共発現データベース群は、アレイプラットフォームの相違の存在や多様なデータセット、複数の推定手法 (ピアソン相関あるいは順位相関) を用いているために、相互に直接比較が行えず、その計算方法もまた厳密に評価されていない。したがって、我々の行った共発現計算の評価は、植物の生理現象を解明する上でトランスクリプトーム実験をする際の指針となり、機能ゲノミクスにおける他のオミックスデータを用いた相関関係計算においても有益な基準になると考えられる。