抄録
タイリングアレイは、遺伝子をゲノムワイドに解析でき、また各遺伝子の発現を定量的に比較できる。そこでToyoda and Sinozaki は、タイリングアレイによるゲノムワイドな遺伝子構造予測プログラムであるARTADE法を開発した。この手法を基にシロイヌナズナの大量の新規ノンコーディングRNAの同定に成功した。しかし、ARTADEは塩基配列の推移にマルコフモデルを仮定するがプローブ間のタイリングアレイは独立とするため、ノイズを含むプローブによる精度低下を除去できない。また、タイリングアレイデータをそのまま長大な1次元配列データとするため、密集する複数の遺伝子の分離が困難である。これらの問題の克服には、プローブ間の関係性を考慮する必要がある。そこで様々なコンディション下(18種)でのタイリングアレイ実験データ(計55実験)を重ね合わせて多重次元データを構成し、そこから導き出されるプローブ間の相関スコアを基にした遺伝子構造の確率モデルを提案する。提案手法(ARTADE2.0)によりプローブのノイズ問題を克服し、終端予測において前手法を大きく上回る精度を示した。またARTADE2.0における、シロイヌナズナの新規遺伝子発見結果・オルタナティブスプライシング解析についても述べる。