抄録
シロイヌナズナ、イネのプロモーター配列の統計解析を行い、プロモーター上の特定の場所で現れる配列をプロモーター構成配列として抽出した。抽出された8塩基配列はゲノム当たり1,000個程度であり、TATAボックスや転写開始点のコンセンサス配列であるInr、様々な既知の転写制御配列に加え、新規のコアプロモーター配列や転写制御配列の候補が多数同定されている。抽出された配列の局在性を表すシグナル強度と生体内での機能性(遺伝子発現量)との間に強い相関が確認されており、この手法の有効性が示されている(Yamamoto et al, Nucleic Acids Res 35: 6219, 2007 )。抽出された配列を有効に利用するために、シロイヌナズナ、イネのゲノム配列にこれらのプロモーター構成配列をマッピングし、プロモーターデータベースとして利用出来るようにした。配列の検出には主要転写開始点からの位置を考慮しており、独自に同定した高密度転写開始点情報を元にしている。開発したデータベースにより植物遺伝子のプロモーター構造が高感度に認識出来る。アドレスはhttp://ppdb.gene.nagoya-u.ac.jp。2007年6月末の開設以来数ヶ月の間に、世界39カ国、10万アクセスを超える利用があった。