抄録
理研PSCでは、植物比較ゲノム情報基盤の整備を推進している。このたび、ゲノム概要配列が公開された主要マメ科植物のダイズ(Glycine max)、ミヤコグサ(Lotus japonicus)、タルウマゴヤシ(Medicago truncatula)の、予測遺伝子モデル情報から転写因子ファミリーを計算機的に予測し、マメ科転写因子データベースLegumeTFDBを作成した。ダイズ、ミヤコグサ、タルウマゴヤシそれぞれのゲノム中に、各転写因子ドメインに特徴的な隠れマルコフモデルを用いた検索によって予測された転写因子数(割合)は、それぞれ5035(6.64%),1626 (3.83%),1467(3.78%)であった。本DBは、これらの転写因子について、予測遺伝子機能、遺伝子構造、ドメイン構成、Gene Ontologyなどの機能アノテーションとともに、シロイヌナズナ、イネ、ポプラといったモデル植物との比較ゲノム情報を提供する。また、予測されたそれぞれの転写因子の転写上流域に対して、PLACEデータベースから提供されるcis-motifの検索を行い、その分布をDBに実装した。LegumeTFDBはWeb上からアクセスできるDBとして、機能アノテーションやcis-mtifをクエリとした多様な検索インタフェースを実装し、マメ科植物の転写制御ネットワークの解明に有用な情報基盤として機能する。