抄録
ラン藻は、形態、運動能や窒素固定能など多様な生物学的な特徴を有し生育環境も多岐に渡る。古典的な形態による分類から150属1500種以上が存在すると考えられている。近年、世界中でラン藻のゲノムプロジェクトが進行しており、20種類以上のラン藻ゲノム配列が決定されつつあり、ゲノム解析のモデルとして適している。そこで、我々はタンパク質ドメインデーターベースのPfamにより系統プロファイルから遺伝子クラスタリング行い、各々の生物の生育環境や、生物学的特徴を指標として整理しなおすことにより生物学的な知見の抽出と機能未知遺伝子の機能推定を試みた。
14種のラン藻ゲノム配列に対してPfam_lsによりhmmpfamサーチを行った。その結果、14種のラン藻に約2000種類のPfmaドメインが存在することが分かった。各Pfamドメインの種ごとの系統プロファイルから階層的クラスタリングを行った。その結果、外界や細胞内の環境変化の受容体として働くと考えられるドメイン(GAF, PAS, など)や信号伝達に関与するドメイン(二成分制御系)、また転写因子などは、種によってドメインの数が著しく異なるクラスターに分類された。これらのドメイン数の重複と種ごとの生育環境の違いの間に相関を見いだした。さらに、機能未知ドメインのなかに窒素固定能やヘテロシスト分化能に関連するものの存在を予測した。