抄録
配列が決められたゲノムにコードされたタンパク質を比較し,相同タンパク質を簡単に検索するデータベースとして,Gclustサーバーを公開したので紹介する(http://gclust.c.u-tokyo.ac.jp/)。このデータベースにはさまざまな生物のデータを集めているが,特に植物やシアノバクテリアのタンパク質に関して調べるのに有用である。データベース構築の方法としては,ゲノムにコードされた全タンパク質を集め,総当たりBLASTPを行った。その結果をGclustソフトウェアによってクラスタリングし,系統ごとの保存性で整理したものを,サーバーに載せた。サーバー上では,キーワードによる配列検索,BLASTによる配列検索などが可能で,これによって得られた配列が所属するクラスタを表示し,さらにアラインメントや簡易系統樹が見られる。クラスタとして分割されていても類似性のある配列は,関連グループとして表示される。系統プロファイルを利用する点がこのデータベースの特徴で,生物群特異的に保存されているタンパク質グループを簡単に検索することができる。これを用いて,シアノバクテリアから共生によって植物に持ち込まれた遺伝子の推定などができている。