抄録
本研究ではアミノ酸配列レベルのモチーフ辞書PROSITEに登録されている配列パターンに注目し,これに対応する三次元部分構造情報を網羅的に集積・整理するためのソフトウェアツールの開発を試みた.Protein Data Bankに登録された三次元構造既知のタンパク質構造情報を対象に配列モチーフ部位を検索し,その対応する三次元セグメントの情報を集積する.次に,共通の配列パターンを持つ一群の三次元セグメントに対し,生成した類似度(相違度)行列に基づいて構造群をクラスタリングする.ここで,クラスタリング結果が変化する際の閾値間隔に注目し,それぞれのクラスタリング候補に対する優先度を定義するとともに,PROSITEに登録されている既知のモチーフ情報を利用したクラスタリング結果の絞込みについても併せて検討を行なった.これら一連の手順を自動化し,PDBの全エントリを対象とした三次元モチーフ辞書の構築を試みた.WWWベースのインターフェースツールも併せて開発し,辞書に登録されたモチーフの代表三次元パターンやその由来タンパク質の構造など,容易に検索・参照できるようになった.