2022 年 21 巻 1 号 p. 20-32
高等生物のゲノム配列にはタンパク質に翻訳されるエクソン領域とそれ以外のイントロン領域が存在し,その複雑な構造の中から機能部位を推定するのは一つの大きな課題である.一方,タンパク質アミノ酸配列にはその機能と密接な関係がある特徴的な配列パターンであるモチーフが保存され,遺伝子配列にもよく保存されていると考えられる.本研究ではコドン縮約表現とその近似表現を用いた,動的計画 (DP) 法によるゲノム機能部位推定システムを開発した.さらに,公共データベースのモチーフ辞書PROSITEのアミノ酸配列モチーフに対応する遺伝子配列を定量的に表現したコドン重み行列を基にした,モチーフコドン縮約表現を提案した.はじめに,HumanのTNNC1ゲノム配列に対してタンパク質のコーディング配列 (CDS) の推定実験を行った.次に,Humanをはじめとするいくつかのモデル生物種のTNNC1とHPCAゲノム配列に対してEF-handモチーフの推定実験を行い,システムの有用性を示した.