Journal of Computer Chemistry, Japan
Online ISSN : 1347-3824
Print ISSN : 1347-1767
ISSN-L : 1347-1767
研究論文
系列二分決定グラフを用いたタンパク質配列モチーフの多重表現
大和 康平加藤 博明桂樹 哲雄高橋 由雅
著者情報
ジャーナル フリー HTML

2020 年 19 巻 1 号 p. 8-17

詳細
抄録

本稿では,系列二分決定グラフ(SeqBDD)を用いたタンパク質配列モチーフの多重表現とそのモチーフ検索への応用について述べる.SeqBDDは,複数の文字列のような配列集合の圧縮表現である.本研究では,SeqBDDのための二つのアルゴリズムを開発した.一つ目は,対応するモチーフのアミノ酸配列を表現するSeqBDDを構築するためのもので,二つ目は状態遷移を追加することにより,SeqBDDのための決定性有限オートマトン(DFA)に相当するオートマトンを構築するためのものである.性能評価のために,マトリクスメタロプロテアーゼ(MMP)ファミリーにおいて保存されている三つのドメインを,UniProtKB/Swiss-Prot (Rel. 2017_09)から得られた555,594の全てのアミノ酸配列に対して検索した.PROSITEパターンを使用した同様の検索結果と比較して,本手法は,適合率,再現率,およびF値において良好な結果を示した.

Fullsize Image
著者関連情報
© 2020 日本コンピュータ化学会
前の記事 次の記事
feedback
Top