2007 年 2007 巻 DMSM-A702 号 p. 11-
本研究では,遺伝子発現データをはじめとする,時系列データを対象としたバイクラスタリングについて考察する.時系列性を考慮したバイクラスタリングでは,通常,データ行列の行と列を同時にクラスタリングすることで,ある連続した時間区間において同様の変動を示す個体群を極大バイクラスタとして抽出する.特に,接尾辞木を利用することで,これらはデータ行列サイズの線形オーダで抽出可能なことが知られている.本研究ではこの枠組を拡張し,生物学的により興味あるバイクラスタの抽出を目指す.具体的には,疑似バイクラスタの概念を導入し,ある時間区間まで同様な発現変動を示す遺伝子群が,その後枝分かれをして異なる変動を示す様子を捕まえることを試み,こうした疑似バイクラスタを接尾辞木を用いて抽出する多項式時間アルゴリズムを提案する.ホヤの遺伝子発現データを用いた計算機実験により,期待した様子が観察可能な疑似バイクラスタが得られることを確認する.