抄録
ゲノム解析技術の進歩により近年, 各個人の体内に各細菌がどの程度の割合存在するかについてのデータが得られるようになった. それに伴い細菌データの解析手法も多く提案されており, その1つとしてトピックモデルが用いられる場合がある. 時系列で細菌データが取得されている場合には, 動的トピックモデルなど時系列データに対する既存のトピックモデルを援用することが考えられる. トピックモデルではトピック数を任意の値に設定する必要があるが, モデルをノンパラメトリックベイズモデルに拡張することで, データに応じたトピック数の推定が可能となり, より臨床的な解釈が容易となることが考えられる. そこで本研究では動的トピックモデルを拡張することで, 時系列で測定された細菌データに対するノンパラメトリックベイズトピックモデルを提案し, 実際の細菌データを用いて既存手法と性能を比較評価した. 性能評価の結果, 提案法を用いることで設定するトピック数によらず少数のトピックの割合のみが大きくなり, データに応じてトピック数を自動的に推定可能となることが示唆された.