日本応用数理学会論文誌
Online ISSN : 2424-0982
ISSN-L : 0917-2246
PMM型主成分分析を用いた文書ストリームの主要潜在トピック抽出(実用)
木村 昌弘斉藤 和巳
著者情報
ジャーナル フリー

2008 年 18 巻 3 号 p. 363-388

詳細
抄録
文書ストリームデータにおける主要潜在トピックの抽出を,文書のBOW表現に基づいて効率よく行う,PMM-PCA法と呼ぶ新たな教師なし学習法を提案する.PMM-PCA法は,PCA法と異なり,単語頻度ベクトル群の時系列として表現された文書ストリームデータに対して,その適切な確率的生成モデルに従うという性質を有している.実際の文書ストリームデータを用いた実験により,提案法の有効性を実証する.
著者関連情報
© 2008 一般社団法人 日本応用数理学会
前の記事 次の記事
feedback
Top