経営情報学会 全国研究発表大会要旨集
2009年秋季全国研究発表大会
セッションID: B4-2
会議情報

オンラインメディアにおける周期的トピックの抽出
*石田 和成
著者情報
会議録・要旨集 フリー

詳細
抄録

ブログ,ニュース,スパムのキーワード時系列データにおいて,自己相関にもとづき,各情報源の周期的話題の分析を行った.そのため,独自で継続的に収集しているブログとニュースのデータを用いた.また,独自に開発したスパム分離手法により,収集したブログからスパムを分離し,スパムのデータとして用いた.これら時系列データの違いを調べるために,自己相関にもとづくキーワードの文書頻度の基本周期系列抽出アルゴリズムを開発した.このアルゴリズムを用いて周期の分布や,7日周期および365日周期のキーワードの抽出を行った.その結果,ブログは毎週のテレビ番組や週末の趣味や年中行事,ニュースは政府や経済,スパムはメルマガやアフィリエイトの話題が多いことが分かった.

著者関連情報
© 2009 経営情報学会
前の記事 次の記事
feedback
Top