抄録
近年,ブログやtwitterなどの普及により,インターネット上には膨大な量の文書が投稿されている.しかし,それらの文書は無秩序に投稿されているため,所望の文書を効率的に検索することは容易ではない.そのため,多くの場合,人手により文書へのタグ付与がなされている.しかし,特にtwitterなど,タグが付与されていない文書もまだ多く,これら膨大な文書に対して管理者や投稿者がタグ付与を行うことは負担となる.そこで本稿では,潜在的なトピックを用いた文書への自動タグ付与システムを提案する.本稿では,実際のブログ文書に対してタグ付与実験を行い,提案システムの性能を評価する.