主催: 一般社団法人 人工知能学会
会議名: 第34回全国大会(2020)
回次: 34
開催地: Online
開催日: 2020/06/09 - 2020/06/12
話題抽出手法の一つである独立話題分析では,適用した文書データ内において互いに独立な話題を抽出することができる.しかし時間の経過に伴った独立話題の変化に関しては考慮されていない.一方でニュース記事やSNSの投稿などの文書データ内の話題は時間の経過とともに変化する.例えば,東京オリンピックに関する話題は招致の立候補に始まり,開催の決定,ロゴの問題,マラソン会場の変更のように時間とともに変化している.そこで時間の経過に伴った独立話題の変化を追跡できる方法が提案されている.その手法では時刻tで抽出した独立話題と,時刻t+1で抽出した独立話題の類似性を計算する.その類似性に基づいた話題の変化として,話題の統合,分離,出現,消滅,復活の5つを定義されている.本研究ではこの提案されている話題追跡手法を実装し,類似度指標のユーザによる評価と提案されている話題追跡手法と既存手法である単語の出現頻度による話題追跡手法との比較を行った.ユーザによる評価の結果,独立話題の類似度にはコサイン類似度が適していることが示され,それを用いた手法の比較では既存手法よりも的確に話題を追跡できることを確認した.