2022 年 34 巻 3 号 p. 619-623
本研究では,対話文における同じ話題の区間に対して話題語をラベル付けする手法を提案する.まず,人がどのように話題語をラベル付けするかを調査した.その結果,話題が開始した最初の文に含まれる語や,区間全体に現れる語から連想される語が話題語として付与されていることがわかった.また,区間内の単語の出現頻度を基にラベル付けした場合は,他の話題にも表れるような特徴的でない言葉が出力されてしまうことがわかった.そこで,今回は区間の最初の文においてTF-IDFが高い語を話題語の候補として取得したうえで,話題に関係なく現れる語を除くためにDFを用いたストップワードを設定した.提案手法を用いて話題語のラベル付けをし,人の付与したラベルと比較する評価実験を行った結果,ラベル付けの精度向上を確認できた.