2023 年 30 巻 2 号 p. 275-303
単語は時期や分野の違いによって異なる意味や用例を持つことがあり,自然言語処理の分野では単語分散表現を用いた検出が行われている.最近では文脈の情報を考慮した単語分散表現を生成できる BERT などを用いた研究も盛んに行われているが,大規模な計算資源のない言語学者や社会学者などはこのような手法を適用するのが難しい.本稿では,既存の文書間で同時に単語分散表現を学習する手法を拡張して,2 つの文書間における単語の意味の違いを検出するタスクに取り組んだ.実験の結果より,我々の手法が英語での実験や SemEval-2020 Task 1 だけでなく,これまで行われていない日本語の実験においても既存手法と同等またはそれ以上の性能を示した.また,各手法が単語分散表現の獲得までにかかる訓練時間の比較を行った結果,提案した手法が既存手法よりも高速に学習できることを示した.さらに,提案した単語分散表現獲得手法を用いて,日本語のデータにおいて意味変化した単語や意味変化の種類,傾向などの網羅的な分析も行った.