2025 年 32 巻 4 号 p. 1189-1240
単語の意味や関係性は時間とともに変化する.この現象を単語の通時的な意味変化という.複数時期にわたってどのように意味が変化するのかの理解を目的とした研究は,意味変化の詳細な分析にとって重要である.しかし,隣接する時点間の変化点のみを検出する方法では,詳細な意味変化の分析には不十分である.また,BERTに基づく手法を用いて語義の割合を解析する方法には,計算コストが高くなるという問題が生じる.これらの課題に対処するために,本研究では軽量かつ高速な単語埋め込みを使用し,単語埋め込みに基づく単語の通時的な類似度行列を利用することで,複数の時系列にわたって意味変化のパターンを捉えるフレームワークを提案する.任意の単語に対して,時系列の各時点間で埋め込み間の類似度を算出することで,その類似度の変化パターンを意味変化のパターンとみなし,分析を行うことが可能となる.また,得られた複数の単語の類似度行列をクラスタリングすることにより,教師なしで類似度行列のパターンが似ている単語を算出できる.分析結果より,意味変化している単語と同じパターンである単語や,社会的な要因によって変化したと考えられる単語と同じパターンである単語をグループ化できることを示した.また,英語と日本語のデータセットに対して,複数の時期間隔において実験を行い,フレームワークの有効性とその限界について議論した.