2024 年 31 巻 2 号 p. 568-589
自然言語処理技術を開発する上でシソーラスから得られる意味知識は有用であり,現在までに日本語では単語同士を対象として上位下位関係や同義関係,類義関係等の獲得を目的とした研究が行われている.しかし,既存研究では主に単語間の関係を検出することに注目し,語義を対象とした類義関係の検出は行われていない.この問題に対処するため,本研究では日本語辞書に記述された語義定義文と Sentence-BERT を用いた類義判定手法を提案する.単語間の類義関係に着目し,「うまい」の語義「よい。すぐれている。」と「じょうず」の語義「ある物事をする技術がすぐれていること。」の様な単語の語義を対象に類義であるか否かの類義判定を行う.岩波国語辞典の見出し語,語義定義文及び分類語彙表の分類番号を用いて作成した評価データセットを対象として,学習データを用いて fine-tuning した類義判定モデルによる類義判定実験を行った.実験の結果,提案手法における Sentence-BERT や変更した語義定義文を用いることによって,ベースライン手法よりも効果的に類義判定ができることを示した.