人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 3R1-GS-3-04
会議情報

日本語語義曖昧性解消のための前後段落を利用した単語分散表現の生成
*前原 太陽竹中 要一
著者情報
会議録・要旨集 フリー

詳細
抄録

近年、単語をベクトルで表す「分散表現」を利用することでコンピュータが言語の意味を扱いやすくなった。しかし、多義語については語義曖昧性解消という課題が残っている。語義曖昧性解消とは複数の語義をもつ多義語において、文中でどの語義として利用されているかを判別することであり、コンピュータが言語の意味を扱うために重要なタスクである。本研究では、日本語の語義曖昧性解消を目的として、異なる語義のクラスタ間分散を大きくし、クラスタ内では分散が小さくなるように単語の分散表現を生成する方法を提案する。提案するモデルは分散表現の生成時に、従来の入力に加え、分散表現を作成したい多義語を含む段落の前後の段落を入力するモデルである。語義曖昧性解消の対象とした単語の分散表現を従来の手法と提案手法によって生成し、語義数を岩波国語辞典に掲載されている語義数でクラスタ数を指定した階層型クラスタリングを行った。2つの分散表現のクラスタ間分散とクラスタ内の値を比較したところ、提案手法による分散表現の方が優れた値を示した。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top