主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
近年、単語をベクトルで表す「分散表現」を利用することでコンピュータが言語の意味を扱いやすくなった。しかし、多義語については語義曖昧性解消という課題が残っている。語義曖昧性解消とは複数の語義をもつ多義語において、文中でどの語義として利用されているかを判別することであり、コンピュータが言語の意味を扱うために重要なタスクである。本研究では、日本語の語義曖昧性解消を目的として、異なる語義のクラスタ間分散を大きくし、クラスタ内では分散が小さくなるように単語の分散表現を生成する方法を提案する。提案するモデルは分散表現の生成時に、従来の入力に加え、分散表現を作成したい多義語を含む段落の前後の段落を入力するモデルである。語義曖昧性解消の対象とした単語の分散表現を従来の手法と提案手法によって生成し、語義数を岩波国語辞典に掲載されている語義数でクラスタ数を指定した階層型クラスタリングを行った。2つの分散表現のクラスタ間分散とクラスタ内の値を比較したところ、提案手法による分散表現の方が優れた値を示した。