主催: 人工知能学会
会議名: 第92回 言語・音声理解と対話処理研究会
回次: 92
開催地: オンライン
開催日: 2021/09/03
p. 07-
概念識別子とWord2Vecを用いた語義曖昧性解消手法について述べる。EDR電子化辞書の日本語単語辞書には、単語の語義を6桁の16進数で表した概念識別子が与えられている。この概念識別子の分散表現を用いることで、1つの単語が複数の分散表現を持つため、単語の分散表現とは異なり、語義を区別できると考えた。この手法の先行研究では、59.5%の正解率を記録していたが、獲得した分散表現の精度に課題があった。そこで、より意味を表した分散表現を獲得するために、文の依存構造を用いて改良し、精度向上を目指した。結果として、正解率は60.1%となり、0.6ポイント上昇した。正解率に大きな変化がなかった原因として、使用した概念識別子の精度が悪かったことが挙げられる。学習がうまく出来ていなかったため、概念識別子を修正してから用いることで、精度を向上できるのではないかと見込んでいる。