2020 年 27 巻 2 号 p. 237-256
単語間の意味関係識別,特に名詞ペアの識別は,言語理解に用いられる WordNet などの語彙知識ベースの自動的な拡充にとって重要である.意味関係識別の効果的なアプローチに,対象の単語ペアとコーパス上で共起した,単語ペアを文中で結びつける単語系列,あるいは依存構造パスなどの関係パタンを用いるものがある.関係パタンは意味関係を反映しているため,意味関係識別に重要な特徴である.関係パタンに基づく手法は,対象の単語ペアのコーパス上での共起を必要とするが,単語の出現頻度分布はジフの法則に従うことが知られており,大抵の内容語は低頻度であるため,この要請は大規模コーパスを扱ったとしても必ずしも満たされるわけではない.本研究では,この問題を解決するために,関係パタンの情報を反映した単語ペアの埋め込み表現を,コーパスから教師なし学習する手法を提案する.本手法はニューラルネットワークで単語ペアと関係パタンの共起を汎化することで,コーパス上で十分に共起しなかったペアに対しても,単語ペア埋め込みを通して関係パタンの情報を意味関係識別モデルに提供する.実験により,本手法による単語ペア埋め込みを最先端の関係パタンに基づく手法に適用すると,4 つの意味関係識別データセットの名詞ペアについて性能が向上し,適切に共起の問題を緩和できていることがわかった.