2019 年 26 巻 4 号 p. 689-710
近年,多くの自然言語処理タスクにおいて単語分散表現が利用されている.しかし,各単語に 1 つの分散表現を生成するアプローチでは,多義語における各語義が一つの分散表現に集約されてしまい,それらを区別することができない.そのため,先行研究では品詞やトピックごとに異なる分散表現を生成するが,語義を区別するには粒度が粗いという課題がある.そこで,本研究では各単語に対してより粒度の細かい複数の分散表現を生成するための 2 つの手法を提案する.1 つ目は,依存関係にある単語を手がかりとして,予め複数の分散表現を生成しておく手法である.2 つ目は,文脈中の全ての単語を考慮して語義に対応する分散表現を動的に生成する双方向言語モデルを利用する手法である.単語間の意味的類似度推定タスクおよび語彙的換言タスクにおける評価実験の結果,より細かい粒度で分散表現を生成する提案手法が先行研究よりも高い性能を発揮することを示した.