2017 年 2017 巻 AM-16 号 p. 01-
逆引き辞書は、ある概念を説明した文を入力するとその文が表す概念に対応する単語を 出力するシステムである。Hill et al. (2016) は辞書データからの学習により、入力文に含まれる単 語列のベクトル群を、行列、あるいは Recurrent Neural Network により変換して、入力文を単語の word2vec 分散表現空間のベクトルとして表現する関数を作成し、この関数によって入力の "解釈” を 行い単語を検索する分散表現逆引き辞書モデルを提案した。本研究は、WordNet で定義されている lexname をカテゴリとして用いて、入力文が表す単語の(人が見れば推定可能な)カテゴリ情報を Hill のモデルが利用できていない可能性を指摘し、仮にこのモデルが正しいカテゴリ内の単語に絞って検 索を行うことができれば精度が大きく向上することを示した。更に、Kim (2014) の Convolutional Neural Network によるテキスト分類を応用してカテゴリ情報を推定する手法、及びそれを用いたカ テゴリ推定分散表現逆引き辞書モデルを提案し、検索精度を向上させることに成功した。