人工知能学会第二種研究会資料
Online ISSN : 2436-5556
カテゴリ情報を付与した文の分散表現による逆引き辞書の精度向上
森永 雄也山口 和紀
著者情報
研究報告書・技術報告書 フリー

2017 年 2017 巻 AM-16 号 p. 01-

詳細
抄録

逆引き辞書は、ある概念を説明した文を入力するとその文が表す概念に対応する単語を 出力するシステムである。Hill et al. (2016) は辞書データからの学習により、入力文に含まれる単 語列のベクトル群を、行列、あるいは Recurrent Neural Network により変換して、入力文を単語の word2vec 分散表現空間のベクトルとして表現する関数を作成し、この関数によって入力の "解釈” を 行い単語を検索する分散表現逆引き辞書モデルを提案した。本研究は、WordNet で定義されている lexname をカテゴリとして用いて、入力文が表す単語の(人が見れば推定可能な)カテゴリ情報を Hill のモデルが利用できていない可能性を指摘し、仮にこのモデルが正しいカテゴリ内の単語に絞って検 索を行うことができれば精度が大きく向上することを示した。更に、Kim (2014) の Convolutional Neural Network によるテキスト分類を応用してカテゴリ情報を推定する手法、及びそれを用いたカ テゴリ推定分散表現逆引き辞書モデルを提案し、検索精度を向上させることに成功した。

著者関連情報
© 2017 著作者
次の記事
feedback
Top