カテゴリ情報を付与した文の分散表現による逆引き辞書の精度向上

森永 雄也; 山口 和紀

doi:10.11517/jsaisigtwo.2017.AM-16_01

抄録

逆引き辞書は、ある概念を説明した文を入力するとその文が表す概念に対応する単語を出力するシステムである。Hill et al. (2016) は辞書データからの学習により、入力文に含まれる単語列のベクトル群を、行列、あるいは Recurrent Neural Network により変換して、入力文を単語の word2vec 分散表現空間のベクトルとして表現する関数を作成し、この関数によって入力の "解釈” を行い単語を検索する分散表現逆引き辞書モデルを提案した。本研究は、WordNet で定義されている lexname をカテゴリとして用いて、入力文が表す単語の（人が見れば推定可能な）カテゴリ情報を Hill のモデルが利用できていない可能性を指摘し、仮にこのモデルが正しいカテゴリ内の単語に絞って検索を行うことができれば精度が大きく向上することを示した。更に、Kim (2014) の Convolutional Neural Network によるテキスト分類を応用してカテゴリ情報を推定する手法、及びそれを用いたカテゴリ推定分散表現逆引き辞書モデルを提案し、検索精度を向上させることに成功した。

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

第二種研究会の全記事は認証なしでアクセス可能です．また，各記事の著作権は原則として著者に帰属します．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）