自然言語処理において,文の意味推定は重要な課題の一つである.平叙文中における文の数学的表現としては,共起情報やword2vecに代表される分散表現など様々なものが用いられている.しかし,対話文の特徴を考慮した文の数学的表現はほとんど提案されていない.そこで本論文では,対話文特有の特徴を捉えた分散表現を生成するためのニューラルネットワークを新たに提案する.具体的には,word2vecにて使用されている2種類のニューラルネットワークを文生成向けに改良し,組み合わせて使用する.提案ネットワークのうちの一つは再帰型ニューラルネットワークの一種であるLong Short-Term Memoryをエンコーダとして用い発話文を入力し,そこから前後の発話におけるBag-of-Wordsを推定する学習を行う.もう一つのネットワークは,複数の入力文をエンコーダに入力し次に現れる発話文のBag-of-Wordsを推定する学習を行う.これらの学習を行ったエンコーダを組み合わせ,未知の発話文に対する分散表現を生成するニューラルネットワークを構成する.評価実験として,対話破綻検出タスク,ならびに対話行為推定を行い,提案ニューラルネットワークを用いて生成した分散表現の素性としての有効性を検証した.対話破綻検出においては提案手法にて作成した分散表現を素性として用い分類を行うことで,既存手法よりも高い精度が得られた.同様に,対話行為推定においても人手で作成したコーパスを用いて実験を行った.その結果,Bag-of-Wordsや既存の文ベクトル化手法の一つであるParagraph vectorを素性として用いた場合と比較して,提案手法を用いた方がより高い精度を得られた.
抄録全体を表示