2018 年 25 巻 5 号 p. 511-525
ニューラル機械翻訳では,従来の統計的機械翻訳に比べ文法的に流暢な文が生成されるが,出力結果に未知語が含まれることがしばしば指摘される.この問題に対処する方法としては,学習コーパス中の低頻度語を分割したり,未知語に位置情報を付け加えるなどの方法があるが,どれも日英翻訳では効果が低い.そこで本論文では,アテンションから構成した単語アライメント表を用いて出力文中の未知語と対応する入力文中の単語を見つけ,その単語を翻訳した単語で未知語を置き換えることで未知語をなくす手法を提案する.本論文の有効性を示すために ASPEC, NTCIR-10 の 2 種類のコーパスを用いて実験を行った結果,本論文で提案する単語アライメント表の構成法を用いると,未知語を全く発生させず,かつ,BLEU 値を向上させることができた.