自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
日英ニューラル機械翻訳におけるアテンションを用いた未知語置き換えの手法
伊部 早紀松田 源立山口 和紀
著者情報
ジャーナル フリー

2018 年 25 巻 5 号 p. 511-525

詳細
抄録

ニューラル機械翻訳では,従来の統計的機械翻訳に比べ文法的に流暢な文が生成されるが,出力結果に未知語が含まれることがしばしば指摘される.この問題に対処する方法としては,学習コーパス中の低頻度語を分割したり,未知語に位置情報を付け加えるなどの方法があるが,どれも日英翻訳では効果が低い.そこで本論文では,アテンションから構成した単語アライメント表を用いて出力文中の未知語と対応する入力文中の単語を見つけ,その単語を翻訳した単語で未知語を置き換えることで未知語をなくす手法を提案する.本論文の有効性を示すために ASPEC, NTCIR-10 の 2 種類のコーパスを用いて実験を行った結果,本論文で提案する単語アライメント表の構成法を用いると,未知語を全く発生させず,かつ,BLEU 値を向上させることができた.

著者関連情報
© 2018 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top