自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
一般論文
ニューラル機械翻訳のためのバイリンガルなサブワード分割
出口 祥之内山 将夫田村 晃裕二宮 崇隅田 英一郎
著者情報
ジャーナル フリー

2021 年 28 巻 2 号 p. 632-650

詳細
抄録

本論文ではニューラル機械翻訳のための新たなサブワード分割法を提案する.従来法では対訳関係を考慮せずに各言語ごとにサブワード分割を学習するため,機械翻訳タスクに適したサブワード分割になるとは限らない.本研究は対訳コーパスを用い,原言語文と目的言語文のサブワードトークン数の差がより小さくなるサブワード分割法を提案する.提案法は対訳情報を用いるため,より機械翻訳タスクに適したサブワードが得られると考えられる.従来法と提案法を用いて翻訳性能を比較したところ,WAT ASPEC 英日・日英・英中・中英翻訳タスクと WMT14 英独・独英翻訳タスクにおいて,Transformer NMT モデルの性能が最大 0.81 BLEU ポイント改善した.

著者関連情報
© 2021 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top