2025 年 32 巻 1 号 p. 114-133
ニューラル機械翻訳 (NMT) は柔軟な訳語選択と流暢な訳出により品質の高い翻訳が得られることが多いが,長い入力文に対しては翻訳の品質が低下することがある.この課題に対し,長文を短いセグメントに分割して翻訳し,並べ替えて繋げる分割統治的手法が提案されているものの,NMT での性能向上は限定的であった.そこで本研究では,文内コンテキストを利用することで長文の翻訳を改善する新しい分割統治的 NMT の手法を提案する.提案手法では,(1) 構文解析によって同定された節を結ぶ等位接続詞の前後で分割し,(2) 分割された各節を,その文内コンテキストを利用できるように調整された節単位翻訳用モデルを用いて翻訳し,(3) 翻訳された節を別の sequence-to-sequence モデルを使用して結合し,文全体の翻訳結果を得る.事前訓練された多言語BARTモデルを使用しASPECを対象にした英日翻訳の実験において,特に 41 単語以上の長い入力文に対して,提案手法によりベースラインの多言語 BART による NMT を上回る翻訳精度が得られた.