2024 年 31 巻 2 号 p. 610-636
ニューラル機械翻訳 (NMT) において,固有表現 (NE) の情報を活用することで翻訳性能が改善されている.これまでNEを活用するNMTモデルとして,NE タグを文中に挿入する「タグ付けモデル」と,NE埋め込みを単語埋め込みに加える「埋め込みモデル」が提案されている.埋め込みモデルは,原言語文のNE情報に加えて目的言語文の NE 情報を活用することで翻訳性能が改善されている.しかし,従来のタグ付けモデルは原言語文の NE 情報しか活用していない.そこで本研究では,原言語文と目的言語文の両方の NE 情報を活用するタグ付けモデルを提案する.さらに,このタグ付けモデルの性能を改善するため,埋め込みモデルとのアンサンブルにより翻訳を行う NMT モデルを提案する.提案のアンサンブルモデルでは,タグ付けモデルと埋め込モデルによる出力確率を平均した確率に基づき目的言語文を生成する.WMT2014 英独・独英翻訳タスク及び WMT2020 英日・日英翻訳タスクで提案モデルを評価した結果,従来のタグ付けモデルと比較して,英独翻訳では最大 0.76 ポイント,独英翻訳では最大 1.59 ポイント,英日翻訳では最大 0.96 ポイント,日英翻訳では最大 0.65 ポイント BLEU が向上することを確認した.