主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
ニューラル機械翻訳の翻訳性能を改善するため,原言語文と目的言語文の固有表現(NE)を活用する試みがなされている.NEを活用する代表的な方法として,これまで,文中のNEの前後に,NEの種類と開始/終了情報を含むNEタグを挿入する「タグ付け手法」と,エンコーダやデコーダの埋め込み層でNEの埋め込みベクトルを追加する「埋め込み手法」が提案され,それぞれの有効性が確認されている.しかし,この2種類の手法間の比較は行われていない.そこで本研究において,WMT2014の英独/独英翻訳タスク及びWMT2020の英日/日英翻訳タスクで両手法の性能を比較した結果,NEを含む文に対する翻訳性能はタグ付け手法の方が高いことを確認した.しかし,タグ付け手法の方がNEの湧き出しが多く,NEを含まない文に対する翻訳性能は埋め込み手法の方が高いことも確認した.この結果を鑑みて,原言語の入力文にNEを含む場合はタグ付け手法,含まない場合は埋め込み手法を用いることで,全体的な翻訳性能を改善できることを実験的に確認した.