漢字分解したテキストによるニューラル機械翻訳

グプタ ビィシュウ; 中村 亮裕; 福田 治輝; 綱川 隆司; 狩野 芳伸; 西田 昌史; 西村 雅史

doi:10.11517/pjsai.JSAI2018.0_4Pin125

第32回 (2018)

セッションID: 4Pin1-25

DOI https://doi.org/10.11517/pjsai.JSAI2018.0_4Pin125

会議情報

主催: 一般社団法人人工知能学会

会議名: 2018年度人工知能学会全国大会（第32回）

回次: 32

開催地: 鹿児島県鹿児島市城山ホテル鹿児島

開催日: 2018/06/05 - 2018/06/08

漢字分解したテキストによるニューラル機械翻訳

*グプタビィシュウ, 中村亮裕, 福田治輝, 綱川隆司, 狩野芳伸, 西田昌史, 西村雅史

著者情報

会議録・要旨集フリー

詳細

抄録

ニューラル機械翻訳モデルでは扱える語彙サイズに制約があり、この課題に対処する方法としてサブワード単位、文字単位、あるいはバイト単位で処理する方法が提案されている。一方、日本語においては文字単位に分割しても漢字のバリエーションが多いために語彙サイズは比較的大きくなる。本研究では日本語テキストに対して漢字分解を適用することで語彙サイズの低減と漢字情報の維持を両立させることを目指すニューラル機械翻訳手法を提案し、評価実験を行った。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）