人工知能学会全国大会論文集
Online ISSN : 2758-7347
第32回 (2018)
セッションID: 4Pin1-25
会議情報

漢字分解したテキストによるニューラル機械翻訳
*グプタ ビィシュウ中村 亮裕福田 治輝綱川 隆司狩野 芳伸西田 昌史西村 雅史
著者情報
会議録・要旨集 フリー

詳細
抄録

ニューラル機械翻訳モデルでは扱える語彙サイズに制約があり、この課題に対処する方法としてサブワード単位、文字単位、あるいはバイト単位で処理する方法が提案されている。一方、日本語においては文字単位に分割しても漢字のバリエーションが多いために語彙サイズは比較的大きくなる。本研究では日本語テキストに対して漢字分解を適用することで語彙サイズの低減と漢字情報の維持を両立させることを目指すニューラル機械翻訳手法を提案し、評価実験を行った。

著者関連情報
© 2018 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top