自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
論文
単語アライメントを用いた英日機械翻訳文の流暢さの自動評価
吉見 毅彦小谷 克則九津見 毅佐田 いち子井佐原 均
著者情報
ジャーナル フリー

2010 年 17 巻 1 号 p. 1_7-1_28

詳細
抄録

本稿では,人間による翻訳(人間訳)と機械翻訳システムによる翻訳(システム訳)を訓練事例とした機械学習によって構築した識別器を用いてシステム訳の流暢さを自動評価する手法について述べる.提案手法では,人間訳とシステム訳の流暢さの違いを表わす手がかりとして,逐語訳(原文と翻訳文での単語同士の対応)に着目した.人間訳とシステム訳における逐語訳の違いを捉えるために,原文と人間訳との間,および原文とシステム訳との間で単語対応付けを行ない,その結果を機械学習のための素性とする.提案手法は,識別器を構築する際に対訳コーパスを必要とするが,評価対象のシステム訳の流暢さを評価する際には参照訳を必要としない.さらに,大量の訓練事例に人手で流暢さの評価値を付与する必要もない.検証実験の結果,提案手法によってシステムレベルでの自動評価が可能であることが示唆された.また,サポートベクターマシンによる機械学習で各素性に付与される重みに基づいてシステム訳に特徴的な素性を特定できるため,このような素性を含む文を観察することによって文レベルでのシステム訳の特徴分析を行なうこともできる.

著者関連情報
© 2010 言語処理学会
前の記事 次の記事
feedback
Top