自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
再学習による翻訳モデルを用いた単語アライメントの向上
山田 節夫永田 昌明山田 賢治
著者情報
ジャーナル フリー

2005 年 12 巻 2 号 p. 175-188

詳細
抄録

統計的機械翻訳は言語モデルと翻訳モデルによって構成されている.本論文では, 翻訳モデルに着目し, 同じ対訳コーパスから非対称な2つの学習 (翻訳方向が違う学習) によって構築された2つの翻訳モデルを利用することで, それぞれの翻訳モデルの精度を, 単語アライメントという尺度で, 向上させる方法を提案する.具体的には, 2つの翻訳モデルを使った2つの方向のビタビアライメントから抽出された共通単語対を対訳コーパスに追加し, 再学習することによって, 翻訳モデルの精度を向上させる.辞書例文, 科学技術記事, 新聞記事の日英対訳コーパスを用いて実験を行った.その結果, 分野や翻訳モデルに依存せずに, もとの翻訳モデルから最大約5.7%の精度向上 (F値) が確認された.また, 対訳辞書の見出し語対を使った実験では, 共通単語対は対訳辞書の見出しとほぼ同程度の効果が見られた.さらに, 学習を繰り返す実験や学習量を増やす実験結果から, 共通単語対の有効性について述べる.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top