抄録
大量で良質な対訳文集合(翻訳メモリ)の確保は,翻訳機能を計算機処理により実現する統計的機械翻訳をはじめ,情報資産の有効活用から重要性が認識されつつある.これまで対訳文の大規模収集が検討される一方で,対訳文の品質改善を目的に誤訳等の修正を行うこと(クリーンアップ)に関する方法論はまだよく知られていない.本稿では,翻訳メモリのクリーンアップに向けて,対訳文における語の対応良否に関する尺度の導入を提案する.日英40万規模の対訳文ランキングの実例を基に,翻訳メモリのクリーンアップのための大規模対訳文集合に対するランキングについて述べる.