知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
ISSN-L : 1347-7986
用語解説
機械翻訳自動評価
越前谷 博
著者情報
ジャーナル フリー

2015 年 27 巻 3 号 p. 100

詳細
抄録

2020年東京オリンピックの開催決定に伴い,音声機械翻訳の開発と普及が進んでいる.現在の機械翻訳研究の主流となっているアーキテクチャは統計翻訳である.更に,近年では深層学習を背景にニューラル翻訳が注目を集めている.このような機械翻訳研究の発展に大きく寄与している黒子的な技術が自動評価法である.

機械翻訳の評価は従来から大きな問題であった.評価として最も信頼性の高い方法は人手評価である.しかし,人手評価はコストと時間を要する.そこに登場したのが自動評価法 BLEUである.2002年に発表されたLEUは機械翻訳のシステム訳が人手で作成された正しい翻訳結果(正解訳及び参照訳と呼ばれる)とどれだけ近いかをスコアとして算出し,それを評価結果として提示する.このBLEUをきっかけとして,様々な自動評価法が提案されるようになった.それらは容易に利用可能なため,機械翻訳研究のスピードは飛躍的に向上した.また,他研究との比較の際にも同一の自動評価法を用いることで,より客観的な比較ができるようになった.

それでは理想的な自動評価法とはどのようなものか.第一に,高い評価精度を有するものでなければならない.自動評価法の評価は人手によるスコアとの間の相関を求めることで行う.現状では,評価対象が複数のシステム訳を集めたドキュメント単位の場合には相関係数は0.9程度を示すが,文単位になると多くは0.4以下の相関係数であり,信頼性は低い.他に自動評価法に対して求められる要素としては,スコア算出のための処理時間が短いことや使用する参照訳の数が少ないことなどが挙げられる.

今後,自動評価法に求められることは精度の向上はもちろんのこと評価に対する説明能力である.評価結果としてスコアだけを示されても開発者はシステムへのフィードバックに用いることができない.何故そのようなスコアになったかについて的確な説明を受けることで評価は意味を持つ.このような自動評価法を実現するには多くの問題が残されているが,評価の本質を見失うことなく本研究に真摯に取り組んでいく所存である.

著者関連情報
© 2015 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top