自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
発話を対象とした類似文検索と機械翻訳への適用
下畑 光夫隅田 英一郎松本 裕治
著者情報
ジャーナル フリー

2004 年 11 巻 4 号 p. 105-126

詳細
抄録

話し言葉である発話を対象として機械翻訳を行った場合, 話し言葉特有の性質が一因となって適切な翻訳文が得られない場合がある.本論文では, 適切な翻訳文が得られなかった場合に類似文検索技術を用いることで適切な訳文を得る方法を提案する.与えられた入力文が適切に翻訳できないと判明した場合に, 翻訳可能な文を集めたコーパスから入力文の類似文を検索する.検索された類似文を機械翻訳に与えて翻訳文を得ることで, 適切な翻訳文を得ることができる.検索対象となる文 (候補文) と入力文の間の類似度は, 候補文と入力文の間で共通するN-gramの比率に基づいて算出する.さらに, 入力文にない内容語を含む候補文は対象外とすることや機能語の重みを減らすといった付加条件を加えることで精度向上を図った.日本語における類似文検索の実験では, 与えた入力文の内87T2%について検索文を出力し, それらの検索文の内60.4%は適切な類似文であった.機械翻訳と組み合わせた実験では, 翻訳不能となった入力文について類似文を検索させ, それらを機械翻訳にかけたところ, 翻訳不能文の内25.9%について適切な訳文を得ることができた.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top