自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
用例に基づく手法と機械学習モデルの組み合せによる訳語選択
内元 清貴関根 聡村田 真樹井佐原 均
著者情報
ジャーナル フリー

2003 年 10 巻 3 号 p. 87-114

詳細
抄録

本論文では, 機械翻訳における訳語選択の手法について述べる. 我々のシステムは, 入力文と対象単語が与えられたとき, 翻訳メモリと呼ばれる対訳用例集合と入力文との類似度を求め, 類似度が最大となる用例集合を用いて対象単語の訳語選択を行なう. 類似度は, 用例に基づく手法と機械学習モデルを用いて計算される. 類似度の計算には, 文字列の類似性や入力文における対象単語周辺の単語, 入力文中の内容語とその訳語候補の対訳コーパスおよび日英の単言語コーパスにおける出現頻度などを考慮する. 入力文と対象単語が与えられると, まず用例に基づく手法を適用し, 類似した用例が見つからなかった場合に機械学習モデルを適用する. 機械学習モデルは複数用意し, クロスバリデーションなどにより単語毎に最適な学習モデルを選択する. 本論文では, 2001年の春に開催された単語の多義性解消のコンテスト第2回SENSEVALでの結果をもとに, 提案手法の有効性と, どのような情報が精度向上に有効であったかについて述べる.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top