自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
英日機械翻訳における代名詞翻訳の改良
吉見 毅彦
著者情報
ジャーナル フリー

2001 年 8 巻 3 号 p. 87-106

詳細
抄録

代名詞を含む英文を日本語として適格で自然な文に翻訳するためには, 英語の代名詞を日本語の代名詞としてそのまま表現せず, ゼロ代名詞化したり他の表現に置き換えたりする必要がある. ゼロ代名詞化に関しては, 人手で記述された規則による方法が既に提案されている. 本稿では, 1) ゼロ代名詞化に加え, 他の表現に置き換えるべき場合も扱い, 2) 規則を人手で記述するのではなく, 決定木学習によって自動的に学習する方法を示す. 学習に利用する属性は, ゼロ代名詞化に関してこれまでに解明されている言語学的制約や, ゼロ代名詞の復元に関する工学的研究で着目された手がかりを参考にして選択した. 提案手法を我々の英日機械翻訳システムPower E/Jによる訳文に対して適用したところ, ゼロ代名詞化するか否かの判定を行なう場合の精度が79.9%, ゼロ代名詞化するか否かに加え他の表現に書き換えるか否かの判定も行なう場合の精度が72.2%となり, 人手で記述された規則の精度に近い精度が得られた. また, 選択した属性には, 書き換え精度を低下させる属性は含まれておらず, ゼロ代名詞化に関する言語学的制約だけでなく, ゼロ代名詞の復元に関する手がかりも利用できることが明らかになった.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top