自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
複合語の内部情報・外部情報を統合的に利用した訳語対の抽出
吉見 毅彦九津見 毅小谷 克則佐田 いち子井佐原 均
著者情報
ジャーナル フリー

2004 年 11 巻 4 号 p. 89-103

詳細
抄録

本稿では, 機械翻訳システムの辞書に登録されておらず, かつ (対応付け誤りを含む) 対訳コーパスにおいて出現頻度が低い複合語を対象として, その訳語を抽出する方法を提案する.提案方法は, 複合語あるいはその訳語候補の内部から得られる情報と, 複合語あるいはその訳語候補の外部から得られる情報とを統合的に利用して訳語対候補に全体スコアを付ける.全体スコアは, 複合語あるいはその訳語候補の二種類の内部情報と二種類の外部情報に基づく各スコアの加重和を計算することによって求めるが, 各スコアに対する重みを回帰分析によって決定する.読売新聞とThe Daily Yomiuriの対訳コーパスを用いた実験では, 全体スコアが最も高い訳語対 (のうちのーつ) が正解である割合が86.36%, 全体スコアの上位二位までに正解が含まれる割合が95.08%という結果が得られ, 提案手法の有効性が示された.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top