自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
英語を介した日中対訳辞書の自動構築
張 玉潔馬 青井佐原 均
著者情報
ジャーナル フリー

2005 年 12 巻 2 号 p. 63-85

詳細
抄録

日中機械翻訳システム開発の一環として, 日中翻訳辞書の自動構築に関する研究を行っている.今まで, 機械翻訳の研究は英語を一方の言語とする研究が多く行われてきたため, 英語と英語以外の言語の間の対訳辞書は豊富に蓄積されている.一方, 英語以外の言語間の対訳辞書はあまり開発されていない.近年, 英語以外の言語の電子データは増え続けており, 英語以外の言語間の対訳辞書はますます必要になってきている.豊富に蓄積された英語と英語以外の言語の問の対訳辞書を利用して, 英語以外の言語間の機械翻訳システムを効率的に開発することが研究の課題になっている.本稿では, 日英・英中辞書を利用して日中辞書をゼロから構築する方法とその結果について報告する.英語を介して, 新しい言語間の対訳辞書を構築するアプローチは新しいものではないが, 大量の候補から正しい訳語を選択するという問題がまだよく解決されていない.本稿では, 多数のヒューリスティックな情報を利用して訳語を選択する手法を提案した.提案手法においては, 訳語の選別に品詞情報と漢字情報を活用して, 中国語の訳語候補を評価するためのスコアリング関数に多数のヒューリスティックな情報を取りいれた.提案手法を用いて, EDR日英辞書の約14万個のレコードに対し, レコードごとに中国語訳語候補の順位付けを行った.その順位付けについて, 20以上の中国語訳語候補を持つ日本語単語を対象とした評価実験を行った.その結果, 一位に順位付けた訳語の正解率が81.4%に達したことが分かった.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top