自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
日英関連報道記事を用いた訳語対応推定
宇津呂 武仁日野 浩平堀内 貴司中川 聖一
著者情報
ジャーナル フリー

2005 年 12 巻 5 号 p. 43-69

詳細
抄録

近年, ウェブ上の日本国内の新聞社などのサイトにおいては, 日本語だけでなく英語で書かれた報道記事も掲載しており, これらの英語記事においては, 同一時期の日本語記事とほぼ同じ内容の報道が含まれている.本論文では, これらの報道記事のページから, 日本語で書かれた文書および英語で書かれた文書を収集し, 多種多様な分野について, 分野固有の固有名詞 (固有表現) や事象・言い回しなどの翻訳知識を獲得する手法を提案する.本論文の手法には, 情報源となるコーパスを用意するコストについては, コンパラブルコーパスを用いた翻訳知識獲得のアプローチと同等に小さく, しかも同時期の報道記事を用いるため, 片方の言語におけるタームや表現の訳がもう一方の言語の記事の方に出現する可能性が高く, 翻訳知識の獲得が相対的に容易になるという大きな利点がある.翻訳知識獲得においては, まず, 報道内容がほぼ同一もしくは密接に関連した日本語記事および英語記事を検索する.そして, 関連記事組を用いて二言語間の訳語対応を推定する.訳語対応を推定する尺度としては, 関連記事組における訳語候補の共起を利用する方法を適用し, 評価実験において文脈ベクトルを用いる方法と比較し, この方法が有効であることを示す.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top