自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
コンパラブルコーパスと対訳辞書による日英クロス言語検索
奥村 明俊石川 開佐藤 研治
著者情報
ジャーナル フリー

1998 年 5 巻 4 号 p. 77-93

詳細
抄録

クロス言語検索手法GDMAXは, 日本語入力から英語ドキュメントの検索を可能にする. GDMAXは, 対訳辞書によって入力キュエリから翻訳キュエリ候補を生成し, キュエリからそれぞれの言語のコーパスにおけるキュエリタームの共起頻度を成分とすそ共起頻度ベクトルを生成する. 入力共起頻度ベクトルと翻訳共起頻度ベクトルとの距離によって, 翻訳キュエリ候補をランキングし, 上位の英語キュエリ集合を検索キュエリとする. この手法によって, 一つの対訳だけでなく適切な複数の訳語集合を英言語キュエリとして得ることができる. ウォールストリートジャーナルやAP通信など2ギガの英語ドキュメントについて適合率と再現率で評価したところ, 理想訳と比べて約62%の精度を得て, 対訳辞書のすべての訳語候補を用いる場合と比べて12%, 機械翻訳による訳語選択と比べて6%高い精度を得ることができた.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top