自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
ウェブから収集した専門分野コーパスと要素合成法を用いた専門用語訳語推定
外池 昌嗣宇津呂 武仁佐藤 理史
著者情報
ジャーナル フリー

2007 年 14 巻 2 号 p. 33-68

詳細
抄録

本論文では, ウェブを利用した専門用語の訳語推定法について述べる.これまでに行われてきた訳語推定の方法の1つに, パラレルコーパス・コンパラブルコーパスを用いた訳語推定法があるが, 既存のコーパスが利用できる分野は極めて限られている.そこで, 本論文では, 訳を知りたい用語を構成する単語・形態素の訳語を既存の対訳辞書から求め, これらを結合することにより訳語候補を生成し, 単言語コーパスを用いて訳語候補を検証するという手法を採用する.しかしながら, 単言語コーパスであっても, 研究利用可能なコーパスが整備されている分野は限られている.このため, 本論文では, ウェブをコーパスとして用いる.ウェブを訳語候補の検証に利用する場合, サーチエンジンを通してウェブ全体を利用する方法と, 訳語推定の前にあらかじめ, ウェブから専門分野コーパスを収集しておく方法が考えられる.本論文では, 評価実験を通して, この2つのアプローチを比較し, その得失を論じる.また, 訳語候補のスコア関数として多様な関数を定式化し, 訳語推定の性能との問の相関を評価する.実験の結果, ウェブから収集した専門分野コーパスを用いた場合, ウェブ全体を用いるよりカバレージは低くなるが, その分野の文書のみを利用して訳語候補の検証を行うため, 誤った訳語候補の生成を抑える効果が確認され, 高い精度を達成できることがわかった.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top