2007 年 14 巻 2 号 p. 33-68
本論文では, ウェブを利用した専門用語の訳語推定法について述べる.これまでに行われてきた訳語推定の方法の1つに, パラレルコーパス・コンパラブルコーパスを用いた訳語推定法があるが, 既存のコーパスが利用できる分野は極めて限られている.そこで, 本論文では, 訳を知りたい用語を構成する単語・形態素の訳語を既存の対訳辞書から求め, これらを結合することにより訳語候補を生成し, 単言語コーパスを用いて訳語候補を検証するという手法を採用する.しかしながら, 単言語コーパスであっても, 研究利用可能なコーパスが整備されている分野は限られている.このため, 本論文では, ウェブをコーパスとして用いる.ウェブを訳語候補の検証に利用する場合, サーチエンジンを通してウェブ全体を利用する方法と, 訳語推定の前にあらかじめ, ウェブから専門分野コーパスを収集しておく方法が考えられる.本論文では, 評価実験を通して, この2つのアプローチを比較し, その得失を論じる.また, 訳語候補のスコア関数として多様な関数を定式化し, 訳語推定の性能との問の相関を評価する.実験の結果, ウェブから収集した専門分野コーパスを用いた場合, ウェブ全体を用いるよりカバレージは低くなるが, その分野の文書のみを利用して訳語候補の検証を行うため, 誤った訳語候補の生成を抑える効果が確認され, 高い精度を達成できることがわかった.