自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
関連用語収集問題とその解法
佐々木 靖弘佐藤 理史宇津呂 武仁
著者情報
ジャーナル フリー

2006 年 13 巻 3 号 p. 151-175

詳細
抄録

本論文で提案する関連用語収集問題は, 与えられた専門用語に対し, それと強く関連する用語集合を求める問題である.この問題を解くためには, ある用語が専門用語であり, かつ, 入力用語と強く関連するかどうかを判定する方法が必要となる.本研究では, ウェブのサーチエンジンのヒット数から計算したJaccard係数もしくはX2統計量を用いて, この判定を行なう.作成した関連用語収集システムは, 候補語収集モジュールと関連用語選択モジュールの2つのモジュールから構成される.候補語収集モジュールは, サーチエンジンを利用して, 入力用語が出現するウェブページを収集し, それらのページから関連用語の候補語を収集する.関連用語選択モジュールは, Jaccard係数あるいはX2統計量の値に基づき, 候補語の中から入力用語に強く関連する用語を選択する.実験により, 作成したシステムが入力用語に強く関連する十数語の専門用語を収集できることが確かめられた.

著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top