2009 年 16 巻 3 号 p. 3_25-3_49
近年,コンピュータとネットワークの発達に伴って,個人が扱える情報は膨大なものとなり,その膨大な情報の中から必要な情報を探し出すのは非常に困難となっている.既存の検索システムは基本的には表記のみを活用するため,意味的には同じ内容の検索でもユーザが入力する語によって検索結果が異なってしまう.そのためユーザが適切なキーワードを考えなければならない.そこで本稿では文書の意味を捉えた検索を実現するために単語の関連性にもとづいた文書間の類似性の定量化手法を提案する.具体的には概念ベースを用い単語間の関連性を求め,Earth Mover’s Distance により文書間の類似度を計算する方法を提案する.また概念ベースに存在しない固有名詞や新語に対して,Web 情報をもとに新概念として意味を定義し,概念ベースを自動的に拡張する方法を提案する.これら提案手法を NTCIR3-WEB によって他の手法と比較実験したところ,本手法が他手法に比べ良好な結果が得られた.