2009 年 21 巻 5 号 p. 815-826
本研究では,オンライン百科事典Wikipedia(日本語)の文章をコーパスとして用い,汎用的な利用を想定した日本語オントロジー辞書システムOntolopediaを設計・構築し,システムを通して作成された知識地図を応用した評価実験を行った.評価実験では,Twitterよりユーザーの発言情報を取得し,Ontolopediaで構築した知識地図を利用して興味関心をユーザー毎に抽出・推測し,精度や応用可能性について検証した.Twitterにおける発言データから名詞のみを抽出して生成した発言語リストを解析対象とし,提案手法による興味語の抽出・推測を行った.提案手法による興味語の抽出・推測を行い,以下の3項目について評価を行った.第一に,発言語リスト内のどの単語がより興味関心のある言葉なのかを点数化し,ユーザにとって望ましい単語を上位にランク付けられるかを検証した.比較対象としては,特徴的な単語を抽出するために広く用いられているTF-IDF法を取り上げた.第二に,構築した知識地図を利用する事で,発言語リスト内には現れていないが,発言語リスト上の単語群から興味があるだろうと推測される単語群の抽出を試みた.第三の評価実験では,概念別に語句を分類し,ユーザー毎の興味の偏りを調査することで,ユーザーの興味特性を抽出できるかを検討した.以上の評価実験により,提案手法による興味語の抽出が従来法と比較して精度よく行える事を示し,発言語リストから興味語の推測が行えることを示した.