2009 年 2009 巻 SWO-021 号 p. 04-
本研究は,Wikipediaの記事の中から,複数の分野にまたがった意外性のある知識を発見することを目的としている.Wikipediaは各記事が1つ以上のカテゴリに属しており,そのカテゴリネットワークはグラフ構造を成している.それらのグラフ上の構造を特徴量として利用し,機械学習により各記事に対して意外性を含む記事であるか否かの判定を行う.例えば,「category:オープンソース」と「category:コーラ」という一見意味的に離れたカテゴリにも,それらのカテゴリに共通して属する「オープンコーラ」という記事が存在する.本研究では,このような意外性のある関係性をもった記事を,機械学習を用いて自動的に発見する手法を提案する.