抄録
WebサイトはYahoo! Japanのようなディレクトリ型検索エンジンでみられるように、様々なカテゴリーに分類されている.カテゴリー中のWebサイトはそのカテゴリーに関連のある内容であるため,カテゴリーごとに特徴的な名詞が存在すると考えられる.そのようなカテゴリーごとに特徴的な名詞を利用することができれば,任意のWebサイトをカテゴリーへと自動分類することが可能になると考えられる.本研究ではWebサイト中の全ての名詞を抽出しカテゴリーごとの出現頻度などを用いてスコア付けし,そのスコアを用いて計算したカテゴリーとの類似度によるWebサイトの自動分類手法を提案する.そして実際にディレクトリ型検索エンジンであるYahoo! Japanから10種類のカテゴリーを対象にその有効性について検証する.