人工知能学会全国大会論文集
Online ISSN : 2758-7347
第20回 (2006)
セッションID: 1A3-5
会議情報

HTMLタグを用いたWebページのクラスタリング手法
*折原 大塚田 大介内海 彰
著者情報
会議録・要旨集 フリー

詳細
抄録

本研究では、Webページに特有のHTMLタグの頻度、位置、連なりといった情報を用いたクラスタリング手法を提案する。さらに、tf・idfによる内容に基づくクラスタリング手法と組み合わせた手法を提案する。これらの提案する手法とtf・idfによるクラスタリング手法との比較実験を行なった。

著者関連情報
© 2006 社団法人 人工知能学会
前の記事 次の記事
feedback
Top