システム制御情報学会 研究発表講演会講演論文集
第49回システム制御情報学会研究発表講演会
セッションID: 7C2-2
会議情報
アンカー関連テキストを用いたWebページ分類手法に関する基礎検討
*大坪 正典Bui Quang Hung土方 嘉徳西田 正吾
著者情報
会議録・要旨集 フリー

詳細
抄録
Web上の情報が増加しつづける中で,Yahoo!やExciteなどのようなWebページをカテゴリ分類しているポータルサイトの需要が高まっている.しかし,これらのサイトのカテゴリは人手によるもので,膨大な量のWebページに対応することはできない.そのため,自動分類の研究がなされてきた.近年では,分類対象となるページそのものを分析するのではなく,そのページにリンクしているページを用いる研究が注目されている.既存の研究では,ページのフォーマットに関わらず,一定の方法でアンカー周辺のテキストを抽出し分類に用いていた.そこで本研究では,ページのフォーマットによってテキスト部分の抽出方法を変えることで,より意味のあるテキスト部分を抽出し,より精度の高い自動分類を目指す.
著者関連情報
© 2005 システム制御情報学会
前の記事 次の記事
feedback
Top