知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
ISSN-L : 1347-7986
原著論文
情報収集のためのテキストデータ集合の再帰的クラスタリング
砂山 渡濱岡 秀平奥田 澄
著者情報
ジャーナル フリー

2012 年 24 巻 3 号 p. 697-706

詳細
抄録

近年の情報量の増大に伴い,幅広くテキスト情報を獲得する機会が増えつつある.Webページ等のように日々変わっていくデータ集合から効率よく幅広い情報を集めるためには,クラスタリングなどのデータ分類の手法が適用されることが多いが,多くのクラスタリング手法による分類では,情報が一つのクラスタに集中する傾向がある.そこで本研究では,クラスタリング手法により分類されたクラスタ内のテキスト集合を一つのテキストとして統合し,再帰的にクラスタリングを行うことで,情報の偏りを避けられる手法を提案する.実験により,提案手法が,情報の偏りを避けた分類を行えることを確認し,クラスタリング結果を可視化したマップを用いることで,幅広い情報の収集に役立てられることを確認した.

著者関連情報
© 2012 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top