抄録
近年の情報量の増大に伴い,幅広くテキスト情報を獲得する機会が増えつつある.Webページ等のように日々変わっていくデータ集合から効率よく幅広い情報を集めるためには,クラスタリングなどのデータ分類の手法が適用されることが多いが,多くのクラスタリング手法による分類では,情報が一つのクラスタに集中する傾向がある.そこで本研究では,クラスタリング手法により分類されたクラスタ内のテキスト集合を一つのテキストとして統合し,再帰的にクラスタリングを行うことで,情報の偏りを避けられる手法を提案する.実験により,提案手法が,情報の偏りを避けた分類を行えることを確認し,クラスタリング結果を可視化したマップを用いることで,幅広い情報の収集に役立てられることを確認した.