日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集
第31回ファジィシステムシンポジウム
セッションID: WB3-1
会議情報

main
球面k-mean++法について
*遠藤 靖典徳山 晴紀宮本 定明
著者情報
会議録・要旨集 フリー

詳細
抄録
k-means(KM)法は強力なクラスタリング手法だが、強い初期値依存性を持つ。この問題を解決するため、2007年にk-means++法(KM++)が提案された。ところで、文書データは一般的に球面上にマッピングされて処理されるが、ビッグデータをはじめ近年着目されているインターネット上のデータの多くは文書データであり、そのような球面上に分布するデータをクラスタリングする手法である球面k-means法(SKM)が2012年にされている。SKMも有効な手法であり、近年のデータ処理に対する要求を考えるとKMより注目されていると言えるが、KMと同様、強い初期値依存性を有する。そこで本報告ではその問題を解決するため、(1)三角不等式を満たす非類似度を導入することによってSKMを拡張し、(2)拡張されたSKMに基づいた球面k-means++法(SKM++)を提案する。SKM++の有効性は理論的に保証される。
著者関連情報
© 2015 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top