抄録
近年、変数の数が個体数よりも多い場合のデータ解析が問題とされている。このようなデータをクラスタリングの対象として扱う場合、解の不安定性、計算量の問題がある。この問題の解決には、前処理として変数間の相関や変数毎の分散を考慮して変数の選択が行われている。前者は、同様の説明をする変数は冗長であるとする考えであり、後者は、信頼性の低い変数を削除しようとする考えである。すなわち、データの部分空間を用いることで処理されている。
本研究では、この問題の解決の端緒として、各変数における個体の分類構造に応じて、重みを考慮したファジィクラスタリング手法を提案する。この手法では、各変数が分類にどの程度寄与するものかを考慮して個体間の非類似度を定義する。