抄録
n個の対象をg個にグループ分けすることは、i番目の対象のj番目のグループへのメンバーシップの値α_<ij>を割り付けることと等価である。このメンバーシップが未知のとき、得られたデータから最適なメンバーシップを与えるための評価基準を提案した。 n_jをj番目のグループのメンバー数として、分割表に対する仮説分解を利用してグループ分けによる情報量の変化I_gを、 I_g=nlogn+Σ__iΣ__jα_<ij>logα_<ij>-Σ__jn_jlogn_j, 0≦α_<ij>≦1,Σ__jα_<ij>=1,と定義した。一方、対象データが正規母集団からの標本であると仮定すると、分割表に対するのと相同な仮説分解が得られる。そして、幾何学的な観点から、最適なグループ分けを探索するための新しい基準FGC(Fuzzy Group Criterion)、 FGC=S_W/S_T+I_g/I_n、を提案した。ここで、S_TとS_Wはそれぞれ総平方和と群内平方和であり、I_n=nlognで、これはn個の対象をn個の非ファジィグループに分けたときのグループ分けによる情報量の変化を表わしている。 最適なグループ分けは最小の FGC を持つものと考えた。これは、はっきりとグループ分けをしていない、すなわちI_g が小さい、にもかかわらず、小さな群内平方和をもつようなグループ分けを捜し出そうとしたものである。この戦略のもとではファジィなグループ分けが最適解として選ばれる場合もある。 ファジィ k-means 法において、クラスター数とクラスター間の分離の程度を制御するパラメーターの最適な値を捜し出すことへの応用を述べた。2つの人工データに対する適用例を与え、境界がはっきりしないデータに対してはファジィクラスターが最適で、これがはっきりしているデータに対しては非ファジィクラスターが最適であるとの結果を得た。