抄録
名義属性を持つデータに対して,クラスター間の識別可能性に基づく非類似を用いたクラスタリングが提案されている.この非類似度は,異なるクラスターを識別できる属性部分集合の数によって定義されている.ある属性部分集合でクラスターが識別可能であれば,それを包含する属性部分集合でも識別可能である.そのため,クラスターが小さな部分集合で識別されれば,異なるクラスターに属する対象の距離がどれだけ大きくても,非類似度は小さくなってしまう.そこで,本研究では,異なるクラスターに属する対象間の最長距離を考慮した識別不能性に基づく非類似度を提案する.