本論文では,データの分類基準として,モデル選択問題の立場から良いとされている情報量基準の一つであるMDL (Minimum Description Length)基準を用いて,それに基づく分類アルゴリズムを提案する.そのためにまず,真のクラスター構造として,各属性の属性値に属する確率として多項分布を仮定し,それに対応した厳密なMDL基準式を導出する.そして,個々のデータを逐次的に既存のクラスターに割り付ける逐次的分類法を採用した分類アルゴリズムを提案する.さらに,導出したMDL基準の評価としてシミュレーション実験を行ない,他の分類基準と比較しながら,その有効性を示す.
抄録全体を表示