従来のクラスタリングアルゴリズムにおいて, 分類境界面が線形に分離不可能なデータに対しては, 良好なクラスタリング結果を得ることは難しい.これは通常, 各個体間の非類似度として, ユークリッド空間におけるノルムの自乗を用いているのでその結果, 分類境界面が線形に分離し, 非線形な境界線を持つようなデータ分布を扱うのが困難になるからである.そこで本論文では, カーネル関数を用いた, 新たな階層的クラスタリングアルゴリズムを提案する.カーネル関数とは, カーネル関数と1対1に対応する写像により高次元の特徴空間に写像された2つのベクトルの内積を与えるものであり, データ分類の分野で有効な道具の1つである.その写像は陽に現れず, そのため, 高次元空間での内積の計算を元の空間の次元で行えるという利点を持つ.これによって非線形な分類境界面を持つようなデータにも対応出来るようになる.また, いくつかの数値例を通して, 本論文で提案したクラスタリングアルゴリズムの有効性を検討する.
抄録全体を表示