本研究では,FCMクラスタリング法を用いる識別器の三つの自由パラメータに加えて,さらにクラスター中心ベクトルの長さをパラメータとする場合とクラスターの混合比率をパラメータとする場合の比較を行った.提案の識別器ではマハラノビス距離による楕円状のクラスターを得るために,アルゴリズムを簡略化した繰り返し重み付最小2乗法に基づく更新式を用いる.ただし,自由パラメータの最適化に粒子群最適化法(PSO)を用いるので,厳密なクラスタリングアルゴリズムの収束は必要でない.そこで,本研究では繰り返し回数を1回に簡略化した場合の識別性能を比較する.このことで,マハラノビス距離によるクラスタリングアルゴリズムでよく起こる発散や振動,収束までの計算時間などの問題が解消される.クラスタリングアルゴリズムは識別器の第1フェーズで用いられ,FCM識別器(FCMC)と呼ばれる.FCM識別器は二つのフェーズから成り,第1フェーズではクラス毎にクラスタリングを行い,第2フェーズでは評価用データの識別及びメンバシップ関数の自由パラメータの最適化を行う.一般に高性能識別器は,調整できる自由パラメータを持っている.例えば,サポートベクターマシン(SVM)にはマージンやカーネルと呼ばれるパラメータがある.これらのパラメータが何らかの最適化手法で選択されることで,識別器の汎化能力を高めている.FCM識別器には複数の自由パラメータがあり,パラメータと誤識別率の関係は単峰形の関数ではない.そこで,パラメータ探索の簡便な手法として粒子群最適化法(PSO)を適用する.ベンチマークデータを用いた幾通りかの分割による交差確認法(CV法)での比較から,再代入誤識別率(1-CV)を最小化する方法が有効であることを示す.また,自由パラメータにクラスターの混合比率,または中心ベクトルの変更割合を加えた場合の比較結果を報告する.提案FCM識別器は,k最近傍法(k-NN)よりも優れ,高性能な識別器として知られたSVMにほぼ等しい汎化性能を示した.また10-CV法の評価用データに対する識別精度はSVMよりも優れた結果が得られた.
抄録全体を表示