抄録
本論文では,クラスタリングとパラメータ最適化による簡便な識別器であるファジィc-平均識別器(FCMC)の訓練時間の改善について述べる.主な改善点は,メモリー不足が発生しないように訓練データを分割して読み込み,そのクラスターへのメンバシップも分割してハードディスクに書き出すことと,ランダムサーチによるパラメータ最適化の高速化である.そして,FCMCの訓練時間を高性能なサポートベクターマシンとして知られているLibSVM と比較する.クラスター数は2 のべき乗個で,最大28=256 としハイパーパラメータに含める.四つのパラメータのうちの二つをランダムサーチで自動最適化する.また,パラメータが二つのLibSVM との比較を行う.総訓練時間には最適なパラメータを探索する時間を含める.改良されたFCMC ではLibSVM と同等の識別精度が得られ,100 万件以上の大量データでは,LibSVM より総訓練時間が100 倍から1000 倍高速である.