本論文では,クラスタリングとパラメータ最適化による簡便な識別器であるファジィ c -平均識別器(FCMC)の訓練時間の改善について述べる.主な改善点は,メモリー不足が発生しないように訓練データを分割して読み込み,そのクラスターへのメンバシップも分割してハードディスクに書き出すことと,ランダムサーチによるパラメータ最適化の高速化である.そして,FCMC の訓練時間を高性能なサポートベクターマシンとして知られている LibSVM と比較する.FCMC のクラス毎のクラスター数は2のべき乗個で,最大2
8=256 としハイパーパラメータに含める.四つのパラメータのうちの二つをランダムサーチで自動最適化する.また,パラメータが二つの LibSVM との比較を行う.総訓練時間には最適なパラメータを探索する時間を含める.改良された FCMC では LibSVM と同等の識別精度が得られ,100 万件以上の大量データでは,LibSVM より総訓練時間が 100 倍から 1000 倍高速である.
抄録全体を表示