抄録
近年,コンピュータシステムが増加し,出力ログファイルが膨大になっている.この膨大なファイルから,システム異常の検出だけでなく,検出ルールの自動獲得が求められ,特に,明示的なハードウェア障害等の検出が行われている.しかし,成りすましによる不正アクセス等,ログ中に現れにくい異常もある.例えば,「使用頻度の低いユーザによる,高頻度アクセス」等,出現パターンにより検出すべき異常である.ただ,こうした情報は,教師あり学習のための正解として与えることが困難であり,これまで対象とされてこなかった.そこで本研究は, 遺伝的プログラミングに基づいた自動グループ構成手法ADGを用いることにより,異常検出ルールの自動獲得を行う.その際,出現パターンに基づいた適応度を適切に設定することにより,教師なし学習に対応させ,不正アクセス等のパターンにも対応可能なルール抽出をも行えるようにする.
以上の目的により実験を行った結果,322個のログファイルの中から,16個の抽出ルールを発見した.また,これらのルールは,DNSに関する設定誤りを指摘する等,有効であることが確認された.したがって,本研究は,専門知識がなくても有効に機能する抽出手法であると言える.