主催: 一般社団法人 人工知能学会
会議名: 第34回全国大会(2020)
回次: 34
開催地: Online
開催日: 2020/06/09 - 2020/06/12
異常検出分野では、大量な異常データの取得が困難であることは周知の問題である。さらに多くの場合、前兆を考慮した異常データの定義は実に曖昧である。特に時系列データやシーケンシャルストリーミングデータが対象となる場合は、異常性は静止的確定状態より動的な信念状態として扱うのが合理的である。この観点から、異常検知問題を異常状態と異常発見という“行動”、そして正しい異常検知ができれば“報酬”を与えるという強化学習の枠組みにキャスティングすることができる。信念状態とする異常データの検出と予測は、強化学習における部分観測マルコフ問題と一致することが理解できる。本研究は部分観測マルコフ決過程(POMDP)を用いた異常前兆予測検知手法を提案する。研究ではゲームにおいて圧倒的な性能を出した深層強化学習アルゴリズムAlphaZeroを部分観測マルコフ決定過程下で適用することができるように拡張し、その有効性を検証することを目的する。