主催: 一般社団法人 人工知能学会
会議名: 第34回全国大会(2020)
回次: 34
開催地: Online
開催日: 2020/06/09 - 2020/06/12
深層強化学習の代表的な手法であるAsynchronous Advantage Actor-Critic (A3C)は,ロボット制御やゲームタスクにおいて高精度な結果を獲得している.しかし,推論時におけるモデル内部の演算が複雑であるため,モデルの推論結果に対する判断根拠が不明確である.そのため,モデルがどのように判断し推論したか容易に説明できる仕組みが必要である.本研究では,Policy branchの特徴マップに対しAttention mapを用いてマスク処理を行うMask Attention A3Cを提案する.Atari2600を用いた実験により,スコアの比較及び獲得したAttention mapを用いた視覚的説明を行う.また,注視領域を反転させた場合においてもスコアを確認することで,獲得したAttention mapの有効性を示す.