A3CにおけるAttention機構を用いた視覚的説明

板谷 英典; 平川 翼; 山下 隆義; 藤吉 弘亘; 杉浦 孔明

doi:10.11517/pjsai.JSAI2020.0_2J6GS204

第34回 (2020)

セッションID: 2J6-GS-2-04

DOI https://doi.org/10.11517/pjsai.JSAI2020.0_2J6GS204

会議情報

主催: 一般社団法人人工知能学会

会議名: 第34回全国大会(2020)

回次: 34

開催地: Online

開催日: 2020/06/09 - 2020/06/12

A3CにおけるAttention機構を用いた視覚的説明

*板谷英典, 平川翼, 山下隆義, 藤吉弘亘, 杉浦孔明

著者情報

キーワード: 強化学習, 視覚的説明

会議録・要旨集フリー

詳細

抄録

深層強化学習の代表的な手法であるAsynchronous Advantage Actor-Critic (A3C)は，ロボット制御やゲームタスクにおいて高精度な結果を獲得している．しかし，推論時におけるモデル内部の演算が複雑であるため，モデルの推論結果に対する判断根拠が不明確である．そのため，モデルがどのように判断し推論したか容易に説明できる仕組みが必要である．本研究では，Policy branchの特徴マップに対しAttention mapを用いてマスク処理を行うMask Attention A3Cを提案する．Atari2600を用いた実験により，スコアの比較及び獲得したAttention mapを用いた視覚的説明を行う．また，注視領域を反転させた場合においてもスコアを確認することで，獲得したAttention mapの有効性を示す．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）