複利型強化学習による危険回避行動の学習

松井 藤五郎; 落合 宏旭

doi:10.11517/pjsai.JSAI2013.0_1E41

第27回 (2013)

セッションID: 1E4-1

DOI https://doi.org/10.11517/pjsai.JSAI2013.0_1E41

会議情報

主催: 一般社団法人人工知能学会

会議名: 2013年度人工知能学会全国大会（第27回）

回次: 27

開催地: 富山県富山市富山国際会議場

開催日: 2013/06/04 - 2013/06/07

複利型強化学習による危険回避行動の学習

*松井藤五郎, 落合宏旭

著者情報

会議録・要旨集フリー

詳細

抄録

複利型強化学習は，利益率（リターン）の複利効果を最大化するような行動を学習することを目的としているが，結果として大きな負のリターンを避けるような行動を学習するという性質を持つ．そこで，本論文では，格子世界の迷路タスクにおいて，複利型強化学習を用い，かつ，危険な行動に大きな負のリターンを与えることによって，危険を回避する行動を学習する方法を提案する．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）