主催: 一般社団法人 人工知能学会
会議名: 2013年度人工知能学会全国大会(第27回)
回次: 27
開催地: 富山県富山市 富山国際会議場
開催日: 2013/06/04 - 2013/06/07
複利型強化学習は,利益率(リターン)の複利効果を最大化するような行動を学習することを目的としているが,結果として大きな負のリターンを避けるような行動を学習するという性質を持つ. そこで,本論文では,格子世界の迷路タスクにおいて,複利型強化学習を用い,かつ,危険な行動に大きな負のリターンを与えることによって,危険を回避する行動を学習する方法を提案する.