人工知能学会全国大会論文集
Online ISSN : 2758-7347
第27回 (2013)
セッションID: 1E4-1
会議情報

複利型強化学習による危険回避行動の学習
*松井 藤五郎落合 宏旭
著者情報
会議録・要旨集 フリー

詳細
抄録

複利型強化学習は,利益率(リターン)の複利効果を最大化するような行動を学習することを目的としているが,結果として大きな負のリターンを避けるような行動を学習するという性質を持つ. そこで,本論文では,格子世界の迷路タスクにおいて,複利型強化学習を用い,かつ,危険な行動に大きな負のリターンを与えることによって,危険を回避する行動を学習する方法を提案する.

著者関連情報
© 2013 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top