人工知能学会全国大会論文集
Online ISSN : 2758-7347
第28回 (2014)
セッションID: 2N5-OS-03b-1
会議情報

LS-Q学習による探索と停滞ループの回避
*浦上 大輔高橋 達二高橋 優太アルアルワン アリー松尾 芳樹
著者情報
会議録・要旨集 フリー

詳細
抄録

人間の推論傾向(論理を混同する傾向)を模倣してQ学習に応用する強化学習アルゴリズム(LS-Q学習)は,不確実性の大きい環境において適応的に探索を行うということが明らかになりつつある.本研究では,大車輪ロボットの運動獲得を例として,LS-Q学習が報酬の少ない状態でのループ(停滞ループ)を巧みに回避する様相を解析し,普遍的な探索理論における局所性や論理階層の混同あるいは内部観測の意義と効用を考察する.

著者関連情報
© 2014 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top