主催: 一般社団法人 人工知能学会
会議名: 2014年度人工知能学会全国大会(第28回)
回次: 28
開催地: 愛媛県松山市 ひめぎんホール
開催日: 2014/05/12 - 2014/05/15
人間の推論傾向(論理を混同する傾向)を模倣してQ学習に応用する強化学習アルゴリズム(LS-Q学習)は,不確実性の大きい環境において適応的に探索を行うということが明らかになりつつある.本研究では,大車輪ロボットの運動獲得を例として,LS-Q学習が報酬の少ない状態でのループ(停滞ループ)を巧みに回避する様相を解析し,普遍的な探索理論における局所性や論理階層の混同あるいは内部観測の意義と効用を考察する.