LS-Q学習による探索と停滞ループの回避

浦上 大輔; 高橋 達二; 高橋 優太; アルアルワン アリー; 松尾 芳樹

doi:10.11517/pjsai.JSAI2014.0_2N5OS03b1

第28回 (2014)

セッションID: 2N5-OS-03b-1

DOI https://doi.org/10.11517/pjsai.JSAI2014.0_2N5OS03b1

会議情報

主催: 一般社団法人人工知能学会

会議名: 2014年度人工知能学会全国大会（第28回）

回次: 28

開催地: 愛媛県松山市ひめぎんホール

開催日: 2014/05/12 - 2014/05/15

LS-Q学習による探索と停滞ループの回避

*浦上大輔, 高橋達二, 高橋優太, アルアルワンアリー, 松尾芳樹

著者情報

会議録・要旨集フリー

詳細

抄録

人間の推論傾向（論理を混同する傾向）を模倣してQ学習に応用する強化学習アルゴリズム（LS-Q学習）は，不確実性の大きい環境において適応的に探索を行うということが明らかになりつつある．本研究では，大車輪ロボットの運動獲得を例として，LS-Q学習が報酬の少ない状態でのループ（停滞ループ）を巧みに回避する様相を解析し，普遍的な探索理論における局所性や論理階層の混同あるいは内部観測の意義と効用を考察する．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）