認知的な強化学習モデルに対する基準学習の応用と考察

高橋 優太; 甲野 佑; 高橋 達二

doi:10.11517/pjsai.JSAI2013.0_1L3OS24a4i

第27回 (2013)

セッションID: 1L3-OS-24a-4in

DOI https://doi.org/10.11517/pjsai.JSAI2013.0_1L3OS24a4i

会議情報

主催: 一般社団法人人工知能学会

会議名: 2013年度人工知能学会全国大会（第27回）

回次: 27

開催地: 富山県富山市富山国際会議場

開催日: 2013/06/04 - 2013/06/07

認知的な強化学習モデルに対する基準学習の応用と考察

*高橋優太, 甲野佑, 高橋達二

著者情報

会議録・要旨集フリー

詳細

抄録

単純な強化学習課題であるN本腕バンディット問題において，価値関数でありながら方策としても機能する緩対称性推論モデル(LS)が存在する．LSは人間認知由来の主観確率モデルでもあり，環境の曖昧さからの推論に長けている．浦上はその性質を活かしたLS強化学習手法を考案し，複雑な運動制御課題で優れた成績を示した．本研究では，前述の手法に甲野のLS改良モデル(LS-VR)を実装し，更なる成績の向上を行なった．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）