人工知能学会全国大会論文集
Online ISSN : 2758-7347
第27回 (2013)
セッションID: 1L3-OS-24a-4in
会議情報

認知的な強化学習モデルに対する基準学習の応用と考察
*高橋 優太甲野 佑高橋 達二
著者情報
会議録・要旨集 フリー

詳細
抄録

単純な強化学習課題であるN本腕バンディット問題において,価値関数でありながら方策としても機能する緩対称性推論モデル(LS)が存在する.LSは人間認知由来の主観確率モデルでもあり,環境の曖昧さからの推論に長けている.浦上はその性質を活かしたLS強化学習手法を考案し,複雑な運動制御課題で優れた成績を示した.本研究では,前述の手法に甲野のLS改良モデル(LS-VR)を実装し,更なる成績の向上を行なった.

著者関連情報
© 2013 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top