人工知能学会全国大会論文集
第26回全国大会(2012)
セッションID: 3B2-R-2-2
会議情報

連続値入力問題のためのガウス型状態表現を用いたTD学習法
*藤井 菜摘子上野 敦志田窪 朋仁辰巳 昭治
著者情報
会議録・要旨集 フリー

詳細
抄録

連続値の知覚入力を持つ問題環境に強化学習を適用する際,問題環境に適した離散化を行わなければ不完全知覚問題が発生してしまう.これに対応するため,ガウス型の状態関数を用いた手法が提案されている.本研究では行動にノイズを含む問題環境への対応を考え,この離散化手法をTD学習に適用した手法を提案する.本手法の有効性を,コンピュータシミュレーション上の経路探索問題で示す.

著者関連情報
© 2012 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top