連続値入力問題のためのガウス型状態表現を用いたTD学習法

藤井 菜摘子; 上野 敦志; 田窪 朋仁; 辰巳 昭治

doi:10.11517/pjsai.JSAI2012.0_3B2R22

第26回 (2012)

セッションID: 3B2-R-2-2

DOI https://doi.org/10.11517/pjsai.JSAI2012.0_3B2R22

会議情報

主催: 社団法人人工知能学会

会議名: 2012年度人工知能学会全国大会（第26回）

回次: 26

開催地: 山口県山口市山口県教育会館等

開催日: 2012/06/12 - 2012/06/15

連続値入力問題のためのガウス型状態表現を用いたTD学習法

*藤井菜摘子, 上野敦志, 田窪朋仁, 辰巳昭治

著者情報

会議録・要旨集フリー

詳細

抄録

連続値の知覚入力を持つ問題環境に強化学習を適用する際，問題環境に適した離散化を行わなければ不完全知覚問題が発生してしまう．これに対応するため，ガウス型の状態関数を用いた手法が提案されている．本研究では行動にノイズを含む問題環境への対応を考え，この離散化手法をTD学習に適用した手法を提案する．本手法の有効性を，コンピュータシミュレーション上の経路探索問題で示す．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）