システム制御情報学会 研究発表講演会講演論文集
第50回システム制御情報学会研究発表講演会
セッションID: 5F3-3
会議情報

連続状態空間・連続行動空間での強化学習における状態フィルタの適応的獲得
*小山 陽平永吉 雅人村尾 元玉置 久
著者情報
会議録・要旨集 フリー

詳細
抄録
強化学習は,実用化に際して,状態空間を予め適切に設計することが難しいという点が問題点の一つとなっている.この点に留意し,エージェントへの状態入力と行動学習の間に状態フィルタを定義・導入した計算モデルについての検討を進めており,エントロピーを用いた状態フィルタの一実現法を提案している.本稿では,提案手法について連続行動空間へ適用範囲の拡張を試みる.
著者関連情報
© 2006 システム制御情報学会
前の記事 次の記事
feedback
Top