システム制御情報学会 研究発表講演会講演論文集
第54回システム制御情報学会研究発表講演会
セッションID: W255
会議情報

連続行動空間への適用を考慮したSwitching強化学習
二次元連続行動空間への適用
*永吉 雅人村尾 元玉置 久
著者情報
会議録・要旨集 フリー

詳細
抄録
強化学習は,実用性といった観点から,状態空間や行動空間を予め適切に設計す ることが難しい. この点に留意し,状態空間および行動空間を共に適応的構成する計算モデルにつ いての検討を進めており,これまで,状態空間を固定した上で,行動空間に対する適応的構成を試みるため,Q-learningとActor-Criticを用いた切り替え型の強化学習法を提案している. 本稿では,2次元行動空間を有するロボットナビゲーション問題を対象とした計 算機実験を通して,提案手法の有効性・可能性について検討する.
著者関連情報
© 2010 システム制御情報学会
前の記事 次の記事
feedback
Top