ロボティクス・メカトロニクス講演会講演概要集
Online ISSN : 2424-3124
セッションID: 1A1-M03
会議情報
1A1-M03 高次元空間における行動生成のための大域的・局所的最適制御法(進化・学習とロボティクス)
関口 拓生小林 祐一
著者情報
会議録・要旨集 フリー

詳細
抄録
Reinforcement learning is effective in acquisition of optimal control policy. However, the calculation amount increases in high-dimensional space. In this paper, we propose a global and local optimal control method using dynamic programming(DP) and differential dynamic programming(DDP). In the global part, approximate the optimal trajectory in the state space by DP. In the local part, optimize the approximate trajectory in the neighborhood by DDP. The proposed method can reduce the calculation amount in optimal control.
著者関連情報
© 2011 一般社団法人 日本機械学会
前の記事 次の記事
feedback
Top