計測自動制御学会論文集
Online ISSN : 1883-8189
Print ISSN : 0453-4654
ISSN-L : 0453-4654
ショート・ペーパー
適格度トレースを用いたポートハミルトン系のための決定論的方策勾配法の提案と数値実験による検証
福永 修一小久保 燎太
著者情報
ジャーナル フリー

2023 年 59 巻 4 号 p. 232-234

詳細
抄録

This paper proposes a deterministic policy gradient method for port-Hamiltonian systems using an eligibility trace. The deterministic policy gradient method commonly uses one of two types of algorithms, either the on- or off-policy method. The proposed algorithm employs the off-policy method to perform a probabilistic search. In addition, we introduce an eligibility trace to the method to speed up the learning process. A numerical simulation shows the effectiveness of the proposed method.

著者関連情報
© 2023 公益社団法人 計測自動制御学会
前の記事
feedback
Top