電気学会論文誌C(電子・情報・システム部門誌)
Online ISSN : 1348-8155
Print ISSN : 0385-4221
ISSN-L : 0385-4221
<ロボティクス>
複数の状態行動価値表を用いたR学習の高速化
石川 浩一郎櫻井 彰人藤波 努國藤 進
著者情報
ジャーナル フリー

2006 年 126 巻 1 号 p. 72-82

詳細
抄録

We propose a method to improve the performance of R-learning, a reinforcement learning algorithm, by using multiple state-action value tables. Unlike Q- or Sarsa learning, R-learning learns a policy to maximize undiscounted rewards. Multiple state-action value tables cause substantial explorations as needed and make R-learnings to work well. Efficiency of the proposed method is verified through experiments in simulation environment.

著者関連情報
© 電気学会 2006
前の記事 次の記事
feedback
Top