ロボティクス・メカトロニクス講演会講演概要集
Online ISSN : 2424-3124
セッションID: 2P1-F30
会議情報
2P1-F30 連続な状態行動空間において学習可能なQ-learningの提案
山田 和明
著者情報
会議録・要旨集 フリー

詳細
抄録
This paper proposes the new Q-learning that can learn mapping from continue state spaces to continue action spaces. The proposed method estimates the expectation value of actions on a state by using artificial neural networks, and decides an action according to the distribution of the estimated expectation value. In this paper, we investigate the performance of the proposed method through two types of simple experimentations.
著者関連情報
© 2010 一般社団法人 日本機械学会
前の記事 次の記事
feedback
Top