システム制御情報学会 研究発表講演会講演論文集
第52回システム制御情報学会研究発表講演会
セッションID: 2S2-2
会議情報

連続状態行動空間におけるActor-Criticを用いた群強化学習法
*飯間 等黒江 康明
著者情報
キーワード: 強化学習, Actor-Critic
会議録・要旨集 フリー

詳細
抄録
著者らは以前に複数のエージェントを用意して学習を行う群強化学 習法を提案した。群強化学習法は通常の強化学習法とエージェント 間の情報交換を併用して学習を行う方法であるが、これまでは状態 行動空間が離散値である問題を扱い、通常の強化学習法として Q-learningを用いていた。しかし、群強化学習法は他の強化学習法 を用いて他種の強化学習問題に適用することが可能である。そこで、 本研究では状態行動空間が連続である問題を取り上げ、通常の強化 学習法としてActor-Criticを用いた群強化学習法を提案する。
著者関連情報
© 2008 システム制御情報学会
前の記事 次の記事
feedback
Top