連続状態行動空間におけるActor-Criticを用いた群強化学習法

飯間 等; 黒江 康明

doi:10.11509/sci.SCI08.0.173.0

抄録

著者らは以前に複数のエージェントを用意して学習を行う群強化学習法を提案した。群強化学習法は通常の強化学習法とエージェント間の情報交換を併用して学習を行う方法であるが、これまでは状態行動空間が離散値である問題を扱い、通常の強化学習法として Q-learningを用いていた。しかし、群強化学習法は他の強化学習法を用いて他種の強化学習問題に適用することが可能である。そこで、本研究では状態行動空間が連続である問題を取り上げ、通常の強化学習法としてActor-Criticを用いた群強化学習法を提案する。

著者関連情報

お気に入り & アラート

お気に入りに追加
追加情報アラート
被引用アラート
認証解除アラート

閲覧履歴

205 Development of small size carbon dioxide gas absorber from digestive gas
ブラキシズム患者における上下顎遊離端欠損に対してインプラント補綴治療を行った症例
A Study of Swirling Flows in a Cyclone Separator Using a Large Eddy Simulation
絵画鑑賞における認知的制約とその緩和
非造影乳腺MR画像を用いた腫瘍の自動検出に関する予備的検討～複数の強調画像の信号値を用いた偽陽性削除～

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）