抄録
著者らは以前に複数のエージェントを用意して学習を行う群強化学
習法を提案した。群強化学習法は通常の強化学習法とエージェント
間の情報交換を併用して学習を行う方法であるが、これまでは状態
行動空間が離散値である問題を扱い、通常の強化学習法として
Q-learningを用いていた。しかし、群強化学習法は他の強化学習法
を用いて他種の強化学習問題に適用することが可能である。そこで、
本研究では状態行動空間が連続である問題を取り上げ、通常の強化
学習法としてActor-Criticを用いた群強化学習法を提案する。