抄録
近年の強化学習分野においては,自律ロボットへの適用などの複雑なアプリケーションが増えていく中で,複数のエージェントを用いた学習が注目を集めている。本研究では,複数のエージェントが協調あるいは競合しながら学習を行うモデルとしてサッカーを用いたシミュレーションを行った。このモデルは,攻撃者2,守備者の2合計4体のエージェントが学習を行い,攻撃者はゴールを,守備者はパスカットを目的とする。学習にはProfit Sharingを使用し,状態空間は他のエージェントおよびボールとゴールの5つの対象への距離と角度から10次元空間を構成した。また行動は,パス、シュートなどエージェントにタイプによって数種類を準備し、実験を行った。