抄録
近年、ロボット技術の発展により自らが学習を行う機械学習への期待が高まってきており、マルチエージェントを用いた研究が行われている。本研究では、高次元入力空間を用いて複数の自律的なエージェントが協調し学習を行う環境を想定し、環境のモデルは、ハーフフィールドサッカーを用いる。攻撃者と守備者のエージェントをそれぞれ複数体用いて同時に学習を行い、攻撃者はゴールとアシスト、守備者はパスカットを目的として行動する。学習にはQ学習を使用し、状態空間は他のエージェント、ボール、ゴールを対象として、それらへの距離と角度から高次元入力空間を構成し実験を行った。