抄録
カーレースゲームとはIEEE CEC 2007 Car Racing Competition で行われたプログラム同士の対戦ゲームで、2台のカーエージェントが2次元平面上の目標を目指しながら行動して一定時間内の得点を競うものである。対戦ゲームでは、目標に対して自分が相手より有利な場合、目標を通過したときに次の目標が前方に位置するように行動するのが良いと考えられる。既存の研究では、そのような行動を学習するために、カーエージェントの正面から左右45°を前方と定義し、ファジィQ学習を用いて目標が前方に位置すればカーエージェントに追加報酬を与えていた。本研究では目標がよりカーエージェントの正面に位置するような行動を学習できるように、角度の範囲を狭める方法と目標が正面に近いほど報酬を多く与える方法を提案する。さらに目標が前方に位置しない場合に負の報酬を与える場合についても調べた。シミュレーションの結果、正面に近いほど報酬を多く与える方法と負の報酬を与える方法の組み合わせが一番良いことが分かった。