抄録
カーレースゲームとは、IEEE 2007 Car Racing Competitionで行われているコンピュータプログラム同士の対戦ゲームで、2台のカーエージェントが実数値環境である2次元平面上の目標を目指し得点を競うものである。現在の目標を通過すると、次の目標が現在の目標になる。カーエージェントは行動するごとに自分と対戦相手と現在の目標と次の目標に関する情報を得ることができ、それを基に行動を決定する。本研究では、カーレースゲームに強化学習の手法の一つであるQ学習を拡張したファジィQ学習を適用し、対戦相手がいない状況でカーエージェントが目標を通過するための最適な行動獲得を目指す。。状態は現在の目標との距離と角度とカーエージェントの速さとし、それぞれファジィ集合を定義する。数値実験ではいくつかの報酬の与え方でシミュレーションを行い、性能を調べた。