抄録
マルチエージェントの標準問題に追跡問題がある。これはマス目上で、4つのHunterが1つのPreyを追跡して捕獲する問題である。我々は、人間の視覚の「距離が遠くなると見えにくくなる」や「正面はよく見えるが左右方向は見えにくい」という特徴を表現した段階的視覚について研究を行ってきた。段階的視覚は、エージェントの視覚を「近傍」「近距離」「中距離」「遠距離」と段階的にし、距離と方向に応じて大雑把な情報しか得られないようにしたものである。離散環境では、段階的視覚でも学習が進み捕獲可能となることがわかった。 本研究では、より現実世界に近い環境を想定し、実数値環境の追跡問題に段階的視覚を導入した。実数値環境では離散環境とは異なり、各視覚段階の境界が明確でなくなるのでファジィ的に構成することで、視覚が徐々に変化していくことを表現した。また、学習はファジィQ-Learningを用いて行った。その結果、実数値環境に段階的視覚を導入した場合でも効果的に学習が行われ、Preyを捕獲できるという結果が得られた。