抄録
マルチエージェント学習での協調行動獲得において,エージェントが学習の拠り所とする知覚情報の捉え方の抽象さを本研究では視点粒度と呼ぶ.視点粒度を相手の位置に関する空間的粒度と行動連鎖による時間的なものに分類する.前者は同時間にその粒度を揃えるべきもので共同注視に関する研究などが知られている.本研究では後者の時間的なものについてもその粒度が揃うことの有用性を検証する.強化学習で一連の行動を固定したルールを生成するチェインによって作られたルール長さが1つの視点粒度だと考え追跡問題に適用したところ,一連の行動の時間長さが同じとなるルールを持つことが追跡問題を解く上で有効であることがわかった.