主催: 社団法人 人工知能学会
会議名: 2012年度人工知能学会全国大会(第26回)
回次: 26
開催地: 山口県山口市 山口県教育会館等
開催日: 2012/06/12 - 2012/06/15
ナッシュ均衡が複数存在するゲームでは,エージェントが最適な唯一の解に収束するためのインセンティブが必要となる。本稿では,スタグハントゲームを用いてエージェントが協力してスタグ(鹿)を狙うように導く報酬関数を逆強化学習によって推定する方法を提案する.また,本手法に対して,通常のQ学習において「スタグを狙う行動を獲得させる」報酬を試行錯誤的に設計する方法とを比較し,提案手法の有用性を示す