人工知能学会全国大会論文集
Online ISSN : 2758-7347
第26回 (2012)
セッションID: 1L2-R-7-9
会議情報

逆強化学習による複数均衡下での均衡収束の実現
*荒井 幸代鈴木 香名子大喜多 周
著者情報
会議録・要旨集 フリー

詳細
抄録

ナッシュ均衡が複数存在するゲームでは,エージェントが最適な唯一の解に収束するためのインセンティブが必要となる。本稿では,スタグハントゲームを用いてエージェントが協力してスタグ(鹿)を狙うように導く報酬関数を逆強化学習によって推定する方法を提案する.また,本手法に対して,通常のQ学習において「スタグを狙う行動を獲得させる」報酬を試行錯誤的に設計する方法とを比較し,提案手法の有用性を示す

著者関連情報
© 2012 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top