主催: 一般社団法人 人工知能学会
会議名: 2014年度人工知能学会全国大会(第28回)
回次: 28
開催地: 愛媛県松山市 ひめぎんホール
開催日: 2014/05/12 - 2014/05/15
従来、社会的ジレンマのモデルとしてゲーム理論を用い、協調行動の発生が議論されてきた。本研究では、各プレイヤーが報酬により行動を変える強化学習の枠組みを仮定し、代表的なゲームの一つである繰り返し囚人のジレンマを検討した。すべてのプレイヤーの行動履歴を状態遷移行列で表現し、そのダイナミクスを分析した。その結果、より長い行動履歴に基づき学習するほど、協調行動が安定して発生することが明らかになった。