主催: 社団法人 人工知能学会
会議名: 2010年度人工知能学会全国大会(第24回)
回次: 24
開催地: 長崎県長崎市 長崎ブリックホール
開催日: 2010/06/09 - 2010/06/11
個々のエージェントの利益と系全体の利益が一致しない環境下でのマルチエージェント強化学習では,協調行動を創発するための報酬設計は重要な課題である。 本稿では3人以上のエージェントがそれぞれ局所的に囚人のジレンマゲームを繰り返す環境を対象とする。 ジレンマ解消のため,エージェントが独自の効用を生成するという報酬設計法を適用し,実験を通じて,系全体の協調が維持される効用の値や学習率について考察する。