n人ネットワークの繰り返し囚人のジレンマゲームにおける利得設計

鈴木 香名子; 荒井 幸代

doi:10.11517/pjsai.JSAI2010.0_1C31

第24回 (2010)

セッションID: 1C3-1

DOI https://doi.org/10.11517/pjsai.JSAI2010.0_1C31

会議情報

主催: 社団法人人工知能学会

会議名: 2010年度人工知能学会全国大会（第24回）

回次: 24

開催地: 長崎県長崎市長崎ブリックホール

開催日: 2010/06/09 - 2010/06/11

n人ネットワークの繰り返し囚人のジレンマゲームにおける利得設計

*鈴木香名子, 荒井幸代

著者情報

会議録・要旨集フリー

詳細

抄録

個々のエージェントの利益と系全体の利益が一致しない環境下でのマルチエージェント強化学習では，協調行動を創発するための報酬設計は重要な課題である。本稿では3人以上のエージェントがそれぞれ局所的に囚人のジレンマゲームを繰り返す環境を対象とする。　ジレンマ解消のため，エージェントが独自の効用を生成するという報酬設計法を適用し，実験を通じて，系全体の協調が維持される効用の値や学習率について考察する。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）