人工知能学会全国大会論文集
Online ISSN : 2758-7347
第24回 (2010)
セッションID: 1C3-1
会議情報

n人ネットワークの繰り返し囚人のジレンマゲームにおける利得設計
*鈴木 香名子荒井 幸代
著者情報
会議録・要旨集 フリー

詳細
抄録

個々のエージェントの利益と系全体の利益が一致しない環境下でのマルチエージェント強化学習では,協調行動を創発するための報酬設計は重要な課題である。 本稿では3人以上のエージェントがそれぞれ局所的に囚人のジレンマゲームを繰り返す環境を対象とする。 ジレンマ解消のため,エージェントが独自の効用を生成するという報酬設計法を適用し,実験を通じて,系全体の協調が維持される効用の値や学習率について考察する。

著者関連情報
© 2010 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top