マルチエージェント強化学習における主観的効用の進化過程に関する分析

宮脇 昌哉; 森山 甲一; 武藤 敦子; 松井 藤五郎; 犬塚 信博

doi:10.11517/pjsai.JSAI2017.0_2P41

第31回 (2017)

セッションID: 2P4-1

DOI https://doi.org/10.11517/pjsai.JSAI2017.0_2P41

会議情報

主催: 一般社団法人人工知能学会

会議名: 2017年度人工知能学会全国大会（第31回）

回次: 31

開催地: 愛知県名古屋市ウインクあいち

開催日: 2017/05/23 - 2017/05/26

マルチエージェント強化学習における主観的効用の進化過程に関する分析

*宮脇昌哉, 森山甲一, 武藤敦子, 松井藤五郎, 犬塚信博

著者情報

会議録・要旨集フリー

詳細

抄録

報酬に各個体固有の効用導出関数を適用して得られる主観的効用を用いた強化学習において、協調行動を導く主観的効用を報酬に基づいて進化させる試みが行われている。しかし、その進化の過程は未だ解明されていない。本研究では、マルチエージェント環境として繰り返し囚人のジレンマを対象にし、主観的効用の行動選択への影響や主観的効用とその進化の方向との関係に着目して主観的効用の進化過程を分析した。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）