人工知能学会全国大会論文集
Online ISSN : 2758-7347
第31回 (2017)
セッションID: 2P4-1
会議情報

マルチエージェント強化学習における主観的効用の進化過程に関する分析
*宮脇 昌哉森山 甲一武藤 敦子松井 藤五郎犬塚 信博
著者情報
会議録・要旨集 フリー

詳細
抄録

報酬に各個体固有の効用導出関数を適用して得られる主観的効用を用いた強化学習において、協調行動を導く主観的効用を報酬に基づいて進化させる試みが行われている。しかし、その進化の過程は未だ解明されていない。 本研究では、マルチエージェント環境として繰り返し囚人のジレンマを対象にし、主観的効用の行動選択への影響や主観的効用とその進化の方向との関係に着目して主観的効用の進化過程を分析した。

著者関連情報
© 2017 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top