主催: 一般社団法人 人工知能学会
会議名: 2017年度人工知能学会全国大会(第31回)
回次: 31
開催地: 愛知県名古屋市 ウインクあいち
開催日: 2017/05/23 - 2017/05/26
報酬に各個体固有の効用導出関数を適用して得られる主観的効用を用いた強化学習において、協調行動を導く主観的効用を報酬に基づいて進化させる試みが行われている。しかし、その進化の過程は未だ解明されていない。 本研究では、マルチエージェント環境として繰り返し囚人のジレンマを対象にし、主観的効用の行動選択への影響や主観的効用とその進化の方向との関係に着目して主観的効用の進化過程を分析した。