マルチエージェント強化学習環境下における有用な評価関数の特定

磯部 良隆; 森山 甲一; 武藤 敦子; 島 孔介; 松井 藤五郎; 犬塚 信博

doi:10.11517/pjsai.JSAI2024.0_1E5GS503

第38回 (2024)

セッションID: 1E5-GS-5-03

DOI https://doi.org/10.11517/pjsai.JSAI2024.0_1E5GS503

会議情報

主催: 一般社団法人人工知能学会

会議名: 2024年度人工知能学会全国大会（第38回）

回次: 38

開催地: アクトシティ浜松＋オンライン

開催日: 2024/05/28 - 2024/05/31

マルチエージェント強化学習環境下における有用な評価関数の特定

*磯部良隆, 森山甲一, 武藤敦子, 島孔介, 松井藤五郎, 犬塚信博

著者情報

キーワード: 強化学習, 内発的動機付け強化学習, 遺伝的プログラミング

会議録・要旨集フリー

詳細

抄録

複数のエージェントが存在するマルチエージェント環境においては、エージェント同士が干渉し合い、全エージェントの報酬を同時に最大化することが不可能なことが多い。そのため、報酬の最大化を追求する強化学習による協調行動の学習は困難である。一方、学習と意思決定を行う際に複数の情報を参照する内発的動機付け強化学習(IMRL)フレームワークの下で、Sequeiraらは、遺伝的プログラミング(GP)により、シングルエージェント環境における意思決定に有用な評価関数を特定した。本研究では、この手法をマルチエージェント環境に適用する。複数のエージェントが獲物を捕獲する追跡問題において、それぞれ独立に学習するエージェントが獲物を捕獲するための協調行動を学習するために有用な評価関数を、GPにより特定できるかを検証する。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）