人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 1E5-GS-5-03
会議情報

マルチエージェント強化学習環境下における有用な評価関数の特定
*磯部 良隆森山 甲一武藤 敦子島 孔介松井 藤五郎犬塚 信博
著者情報
会議録・要旨集 フリー

詳細
抄録

複数のエージェントが存在するマルチエージェント環境においては、エージェント同士が干渉し合い、全エージェントの報酬を同時に最大化することが不可能なことが多い。そのため、報酬の最大化を追求する強化学習による協調行動の学習は困難である。一方、学習と意思決定を行う際に複数の情報を参照する内発的動機付け強化学習(IMRL)フレームワークの下で、Sequeiraらは、遺伝的プログラミング(GP)により、シングルエージェント環境における意思決定に有用な評価関数を特定した。本研究では、この手法をマルチエージェント環境に適用する。複数のエージェントが獲物を捕獲する追跡問題において、それぞれ独立に学習するエージェントが獲物を捕獲するための協調行動を学習するために有用な評価関数を、GPにより特定できるかを検証する。

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top