実世界マルチエージェントの手本を用いた強化学習における適応的な行動の活用

藤井 慶輔; 筒井 和詩; スコット アトム; 中原 啓; 武石 直也; 河原 吉伸

doi:10.11517/pjsai.JSAI2024.0_1E5GS504

第38回 (2024)

セッションID: 1E5-GS-5-04

DOI https://doi.org/10.11517/pjsai.JSAI2024.0_1E5GS504

会議情報

主催: 一般社団法人人工知能学会

会議名: 2024年度人工知能学会全国大会（第38回）

回次: 38

開催地: アクトシティ浜松＋オンライン

開催日: 2024/05/28 - 2024/05/31

実世界マルチエージェントの手本を用いた強化学習における適応的な行動の活用

*藤井慶輔, 筒井和詩, スコットアトム, 中原啓, 武石直也, 河原吉伸

著者情報

キーワード: 強化学習, 機械学習, スポーツ, 深層学習

会議録・要旨集フリー

詳細

抄録

実世界の生物学的マルチエージェントを強化学習でモデル化する場合、ソースとなる実世界のデータとターゲットとなる強化学習環境の間にドメインギャップがあるため、ターゲットダイナミクスを未知のソースダイナミクスに適応させることが必要である。そこで本研究では、実世界のdemonstrationから、マルチエージェント強化学習におけるドメイン適応のための方法として、ソースの行動をターゲットの行動に適応させた情報を教師として用いる強化学習手法を提案する。2対1の追跡-逃避や、サッカーの2対2および4対8などの限定的な状況において、ベースラインと比べてデータを模倣し、かつ報酬を獲得できるエージェントを学習したことを示した。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）