人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 1E5-GS-5-04
会議情報

実世界マルチエージェントの手本を用いた強化学習における適応的な行動の活用
*藤井 慶輔筒井 和詩スコット アトム中原 啓武石 直也河原 吉伸
著者情報
会議録・要旨集 フリー

詳細
抄録

実世界の生物学的マルチエージェントを強化学習でモデル化する場合、ソースとなる実世界のデータとターゲットとなる強化学習環境の間にドメインギャップがあるため、ターゲットダイナミクスを未知のソースダイナミクスに適応させることが必要である。そこで本研究では、実世界のdemonstrationから、マルチエージェント強化学習におけるドメイン適応のための方法として、ソースの行動をターゲットの行動に適応させた情報を教師として用いる強化学習手法を提案する。2対1の追跡-逃避や、サッカーの2対2および4対8などの限定的な状況において、ベースラインと比べてデータを模倣し、かつ報酬を獲得できるエージェントを学習したことを示した。

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top