人工知能学会全国大会論文集
Online ISSN : 2758-7347
第39回 (2025)
セッションID: 3Win5-21
会議情報

NLEにおけるランダムネスとエピソード長に関する深層強化学習の課題とその分離
*清田 浩史
著者情報
キーワード: 深層強化学習
会議録・要旨集 フリー

詳細
抄録

強化学習環境であるNetHack Learning Environment (NLE) は• プレイ毎に異なるダンジョンが生成されるランダム性や広大な状態・行動空間,長いエピソード長による遅延報酬が特徴であり,深層強化学習による攻略が困難なことが知られている.この要因として,本稿では環境のランダム性に着目した.ランダム性の影響を評価するため,学習・評価時に乱数シードを固定しランダム性の排除を試みた. 結果,乱数シードを固定することで学習の速度は向上したため,少なくとも学習初期においてランダム性が学習を困難にしている要因であることが確かめられた.しかし,ランダム性を排除したとしても学習の進行は緩やかであり,ランダム性以外の要因の影響も受けていることが示唆された.

著者関連情報
© 2025 人工知能学会
前の記事 次の記事
feedback
Top