人工知能学会第二種研究会資料
Online ISSN : 2436-5556
第26回汎用人工知能研究会
モンテカルロ版 RGoal アルゴリズムの改良
一杉 裕志中田 秀基高橋 直人竹内 泉佐野崇
著者情報
研究報告書・技術報告書 フリー

2024 年 2023 巻 AGI-026 号 p. 50-55

詳細
抄録

我々は以前再帰的なサブルーチン呼び出しが可能な階層型強化学習アルゴリズム RGoal を提案した。本稿では RGoal のモンテカルロ版アルゴリズムにおける相対価値の基準値の定義を見直し、異なるタスクでサブルーチンが共有される場合の学習の安定化を図る。実装したアルゴリズムはいくつかのテストプログラムで動作を確認した。

著者関連情報
© 2024 著作者
前の記事 次の記事
feedback
Top