モンテカルロ版 RGoal アルゴリズムの改良

一杉 裕志; 中田 秀基; 高橋 直人; 竹内 泉; 佐野崇

doi:10.11517/jsaisigtwo.2023.AGI-026_50

人工知能学会第二種研究会資料

Online ISSN : 2436-5556

第26回汎用人工知能研究会

モンテカルロ版 RGoal アルゴリズムの改良

一杉裕志, 中田秀基, 高橋直人, 竹内泉, 佐野崇

著者情報

研究報告書・技術報告書フリー

2024 年 2023 巻 AGI-026 号 p. 50-55

DOI https://doi.org/10.11517/jsaisigtwo.2023.AGI-026_50

詳細

抄録

我々は以前再帰的なサブルーチン呼び出しが可能な階層型強化学習アルゴリズム RGoal を提案した。本稿では RGoal のモンテカルロ版アルゴリズムにおける相対価値の基準値の定義を見直し、異なるタスクでサブルーチンが共有される場合の学習の安定化を図る。実装したアルゴリズムはいくつかのテストプログラムで動作を確認した。

著者関連情報

お気に入り & アラート

Detecting Learning Styles in Learning Management Systems Using Data Mining

発行機関からのお知らせ

第二種研究会の全記事は認証なしでアクセス可能です．また，各記事の著作権は原則として著者に帰属します．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）