階層型強化学習 RGoal アーキテクチャへの再帰呼び出し用スタックの導入

一杉 裕志; 高橋 直人; 中田 秀基; 佐野 崇

doi:10.11517/pjsai.JSAI2019.0_3D4OS4b01

第33回 (2019)

セッションID: 3D4-OS-4b-01

DOI https://doi.org/10.11517/pjsai.JSAI2019.0_3D4OS4b01

会議情報

主催: 一般社団法人人工知能学会

会議名: 2019年度人工知能学会全国大会（第33回）

回次: 33

開催地: 新潟県新潟市朱鷺メッセ

開催日: 2019/06/04 - 2019/06/07

階層型強化学習 RGoal アーキテクチャへの再帰呼び出し用スタックの導入

*一杉裕志, 高橋直人, 中田秀基, 佐野崇

著者情報

キーワード: 階層型強化学習, モデルベース強化学習, ゼロショット学習

会議録・要旨集フリー

詳細

抄録

人間は何か目的を達成するために適切なサブゴールを設定できる。さらに必要に応じてそのサブゴールを再帰的に設定することができ、その再帰の深さには制約がないように見える。我々はこれまでに、この振る舞いにヒントを得た階層型強化学習の新しいアーキテクチャとして、RGoal アーキテクチャを提案した。本稿では、サブルーチンの再利用性を高めるために、アーキテクチャに呼び出し用スタックを導入する方法を提案する。そして、マルチタスク環境での迷路タスクにより性能を評価した。その結果、スタックの深さの最大値が大きいほど、収束が早くなる傾向がみられた。今後このアーキテクチャを拡張し、脳の前頭前野周辺の情報処理機構のモデルを構築することを目指す。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）