人工知能学会全国大会論文集
Online ISSN : 2758-7347
第33回 (2019)
セッションID: 3D4-OS-4b-01
会議情報

階層型強化学習 RGoal アーキテクチャへの再帰呼び出し用スタックの導入
*一杉 裕志高橋 直人中田 秀基佐野 崇
著者情報
会議録・要旨集 フリー

詳細
抄録

人間は何か目的を達成するために適切なサブゴールを設定できる。 さらに必要に応じてそのサブゴールを再帰的に設定することができ、その再帰の深さには制約がないように見える。 我々はこれまでに、この振る舞いにヒントを得た階層型強化学習の新しいアーキテクチャとして、RGoal アーキテクチャを提案した。 本稿では、サブルーチンの再利用性を高めるために、 アーキテクチャに呼び出し用スタックを導入する方法を提案する。 そして、マルチタスク環境での迷路タスクにより性能を評価した。 その結果、スタックの深さの最大値が大きいほど、収束が早くなる傾向がみられた。 今後このアーキテクチャを拡張し、脳の前頭前野周辺の情報処理機構のモデルを構築することを目指す。

著者関連情報
© 2019 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top