知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
ISSN-L : 1347-7986
原著論文
Fuzzy ARTと経験獲得処理を用いて段階的にサブゴールを生成する階層型強化学習
黒須 宏道黒堂 裕也眞部 雄介
著者情報
ジャーナル フリー

2023 年 35 巻 4 号 p. 759-768

詳細
抄録

強化学習に内発的動機づけ機構を組み込んだアプローチの1つとして,階層型強化学習がある.階層型強化学習は,Agentの内部機構を問題解決のための上位方策(サブゴールの適用順序)と下位方策(サブゴールまでの行動系列)の2つに分割し,それぞれを学習するものである.サブゴールの定義が適切であれば,従来の強化学習では解決が困難な報酬が疎な環境や長い行動系列の学習を必要とする環境でも問題解決ができることが示されている.しかしながら,既存の階層型強化学習は,問題解決に必要なサブゴール群が事前に得られていることが前提となっており,自律的な強化学習を実現するアルゴリズムとなっていない.そこで本研究では,問題解決に必要な経験や適切なサブゴール群を徐々に生成する仕組みを導入した新しい強化学習アルゴリズムであるStepwise Unified Hierarchical Reinforcement Learning(SUHRL)を提案する.SUHRLは,Fuzzy ARTによる段階的なクラスタリングと経験獲得処理を行うことで,適切なサブゴールを段階的に生成して問題解決を行う.MiniGrid環境やMontezuma’s Revengeを用いた評価実験の結果,提案手法によって段階的に必要なサブゴールを生成することができ,自律的に問題解決できることを示す.

著者関連情報
© 2023 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top