モデルベース学習を活用したDDPGのサンプル効率分析

塩谷 碩彬; 那須野 薫; 松尾 豊

doi:10.11517/pjsai.JSAI2017.0_2B14

第31回 (2017)

セッションID: 2B1-4

DOI https://doi.org/10.11517/pjsai.JSAI2017.0_2B14

会議情報

主催: 一般社団法人人工知能学会

会議名: 2017年度人工知能学会全国大会（第31回）

回次: 31

開催地: 愛知県名古屋市ウインクあいち

開催日: 2017/05/23 - 2017/05/26

モデルベース学習を活用したDDPGのサンプル効率分析

*塩谷碩彬, 那須野薫, 松尾豊

著者情報

会議録・要旨集フリー

詳細

抄録

深層強化学習は学習に多くの試行回数を必要とする。この問題を緩和する方法としてモデルベース強化学習があり、さらにモデルフリーの強化学習を組み合わせることで環境のモデルによる方策への制約を緩和しようという試みがある。本研究ではモデルベース学習を活用してモデルフリーの深層強化学習の手法であるDeep Deterministic Policy Gradientのサンプル効率が改善されるか否かを分析する。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）