人工知能学会全国大会論文集
Online ISSN : 2758-7347
第31回 (2017)
セッションID: 2B1-4
会議情報

モデルベース学習を活用したDDPGのサンプル効率分析
*塩谷 碩彬那須野 薫松尾 豊
著者情報
会議録・要旨集 フリー

詳細
抄録

深層強化学習は学習に多くの試行回数を必要とする。この問題を緩和する方法としてモデルベース強化学習があり、さらにモデルフリーの強化学習を組み合わせることで環境のモデルによる方策への制約を緩和しようという試みがある。本研究ではモデルベース学習を活用してモデルフリーの深層強化学習の手法であるDeep Deterministic Policy Gradientのサンプル効率が改善されるか否かを分析する。

著者関連情報
© 2017 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top