人工知能学会全国大会論文集
Online ISSN : 2758-7347
第31回 (2017)
セッションID: 2P4-4in1
会議情報

逐次的自然方策勾配推定のための適応的学習率
*岩城 諒横山 裕樹浅田 稔
著者情報
会議録・要旨集 フリー

詳細
抄録

自然方策勾配の逐次推定はTD誤差の線形近似という形式で表現できるが,その安定性は学習率などの設定に対し敏感である.本研究では,パラメータ更新が停留点を越えないことを保証する Online importance weight aware update を,逐次的自然方策勾配法に適用する.理論解析により,従来法の不安定性と提案法の安定性を示す.さらに,数値実験により提案法の頑健さを示す.

著者関連情報
© 2017 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top