人工知能学会全国大会論文集
Online ISSN : 2758-7347
第31回 (2017)
セッションID: 4D1-OS-37c-2
会議情報

確率変数変換の学習によるノンパラメトリックな確率的方策の獲得
*横山 裕樹岡田 浩之
著者情報
会議録・要旨集 フリー

詳細
抄録

Actor-critic法や方策勾配法は行動や制御値として連続値を生成する方策の獲得を得意とするが, その方策空間は正規分布などに限定されることが多い. 本研究では,確率分布をパラメトリックに表現する代わりに,既知のノイズ分布からの変数変換によって間接的に表現し,ノンパラメトリックな確率的方策を獲得する強化学習手法を提案する.

著者関連情報
© 2017 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top