人工知能学会全国大会論文集
Online ISSN : 2758-7347
第32回 (2018)
セッションID: 3Pin1-08
会議情報

主成分分析による方策パラメータの低次元化を用いた直接方策探索の提案
*村田 悠稀宮下 恵矢野 史朗近藤 敏之
著者情報
会議録・要旨集 フリー

詳細
抄録

強化学習におけるサンプリングベース直接政策探索では、より高い次元の決定変数が最適値の悪化と学習速度の低下を引き起こす。 また、サンプリングのための確率分布の分散が、最適値と学習速度の両方に影響を及ぼすことを明らかにした。さらに、そこには最適値と学習速度との間のトレードオフが存在することも明らかになった。 本論文では、最適値を改善するためのサンプリング分布の分散に対する操作と, 学習速度を改善するための決定変数の次元削減の2つの手法を提案して、最適値を悪化させずに学習速度を向上させることを実現させた。

著者関連情報
© 2018 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top