主成分分析による方策パラメータの低次元化を用いた直接方策探索の提案

村田 悠稀; 宮下 恵; 矢野 史朗; 近藤 敏之

doi:10.11517/pjsai.JSAI2018.0_3Pin108

第32回 (2018)

セッションID: 3Pin1-08

DOI https://doi.org/10.11517/pjsai.JSAI2018.0_3Pin108

会議情報

主催: 一般社団法人人工知能学会

会議名: 2018年度人工知能学会全国大会（第32回）

回次: 32

開催地: 鹿児島県鹿児島市城山ホテル鹿児島

開催日: 2018/06/05 - 2018/06/08

主成分分析による方策パラメータの低次元化を用いた直接方策探索の提案

*村田悠稀, 宮下恵, 矢野史朗, 近藤敏之

著者情報

会議録・要旨集フリー

詳細

抄録

強化学習におけるサンプリングベース直接政策探索では、より高い次元の決定変数が最適値の悪化と学習速度の低下を引き起こす。また、サンプリングのための確率分布の分散が、最適値と学習速度の両方に影響を及ぼすことを明らかにした。さらに、そこには最適値と学習速度との間のトレードオフが存在することも明らかになった。本論文では、最適値を改善するためのサンプリング分布の分散に対する操作と, 学習速度を改善するための決定変数の次元削減の2つの手法を提案して、最適値を悪化させずに学習速度を向上させることを実現させた。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）