主催: 一般社団法人 人工知能学会
会議名: 2019年度人工知能学会全国大会(第33回)
回次: 33
開催地: 新潟県新潟市 朱鷺メッセ
開催日: 2019/06/04 - 2019/06/07
深層強化学習においては,探索が不十分な場合や,報酬がスパースな場合に学習が収束が困難である.加えて,特定のタスクでは探索の回数自体が限られている場合がある.従って,上記の課題を解決しつつ解きたいタスクとは別のソースタスクにおいて事前に学習を行い,解きたい様々なターゲットタスクでの学習を効率化することが効果的であると考えられる.本研究では,進化的計算と方策勾配法を組み合わせた事前学習を行うことで,ターゲットタスクで効率的な学習が可能なモデルを得る手法を提案する.本手法では,複数のニューラルネットワークによる多様な探索を行い,進化的計算と方策勾配法による学習を行うことで汎用的なモデルを得ることを目指す.3次元制御タスクにおける実験では,複数のソースタスクにおいて提案手法による事前学習を行うことで得たモデルが,ターゲットタスクとなる複数のタスクで高いパフォーマンスを発揮できることを示した.