抄録
Shapingは学習者が容易に実行できる行動から複雑な行動へと段階的、誘導的に強化信号を与え、次第に希望の行動系列を形成する概念である。本研究では繰り返し探索により自律的に目標行動を獲得できる強化学習にShapingの概念を取り入れたShaping強化学習を提案する。有効なShaping効果を検証するために強化学習の代表的なQ-Learning、Profit Sharing、Actor-Criticの3手法を用いた異なるShaping強化学習を提案し、グリッド探索問題のシミュレータを用いて比較実験を行なった。さらに、実際の動物などの調教の場では段階を追って行動を強化する「分化強化」という概念をShaping強化学習に取り入れた分化強化型Shaping Q-Learning(DR-SQL)を提案し、シミュレーション実験により有効な手法であることを確認した。