抄録
自律移動ロボットなどのインテリジェントエージェントを実現するための重要な要素技術の一つとして強化学習がある。強化学習は教師信号を用いずに報酬のみに基づいてスキルや知識を獲得する点で望ましい考え方である。しかし、強化学習を実際の問題に適用する際には試行回数が膨大になるなどの多くの問題が存在する。そこで報酬とは別に副報酬をと忘却を適用する教示強化学習が提案され,有効であることが示されている.しかし強化学習性能と教示との関連は十分に解明されていないという問題点がある.そこで本研究では,教示が学習性能に与える影響を明確にするために,PSOを適用した強化学習システムからの教示知識の獲得方法を提案する.車の山登りタスクとアクロボットタスクの数値実験を通して,提案手法の妥当性を示した.