抄録
多くの知能ロボットは、人間が設計した行動規則によって制御されているが、環境との相互作用や複雑なタスクに対してその設計が困難となる。そのため、エージェント自身の自律的学習が求められる。その一つとして、近年動物の調教に基づくShapingの概念をロボットの行動学習に応用する研究が知られている。Shapingは学習者が容易に実行できる行動から複雑な行動へと段階的、誘導的に強化信号を与えられ、次第に希望の行動系列を形成する概念である。
本研究では、すでに提案されている階層型ファジィ行動制御の上位の行動選択ルールを強化学習によって自動獲得するファジィ状態分割型強化学習にShapingの概念を取り入れ、人間が適宜報酬を与えることによってロボットに効率的な学習をさせる手法を提案する。