人間とロボットの共存に向けて,ロボットが自律的に行動を獲得するための技術が必要不可欠であり,強化学習はその技術として有望な手法である.我々は,実機ロボットを対象とした強化学習に関する研究を進めている.これまでに,六脚ロボットに価値反復を用いた強化学習を適用し,前進行動が獲得できることを示した.しかしながら,獲得した前進行動は,各ステップ毎に静止する行動であり,滑らかな行動パターンではなかった.そこで,本研究では,連続的なパターンを生成できるCPG (Central Pattern Generator)を用いて,各ステップ毎で静止しない滑らかな前進行動パターンを強化学習により獲得することを検討する.