抄録
本研究では、車輪型移動ロボットや外力を受けない多リンク宇宙ロボットのような速度拘束を受ける機械システムを対象とし、強化学習を用いて運動生成を行う。これらの機械システムは、ロボットのかたちを表す変数の変化が、拘束条件を介して配置空間上のロボットの置き方を表す変数を変化させるという構造を持っている。このような構造を考慮し、強化学習に対して、ロボットのかたちの変化を表す対称性を持たない変数のみを用いた予測モデルと、システムの拘束条件に基づいた配置空間の座標表現の使用を提案し、その効果を検討する。