抄録
近年,様々なタスクを行うことが可能な多自由度ロボットの開発が行われており,多自由度ロボットを自律的に制御するための方法として強化学習が注目を集めている.しかし,強化学習を多自由度ロボットに適用するためには,状態・行動空間の組み合わせ爆発と汎化能力の欠如という2つの問題を解決する必要がある.本論文では,これらの問題を解決することを目標とし,実世界の性質を利用できるよう身体を適切に設計することで,状態・行動空間の情報の低次元化を行う.具体的には,タコの振る舞いを参考として,同様の振る舞いを機構的に実現可能なマニピュレータを開発し,物体を把持し目的地まで移動させるタスクを例に検証を行い,これらの問題が解決可能であることを確認する.