柔軟物体操作のためのプレイデータを用いたゴール条件付き自己教師あり学習

石井 慶吾; 平松 駿; 野村 優太; 村田 真悟

doi:10.11517/pjsai.JSAI2023.0_1G5OS21b02

第37回 (2023)

セッションID: 1G5-OS-21b-02

DOI https://doi.org/10.11517/pjsai.JSAI2023.0_1G5OS21b02

会議情報

主催: 一般社団法人人工知能学会

会議名: 2023年度人工知能学会全国大会（第37回）

回次: 37

開催地: 熊本城ホール＋オンライン

開催日: 2023/06/06 - 2023/06/09

柔軟物体操作のためのプレイデータを用いたゴール条件付き自己教師あり学習

*石井慶吾, 平松駿, 野村優太, 村田真悟

著者情報

キーワード: ロボット学習, 深層学習, 自己教師あり学習, 柔軟物体操作, プレイデータ

会議録・要旨集フリー

詳細

抄録

生産現場や日常生活環境において、ケーブルや布等の柔軟物体を操作可能なロボットの実現が期待されている。柔軟物体は無数の形状を有することからその状態のモデリングが難しいため、データドリブンな深層学習の利用が有効なアプローチとして注目されている。その具体的な方法として強化学習や模倣学習があるが、それぞれ問題点がある。強化学習では、探索に用いるデータが多く必要であることから、データ収集の面で非効率である。一方、模倣学習では、一般にラベル付け（タスクの指定）が必要であるため、ロボットの可能な操作パターンを制限する。そこで本研究は、これらの柔軟物体操作におけるデータ収集コストとラベル付けに対処する新たなフレームワークを提案する。具体的には、人が好奇心のままにロボットを操作することで得られるプレイデータを収集し、そこから取り出された部分時系列を用いてゴール条件付き自己教師あり学習を行う。柔軟物体としてロープを用い、実ロボットを直接教示することで得られたプレイデータを用いて学習を行った結果、提案フレームワークの有用性が示された。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）