人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 1G5-OS-21b-02
会議情報

柔軟物体操作のためのプレイデータを用いたゴール条件付き自己教師あり学習
*石井 慶吾平松 駿野村 優太村田 真悟
著者情報
会議録・要旨集 フリー

詳細
抄録

生産現場や日常生活環境において、ケーブルや布等の柔軟物体を操作可能なロボットの実現が期待されている。柔軟物体は無数の形状を有することからその状態のモデリングが難しいため、データドリブンな深層学習の利用が有効なアプローチとして注目されている。その具体的な方法として強化学習や模倣学習があるが、それぞれ問題点がある。強化学習では、探索に用いるデータが多く必要であることから、データ収集の面で非効率である。一方、模倣学習では、一般にラベル付け(タスクの指定)が必要であるため、ロボットの可能な操作パターンを制限する。そこで本研究は、これらの柔軟物体操作におけるデータ収集コストとラベル付けに対処する新たなフレームワークを提案する。具体的には、人が好奇心のままにロボットを操作することで得られるプレイデータを収集し、そこから取り出された部分時系列を用いてゴール条件付き自己教師あり学習を行う。柔軟物体としてロープを用い、実ロボットを直接教示することで得られたプレイデータを用いて学習を行った結果、提案フレームワークの有用性が示された。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top