人工知能学会全国大会論文集
Online ISSN : 2758-7347
第34回 (2020)
セッションID: 1Q4-GS-11-02
会議情報

複数のエキスパートポリシーによるResidual Reinforcement Learningを用いた整列動作の学習
*柳沼 和樹中村 友昭嘉藤 佑亮長井 隆行小澤 順
著者情報
会議録・要旨集 フリー

詳細
抄録

ロボットが効率的にタスクを達成するため,エキスパートによるデモンストレーションから得られた軌道を強化学習によって補正する手法が提案されている. しかし,従来手法のエキスパートの軌道は一つを想定しており,複雑なタスクではエキスパートが複数のポリシーを利用する場合が考えられる. 本稿では,エキスパートのデモンストレーションから複数のエキスパートポリシーを学習し, 強化学習によって補正を行うResidual Reinforcement Learningを提案する. 実験では物体の整列タスクにより,複数のエキスパートポリシーを活用することで,エキスパートによる軌道のみを用いた場合よりも高精度な整列が可能となることを示す.

著者関連情報
© 2020 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top