軌道学習における試行回数削減のための強化学習手法

嘉藤 佑亮; 中村 友昭; 長井 隆行; 山野辺 夏樹; 永田 和之; 小澤 順

doi:10.11517/pjsai.JSAI2018.0_2A302

第32回 (2018)

セッションID: 2A3-02

DOI https://doi.org/10.11517/pjsai.JSAI2018.0_2A302

会議情報

主催: 一般社団法人人工知能学会

会議名: 2018年度人工知能学会全国大会（第32回）

回次: 32

開催地: 鹿児島県鹿児島市城山ホテル鹿児島

開催日: 2018/06/05 - 2018/06/08

軌道学習における試行回数削減のための強化学習手法

*嘉藤佑亮, 中村友昭, 長井隆行, 山野辺夏樹, 永田和之, 小澤順

著者情報

会議録・要旨集フリー

詳細

抄録

近年，ロボットの自律的動作の実現を目指して深層強化学習の研究が多くなされている．深層強化学習では学習結果として十分な性能を実現するまでに何千回，何万回といった非常に多くの回数の試行を必要とする．しかしながら，実環境の学習では人の手を必要とすることが多く，何千回という試行回数を行うことは非現実的である．そこで本研究では，事前に人がタスクに関する知識を与えることで効率的な探索を行い，学習データベースを作成する．そしてそのデータベースを使用してミニバッチ学習を行うことで比較的少ない試行回数による学習を実現する．本提案手法を物流倉庫内におけるピッキング作業の学習に適応し，その結果を他の手法と比較することで本提案手法の有用性を示す．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）