人工知能学会全国大会論文集
第34回 (2020)
セッションID: 3Rin4-02
会議情報

物理パラメータのランダム化による耐故障ロボットのための強化学習
*岡本 航昇川本 一彦
著者情報
会議録・要旨集 フリー

詳細
抄録

強化学習では,コスト面や安全性の理由から,シミュレーション環境で方策を学習し,現実世界に適用することが一般的である.しかし,現実世界の外乱や故障によってシミュレーション環境とテスト環境のギャップが生まれるため,学習された方策のみでは適応できないことが多い.そのようなギャップを埋めるために,様々なシナリオに適応できる方策が必要である.本稿では,故障に対してロバストな方策獲得のための強化学習手法を提案する.提案手法では,故障をロボットの物理パラメータの調整によって表現する.学習時に物理パラメータをランダム化することで様々な故障の下での強化学習を実現している.評価実験では,故障が発生するシミュレーション環境下での4足歩行タスクに対して,提案手法によるロボットが通常のロボットよりも高い平均報酬を獲得したことを示す.さらに故障がない環境下でも評価したところ,同様に提案手法によるロボットはより高い平均報酬を獲得することができた.

著者関連情報
© 2020 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top