主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
Model-Based Entropy-Regularized Imitation Learning (MB-ERIL)は方策と状態遷移モデルのエントロピ正則を導入したオンラインのモデルベース敵対的生成模倣学習である.Online-MB-ERILはエキスパートデータ以外に学習エージェントの方策が実環境やモデルとそれぞれインタラクションして得られる3種類のデータから学習する.本報告では,学習エージェントと実環境から得られるデータを使用しないことで,オフライン学習の形式にした場合について考察する.次にPositive and Unlabeled data学習の考えを導入したOffline-MB-ERILを提案する.準最適なデータが与えられたとき,Offline-MB-ERILはラベルなしデータとして利用することで,方策やモデルの推定性能を改善することができる.視覚ベースの腕のリーチング課題を通して,Online-MB-ERILよりもOffline-MB-ERILの方が準最適データを有効に利用できることを示す.