人工知能学会全国大会論文集
Online ISSN : 2758-7347
第35回 (2021)
セッションID: 2J4-GS-8c-05
会議情報

スキルに基づく探索方策による世界モデルの学習
*近藤 生也岩澤 有祐松尾 豊
著者情報
キーワード: 世界モデル, スキル学習
会議録・要旨集 フリー

詳細
抄録

エージェントが得る観測が時間やエージェントの行動に従ってどのように発展するかを記述する世界モデルは,プランニングやサンプル効率の向上,未知のタスクへの高速な適応などの上で重要である.特に近年は機械学習・深層学習を中心としたデータの関係を学習する技術により,真のモデルが未知のような複雑な環境でもモデルを利用するアプローチに関する研究が進んでいる.しかし,世界に関する知識が未完成な中で世界モデルを構築するためのデータをどのように獲得すればよいのかについての議論はあまり行われていない.本研究では,スキルの概念を世界モデルの学習に組み合わせることの有効性について調査する.具体的には,まず世界を探索するようなスキルを教師なし+真の環境とのインタラクションなしで獲得した上で,学習されたスキルに基づいた探索方策により収集されたデータを利用する方法を提案した.評価には代表的な物理シミュレータであるMuJoCoを利用し,ランダムに探索する従来手法と比べてエキスパート起動をより正確に予測する世界モデルが獲得できることを確認した.

著者関連情報
© 2021 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top