階層型強化学習における人間のサブゴール知識転移

奥戸 嵩登; 山田 誠二

doi:10.11517/pjsai.JSAI2019.0_1Q2J202

抄録

オプション発見と方策の学習を同時に行う階層型強化学習には膨大な試行錯誤が必要となる．そこで，本論文では人のサブゴール知識の転移が学習スピードと学習後の方策の性能にどのような影響を与えるかを調査する．そのために階層型強化学習において人のサブゴール知識を転移する方法を提案する．インタラクティブ機械学習の問題設定を利用して人のサブゴール知識を取得し，教師あり学習でそのサブゴール知識をパラメータの初期値に変換する．参加者実験と評価実験の2段階の実験を行う．参加者実験においてインタラクティブ機械学習の問題設定において人によるサブゴール知識を取得する．評価実験で人のサブゴール知識の転移，階層型強化学習の方策の学習を行い，学習スピードと学習後の方策の性能を評価する．

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）