人工知能学会全国大会論文集
第33回 (2019)
セッションID: 1Q2-J-2-02
会議情報

階層型強化学習における人間のサブゴール知識転移
*奥戸 嵩登山田 誠二
著者情報
会議録・要旨集 フリー

詳細
抄録

オプション発見と方策の学習を同時に行う階層型強化学習には膨大な試行錯誤が必要となる.そこで,本論文では人のサブゴール知識の転移が学習スピードと学習後の方策の性能にどのような影響を与えるかを調査する.そのために階層型強化学習において人のサブゴール知識を転移する方法を提案する.インタラクティブ機械学習の問題設定を利用して人のサブゴール知識を取得し,教師あり学習でそのサブゴール知識をパラメータの初期値に変換する.参加者実験と評価実験の2段階の実験を行う.参加者実験においてインタラクティブ機械学習の問題設定において人によるサブゴール知識を取得する.評価実験で人のサブゴール知識の転移,階層型強化学習の方策の学習を行い,学習スピードと学習後の方策の性能を評価する.

著者関連情報
© 2019 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top