抄録
強化学習は試行錯誤的な探索と遅延報酬が重要な特徴である.しかし,十分に信頼できるだけの学習を重ねるためには,多くの学習回数を必要とし,時間がかかるという問題がある.この問題を解決するための手法の一つとして,転移学習がある.転移学習を効果的に行う際には,転移させる知識をどのように選ぶのか,選ばれた知識をどのように転移するのかの2 点について議論する必要がある.また,実世界では,これから解こうとするタスクが過去に学習したタスクと全く同一になるとは限らない.このため,本研究では,違うタスクにおいて,転移させる知識の判別法と選ばれた知識をどのように転移するのかについて主成分分析を用いた例とともにいくつか検討を行った.