模倣学習と強化学習の調和による効率的行動獲得

田渕 一真; 谷口 忠大; 椹木 哲夫

doi:10.11517/pjsai.JSAI06.0.212.0

第20回 (2006)

セッションID: 3C1-2

DOI https://doi.org/10.11517/pjsai.JSAI06.0.212.0

会議情報

主催: 社団法人　人工知能学会

会議名: 2006年度人工知能学会全国大会（第20回）

回次: 20

開催地: 東京都タワーホール船堀

開催日: 2006/06/07 - 2006/06/09

模倣学習と強化学習の調和による効率的行動獲得

*田渕一真, 谷口忠大, 椹木哲夫

著者情報

会議録・要旨集フリー

詳細

抄録

強化学習を行う際，学習者は事前知識を持たなければ膨大な学習時間を費やさねばならない．これに対し，人間は他者の行動を，それが必ずしも最適な行動とは言えない場合でも模倣することにより探索時間を効率的に低減していると考えられる．本研究では機械学習の研究において，従来別々の問題として考えられて来た模倣学習と強化学習を，自然な形で融合させる学習手法を提案する．

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）