主催: 社団法人 人工知能学会
会議名: 2006年度人工知能学会全国大会(第20回)
回次: 20
開催地: 東京都 タワーホール船堀
開催日: 2006/06/07 - 2006/06/09
強化学習を行う際,学習者は事前知識を持たなければ膨大な学習時間を費やさねばならない.これに対し,人間は他者の行動を,それが必ずしも最適な行動とは言えない場合でも模倣することにより探索時間を効率的に低減していると考えられる.本研究では機械学習の研究において,従来別々の問題として考えられて来た模倣学習と強化学習を,自然な形で融合させる学習手法を提案する.