システム制御情報学会 研究発表講演会講演論文集
第50回システム制御情報学会研究発表講演会
セッションID: 2W4-1
会議情報

観察模倣と自律強化の融合による学習機構に関する研究
*田渕 一真谷口 忠大椹木 哲夫
著者情報
会議録・要旨集 フリー

詳細
抄録
強化学習を行う際,学習者は事前知識を持たなければ膨大な学習時間を費やさねばならない.これに対し,人間は他者の行動を,それが必ずしも最適な行動とは言えない場合でも模倣することにより探索時間を効率的に低減していると考えられる.本研究では機械学習の研究において,従来別々の問題として考えられて来た模倣学習と強化学習を,自然な形で融合させる学習手法を提案する.
著者関連情報
© 2006 システム制御情報学会
前の記事 次の記事
feedback
Top