システム制御情報学会 研究発表講演会講演論文集
第48回システム制御情報学会研究発表講演会
セッションID: 5024
会議情報
強化学習の環境変化後の再学習における失敗領域の推定と成功行動政策の適用
*松本 浩村田 忠彦
著者情報
会議録・要旨集 フリー

詳細
抄録
本論文では,環境変化を伴う強化学習における失敗領域の推定と成功行動政策の適用方法を提案する.再学習すべき範囲を特定するための概念学習による失敗領域の推定方法が既に提案されているが,本論文では,概念学習により得た失敗推定領域に,環境変化前の成功領域における行動政策を適用することで,失敗領域をより限定し,再学習領域をさらに縮小できることを示す.
著者関連情報
© 2004 システム制御情報学会
前の記事 次の記事
feedback
Top