システム制御情報学会 研究発表講演会講演論文集
第54回システム制御情報学会研究発表講演会
セッションID: F234
会議情報

Empirical Evaluation of an Average Reward Learning Method Handling Simultaneous Learning Episodes in a Dynamic Environment with Emerging Tasks
*ヴァルディヴィエルソ  アレックス宮本 俊幸
著者情報
会議録・要旨集 フリー

詳細
抄録
Average reward learning methods (ARLMs) show a poor performance in environments in which they must deal with several tasks simultaneously. In this paper we present the evaluation of an ARLM adapted to handle simultaneous learning episodes. We compare its performance against a conventional ARLM in a multicar elevator system.
著者関連情報
© 2010 システム制御情報学会
前の記事 次の記事
feedback
Top