システム制御情報学会 研究発表講演会講演論文集
第54回システム制御情報学会研究発表講演会
セッションID: F342
会議情報

強化学習問題のための分布推定アルゴリズムにおける学習データ補正の検討
*半田 久志西村 徳栄
著者情報
会議録・要旨集 フリー

詳細
抄録
本発表では,これまでに提案してきた強化学習問題のための分布推定アルゴリズムEDA-RLに対して学習用データの補正法を検討する.学習単位であるエピソードデータ中に冗長な経路が存在したばあい,冗長な経路についても学習をしてしまうため,学習速度に弊害があった.本稿では,冗長経路を検出し,除去するメカニズムを導入し,その有用性を検討する.
著者関連情報
© 2010 システム制御情報学会
前の記事 次の記事
feedback
Top