システム制御情報学会 研究発表講演会講演論文集
第48回システム制御情報学会研究発表講演会
セッションID: 5025
会議情報
強化学習における行動選択戦略のパラメータと収益最大化の関係について
*岩田 一貴池田 和司酒井 英昭
著者情報
会議録・要旨集 フリー

詳細
抄録
強化学習における収益最大化は行動選択戦略のパラメータに依存する確率的複雑さと呼ばれる値と環境に依存するある量に特徴づけられる.このうち,学習者が制御できるのは前者のみなので,パラメータの変化に対する確率的複雑さの感度が重要となる.本論では,パラメータを調整する上で有用なこの感度についての定理を示す.
著者関連情報
© 2004 システム制御情報学会
前の記事 次の記事
feedback
Top