人工知能学会第二種研究会資料
Online ISSN : 2436-5556
オンライン勾配法による投資比率最適化付き複利型強化学習
松井 藤五郎後藤 卓和泉 潔陳 昱
著者情報
研究報告書・技術報告書 フリー

2012 年 2012 巻 FIN-008 号 p. 07-

詳細
抄録

本論文では,複利型強化学習において,オンライン勾配法を用いて投資比率を最適化する方法を提案する.従来の複利型強化学習では,投資比率を固定としていたため,投資比率をどのように決めるかが問題となっていた.提案手法では,投資比率をオンライン勾配法によって最適化することによって,この問題を解決する.また,オンライン勾配法による投資比率最適化付きQ 学習を3 本腕バンディット問題に適用し,投資比率固定の複利型Q 学習およびQ 学習と比較し,その有効性を示す.

著者関連情報
© 2012 著作者
前の記事
feedback
Top