複利型深層強化学習における投資比率の最適化及びリスクを考慮した行動の習得

位田 奨; 松井 藤五郎

doi:10.11517/pjsai.JSAI2022.0_1A5GS202

抄録

本研究では、複利型深層強化学習において、投資比率を最適化する方法と報酬の分散（リスク）を考慮して行動を習得する方法を提案する。現在、強化学習を金融取引に応用する研究が盛んに行われている。複利型強化学習は、利益率の複利効果を最大化する行動を習得することを目的とした強化学習の枠組みであり、パラメータとして投資比率が存在する。この投資比率を最適化することで利益率の複利効果を最大化できる。深層強化学習を複利型に拡張した研究が存在するが、その研究では投資比率が0以上1以下の範囲で適当な値に設定されており、利益率の複利効果を最大化することができない。そこで本研究では、複利型深層強化学習に投資比率を最適化するネットワークを追加する手法を提案する。また、複利型強化学習においては行動選択の際にリスクを考慮することができないという問題がある。そこで本研究では、報酬の分散をリスクとして考慮して行動を取得する方法を提案する。

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）