k-確実探査法とFuzzy-ARTによる連続状態環境のセミマルコフ決定過程モデル構築手法の提案

舘山 武史; 川田 誠一

doi:10.11511/jacc.47.0.129.0

第47回自動制御連合講演会

セッションID: 909

DOI https://doi.org/10.11511/jacc.47.0.129.0

会議情報

主催: 日本機械学会, 計測自動制御学会, システム制御情報学会, 化学工学会, 精密工学会, 日本航空宇宙学会

共催: 43学協会

システム・情報２

k-確実探査法とFuzzy-ARTによる連続状態環境のセミマルコフ決定過程モデル構築手法の提案

*舘山武史, 川田誠一

著者情報

会議録・要旨集フリー

詳細

抄録

エージェントが未知環境を探索し、環境の離散マルコフモデルを構築するための有効な強化学習法として、k-確実探査法があるが、この手法は状態空間が連続的である場合や、状態数が膨大な場合には適用が困難である。本研究では、そのような環境を対象とした手法としてk-確実探査法とFuzzy-ARTを組み合わせ、報酬期待値や状態価値に基づいて段階的に高精度な環境の離散セミマルコフモデルを構築していく手法を提案する。

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）