主催: 日本機械学会, 計測自動制御学会, システム制御情報学会, 化学工学会, 精密工学会, 日本航空宇宙学会
共催: 43学協会
東京都立大学大学院工学研究科
(EndNote、Reference Manager、ProCite、RefWorksとの互換性あり)
(BibDesk、LaTeXとの互換性あり)
エージェントが未知環境を探索し、環境の離散マルコフモデルを構築するための有効な強化学習法として、k-確実探査法があるが、この手法は状態空間が連続的である場合や、状態数が膨大な場合には適用が困難である。本研究では、そのような環境を対象とした手法としてk-確実探査法とFuzzy-ARTを組み合わせ、報酬期待値や状態価値に基づいて段階的に高精度な環境の離散セミマルコフモデルを構築していく手法を提案する。
すでにアカウントをお持ちの場合 サインインはこちら