自動制御連合講演会講演論文集
第47回自動制御連合講演会
セッションID: 909
会議情報

システム・情報2
k-確実探査法とFuzzy-ARTによる連続状態環境のセミマルコフ決定過程モデル構築手法の提案
*舘山 武史川田 誠一
著者情報
会議録・要旨集 フリー

詳細
抄録

エージェントが未知環境を探索し、環境の離散マルコフモデルを構築するための有効な強化学習法として、k-確実探査法があるが、この手法は状態空間が連続的である場合や、状態数が膨大な場合には適用が困難である。本研究では、そのような環境を対象とした手法としてk-確実探査法とFuzzy-ARTを組み合わせ、報酬期待値や状態価値に基づいて段階的に高精度な環境の離散セミマルコフモデルを構築していく手法を提案する。

著者関連情報
© 2004 自動制御連合講演会実行委員会
前の記事 次の記事
feedback
Top