日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集
第24回ファジィ システム シンポジウム
セッションID: FD2-4
会議情報

Q学習における状態空間と行動空間の分節化
*和田 浩之野津 亮市橋 秀友本多 克宏
著者情報
キーワード: 強化学習, Q学習, 空間分割
会議録・要旨集 フリー

詳細
抄録
本研究では,強化学習の一つであるQ学習において,学習中の状態空間と行動空間を人間の学習プロセスをモデルに分割する手法を提案した.状態を決定する要素が多くなると,状態数が指数的に増加するという問題(状態空間の爆発問題)が起こる.今回の研究では,エージェント自身の持つ状態空間と行動空間をエージェント自身が分割していくという提案手法により,エージェントがより良い分割空間を獲得し,状態空間の爆発を抑えることが可能であると期待し,学習過程で状態空間と行動空間がどのように分節化されるかを観察した.
著者関連情報
© 2008 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top