日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集
第22回ファジィ システム シンポジウム
セッションID: 8D3-1
会議情報

強化学習におけるファジィ状態空間の動的構築-状態のファジィ集合の調整-
*細谷 優山村 忠義馬野 元秀瀬田 和久
著者情報
会議録・要旨集 フリー

詳細
抄録
以前に,実数値環境下のQ-learningにおいて,状態空間を動的に構築していく方法を提案した.これは,状態のないところから必要に応じて状態を追加し,報酬を用いて更新を行ないながら,不要な状態を削除するというものであった.この方法では行動の削除を行なっていたが,各状態変数のファジィ集合は生成した時のままであった.そこで,本論文では,ファジィ集合の中心値と幅をTD誤差を用いて調整する方法を提案する.これらにより観測データにより柔軟に対応できると考えられる.そして,この方法を実数値環境下における追跡問題に適用する.
著者関連情報
© 2006 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top