強化学習におけるファジィ状態空間の動的構築-状態のファジィ集合の調整-

細谷 優; 山村 忠義; 馬野 元秀; 瀬田 和久

doi:10.14864/fss.22.0.216.0

第22回ファジィシステムシンポジウム

セッションID: 8D3-1

DOI https://doi.org/10.14864/fss.22.0.216.0

会議情報

主催: 日本知能情報ファジィ学会

強化学習におけるファジィ状態空間の動的構築-状態のファジィ集合の調整-

*細谷優, 山村忠義, 馬野元秀, 瀬田和久

著者情報

キーワード: 強化学習, ファジィ状態空間, 動的構築

会議録・要旨集フリー

詳細

抄録

以前に，実数値環境下のQ-learningにおいて，状態空間を動的に構築していく方法を提案した．これは，状態のないところから必要に応じて状態を追加し，報酬を用いて更新を行ないながら，不要な状態を削除するというものであった．この方法では行動の削除を行なっていたが，各状態変数のファジィ集合は生成した時のままであった．そこで，本論文では，ファジィ集合の中心値と幅をTD誤差を用いて調整する方法を提案する．これらにより観測データにより柔軟に対応できると考えられる．そして，この方法を実数値環境下における追跡問題に適用する．

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）