強化学習における状態空間の動的構築

馬野 元秀; 細谷 優; 山村 忠義; 上森 規央; 瀬田 和久

doi:10.14864/fss.21.0.176.0

第21回ファジィシステムシンポジウム

セッションID: 9B4-3

DOI https://doi.org/10.14864/fss.21.0.176.0

会議情報

主催: 日本知能情報ファジィ学会

共催: 国際ファジィシステム学会

9B4. 強化学習

強化学習における状態空間の動的構築

馬野元秀, *細谷優, 山村忠義, 上森規央, 瀬田和久

著者情報

キーワード: 強化学習, 動的構築, 忘却, ファジィ, ニューラルネットワーク

会議録・要旨集フリー

詳細

抄録

強化学習の手法の一つであるQ-learningでは，状態に対する行動の価値関数をQ表として保持している．このQ表の構造の設定には問題に対する十分な把握が必要である．状態を細かく取り過ぎるとQ表が大きくなり，学習に時間がかかってしまい，逆に，荒くとり過ぎると学習できなくなってしまう．状態空間が実数の場合には，さらに状態空間の構造の設定が困難となる．本論文では，実数値環境下において状態空間のないところから，必要に応じて状態を追加し，Q-learningによる更新を行ないながら，不要な状態を削除することにより状態空間を動的に構築していく方法を提案する．状態の削除に関しては，前に提案した「逐次入力を用いた忘却型ファジィ・ニューラルネットワーク」の忘却型学習の考えを用い，実数値環境における問題に適用する．

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）