日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集
第28回ファジィシステムシンポジウム
会議情報

メイン
鎖型状態行動学習の提案
野津 亮小森 祐希本多 克宏市橋 秀友岩元 優希
著者情報
会議録・要旨集 オープンアクセス

p. 225-228

詳細
抄録
本論文では,鎖型状態行動学習を提案する.実環境においては,細やかで精密な学習と状態数と行動数にさくメモリ数,学習時間との間にトレードオフの関係が存在する.この問題を解決するために,強化学習の学習プロセスの中で,推定価値を“良い”と“良くない”の2パターンと大まかにとらえ,“良い”状態行動対を一直線状に並べる方法へと変更する.これにより,列の順番それ自体を優先順位として与える.いくつかの単純なシミュレーションを行い,この手法の効果を確認した.
著者関連情報
© 2012 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top