主催: 日本知能情報ファジィ学会
会議名: 第34回ファジィシステムシンポジウム
回次: 34
開催地: 名古屋大学
開催日: 2018/09/03 - 2018/09/05
ファジィ推論と強化学習の典型的な融合方式は,マルコフ決定過程を仮定したQ学習のような価値ベースの強化学習法を用いるものである.一方,これまでに我々は,価値ベースではなく方策を直接学習する強化学習法である方策勾配法とファジィ推論との融合方式を提案してきた.当該融合方式では,メンバシップ関数とルール重みの積和からなる目的関数をもつBoltzmann分布で定義された確率的方策を示した.さらに,出力値の期待値操作に基づく重心モデルによる非ファジィ化と,出力値の変動に関する拘束条件とを用いた目的関数による確率的方策を導入してその学習則を示した.本研究では,これらの目的関数を自動車の速度制御シミュレーションに適用して比較した.その結果,重心モデルと拘束条件の導入により,速度の振動が抑制されやすく制御タスク達成までのステップ数の少ない方策を学習できたことを示す.