日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集
第34回ファジィシステムシンポジウム
セッションID: WD1-4
会議情報

論文集
ファジィ制御ルールにより表現された方策を持つ方策勾配法:重心モデルと拘束条件の利用
*石原 聖司五十嵐 治一
著者情報
会議録・要旨集 フリー

詳細
抄録

ファジィ推論と強化学習の典型的な融合方式は,マルコフ決定過程を仮定したQ学習のような価値ベースの強化学習法を用いるものである.一方,これまでに我々は,価値ベースではなく方策を直接学習する強化学習法である方策勾配法とファジィ推論との融合方式を提案してきた.当該融合方式では,メンバシップ関数とルール重みの積和からなる目的関数をもつBoltzmann分布で定義された確率的方策を示した.さらに,出力値の期待値操作に基づく重心モデルによる非ファジィ化と,出力値の変動に関する拘束条件とを用いた目的関数による確率的方策を導入してその学習則を示した.本研究では,これらの目的関数を自動車の速度制御シミュレーションに適用して比較した.その結果,重心モデルと拘束条件の導入により,速度の振動が抑制されやすく制御タスク達成までのステップ数の少ない方策を学習できたことを示す.

著者関連情報
© 2018 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top