ファジィ制御ルールにより表現された方策を持つ方策勾配法：重心モデルと拘束条件の利用

石原 聖司; 五十嵐 治一

doi:10.14864/fss.34.0_736

抄録

ファジィ推論と強化学習の典型的な融合方式は，マルコフ決定過程を仮定したQ学習のような価値ベースの強化学習法を用いるものである．一方，これまでに我々は，価値ベースではなく方策を直接学習する強化学習法である方策勾配法とファジィ推論との融合方式を提案してきた．当該融合方式では，メンバシップ関数とルール重みの積和からなる目的関数をもつBoltzmann分布で定義された確率的方策を示した．さらに，出力値の期待値操作に基づく重心モデルによる非ファジィ化と，出力値の変動に関する拘束条件とを用いた目的関数による確率的方策を導入してその学習則を示した．本研究では，これらの目的関数を自動車の速度制御シミュレーションに適用して比較した．その結果，重心モデルと拘束条件の導入により，速度の振動が抑制されやすく制御タスク達成までのステップ数の少ない方策を学習できたことを示す．

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）