抄録
強化学習は,自律移動ロボットなどのインテリジェントエージェントの制御システムにおける重要な技術の一つになると思われる.ファジィQ学習は,その高いモデル記述能力から,強化学習機能の実装において有望なアプローチの一つである.しかし,ファジィQ学習を実際の対象に適用する場合には,他のQ学習手法と同様に,学習のための繰り返し回数が膨大になるという問題がある.さらに,その複雑なモデル構造のために収束性能がしばしば劣化する.本研究ではファジィQ学習の学習性能を改善するための構成方法について検討した.本論文では,モジュラーファジィモデルに基づくファジィQ学習の実装方法について提案した.モジュラーファジィモデルに基づくマルチグレイン構成方法を並行学習構成と比較した.車の山登りタスクとアクロボットタスクの数値実験を通して提案したモジュラーファジィモデルの構成方法によってファジィQ学習の性能が改善できることがわかった.