知能と情報
Online ISSN : 1881-7203
Print ISSN : 1347-7986
ISSN-L : 1347-7986
原著論文
ファジイ制御ルールにより表現された方策を持つ方策勾配法: RoboCup小型リーグにおける行動決定
杉本 将也五十嵐 治一石原 聖司田中 一基
著者情報
ジャーナル フリー

2014 年 26 巻 3 号 p. 647-657

詳細
抄録

典型的なファジィ強化学習アルゴリズムはマルコフ決定過程(MDP)を前提とした価値関数ベースのアプローチを採用し,ファジィルールの後件部に定数や一次関数を用いる場合が多い.一方,方策勾配法は状態や行動の価値関数を計算することなく,方策を直接設計し,その方策中のパラメータを学習する強化学習法である.この方策の表現としてファジィ制御ルールを用いる方策勾配法が提案されている.そこでは,ファジィ制御ルールの前/後件部におけるメンバシップ関数とルール重みを報酬の期待値が極大となるように学習することができる.本論文ではこの学習方式をロボットの行動決定問題へ適用することを試みた.具体的な事例として,ロボットサッカーの競技会であるRoboCup小型リーグの試合において,ボールを保持したときのプレーヤロボットの行動決定問題へ適用した.学習実験の結果,30シーンのうち25シーンにおいて人間の行動決定と一致する方策を獲得することができた.

著者関連情報
© 2014 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top