日本知能情報ファジィ学会 ファジィ システム シンポジウム 講演論文集
第25回ファジィ システム シンポジウム
セッションID: 2A1-03
会議情報

状態価値に基づく人間行為観察と自己行動学習の循環的発達
*田村 佳宏高橋 泰岳浅田 稔
著者情報
会議録・要旨集 フリー

詳細
抄録
本論文では,強化学習における状態価値に基づいた行為獲得・他者行為認識の循環により,行為理解が効率的に安定して発達する手法を提案する.ロボットは観察している一連の人間の動き(明示的な教示信号は無い)を,自律的に分節化して行為のクラスタリングをし,それらの行為における他者の状態価値を推定する.推定した状態価値を自身の状態価値の更新に利用することにより,未学習領域での行動評価が可能になるため,行動学習時にロボットは目標状態近くの空間を効果的に探索できるようになり,行為獲得・他者行為認識が加速される.提案手法をロボカップ中型機リーグに出場しているロボットに適用し,本手法の有効性を示す.
著者関連情報
© 2009 日本知能情報ファジィ学会
前の記事 次の記事
feedback
Top