寿命のある自己最良値を用いたParticle Swarm Optimizationに基づく群強化学習法

飯間 等; 黒江 康明

doi:10.11509/sci.SCI10.0.56.0

抄録

以前に、著者らはParticle Swarm Optimizationに基づく群強化学習法を提案した。この学習法では、複数のエージェントが行動価値であるQ値を通常の強化学習法によって更新するとともに、Q値を評価し、過去に各自が発見した自己最良Q値と群全体の最良Q値を用いて各自のQ値を更新する。しかし、この学習法では、Q値が過大評価されることがあり、そのことが学習の性能を低下させていた。この問題を解決するために、自己最良値に寿命を設定してを学習を行う方法を本稿で提案する。

著者関連情報

お気に入り & アラート

お気に入りに追加
追加情報アラート
被引用アラート
認証解除アラート

閲覧履歴

Systems for Analyzing Data of Remote Sensing Using Micro-Computer
硬Ｘ線光電子分光法による (Er_xSc_1-x)₂O₃/Si(111) 界面のバンド構造解析
ロボットによるプログラミング教育ボードゲーム対戦が文系大学生へ与える効果
THE STUDY OF BUSINESS MAKE-UP COLOR MATCHING AND COLOR IMAGE
Soil Characterization by Energy Dispersive X-Ray Fluorescence: Sampling Strategy for in situ Analysis

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）