システム制御情報学会 研究発表講演会講演論文集
第54回システム制御情報学会研究発表講演会
セッションID: W237
会議情報

寿命のある自己最良値を用いたParticle Swarm Optimizationに基づく群強化学習法
*飯間 等黒江 康明
著者情報
会議録・要旨集 フリー

詳細
抄録
以前に、著者らはParticle Swarm Optimizationに基づく群強化学習法を提案した。この学習法では、複数のエージェントが行動価値であるQ値を通常の強化学習法によって更新するとともに、Q値を評価し、過去に各自が発見した自己最良Q値と群全体の最良Q値を用いて各自のQ値を更新する。しかし、この学習法では、Q値が過大評価されることがあり、そのことが学習の性能を低下させていた。この問題を解決するために、自己最良値に寿命を設定してを学習を行う方法を本稿で提案する。
著者関連情報
© 2010 システム制御情報学会
前の記事 次の記事
feedback
Top