抄録
本論文では,より効率的な強化学習のためのParticle-filterの枠組みを提案する.これまでにParticle-filterと強化学習を融合させることによってより精度の高い学習結果を得るなどの研究成果が報告されているが,そのための状態数,粒子数が膨大な数になり,メモリの節約という点からも実用性に乏しいものとなっていた.本研究では,粒子数,状態数に多様性,情報量,という観点から試行錯誤的に学習の段階によって最適解が局所解に変化するといった状況にも対応できるようなアルゴリズムを提案し,そのシミュレーション実験を行った.