抄録
強化学習の代表的な手法の一つにはQ学習がある.このQ学習は,ある状態の各行動に対する価値(Q値)をQ-Tableという 状態空間を均等に分割した表に設定したものを用いて学習を行うため,次元数が増えた場合に指数関数的にメモリ使用量が増大してしまうといった問題点があった.それを解決するため,先行研究である二分木構造を用いた状態分割では,二次元において四角形に空間を分割していたが,高次元の場合に適用すると空間分割の方向が爆発的に増えて,分割をうまく行えないという問題があった. これらの問題を解決するため,四角形ではなく,点と半径による円形の新たな分割方法を模索する.