強化学習を用いた分散型ネットワーク信号制御 － Markov 決定過程の分解による最適制御 －

桑原 雅夫; 福田 和輝; 橋本 申; 佐津川 功季; 田名部 淳

doi:10.14954/jste.9.2_A_110

特集号A（研究論文）

強化学習を用いた分散型ネットワーク信号制御－ Markov 決定過程の分解による最適制御－

桑原雅夫, 福田和輝, 橋本申, 佐津川功季, 田名部淳

著者情報

キーワード: 信号制御, 強化学習, ショックウェーブ, 分散制御, マルコフ決定過程

ジャーナルフリー

2023 年 9 巻 2 号 p. A_110-A_120

DOI https://doi.org/10.14954/jste.9.2_A_110

詳細

抄録

本研究は，強化学習におけるマルコフ決定過程における行動価値を交差点単位に分解することによって，ネットワーク全体を最適制御する分散型の信号制御を提案するものである．最近は，分散制御を行うために協調型のマルチ・エージェント強化学習を用いた信号制御に関する研究が多い．しかしながら，協調学習を行っても，依然としてネットワーク全体を最適制御する制御が求められる保証はない．そこで本研究では，交通流の Wave 伝播理論に基づいて，マルコフ決定過程の行動価値を交差点ごとに分解し，全体最適を保証するマルチ・エージェント強化学習による分散制御を提案する．提案手法を系統制御に適用し，提案手法の有効性を検証するとともに，強化学習による信号制御の課題を整理する．

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）