強化学習を用いた信号制御パラメータ最適化に関する基礎的研究

桑原 雅夫; 福田 和輝; 橋本 申; 佐津川 功季; 田名部 淳

doi:10.14954/jsteproceeding.42.0_563

第42回交通工学研究発表会

DOI https://doi.org/10.14954/jsteproceeding.42.0_563

会議情報

主催: 一般社団法人交通工学研究会

会議名: 第42回交通工学研究発表会

回次: 42

開催地: 早稲田大学（東京都）・オンライン同時配信

開催日: 2022/08/09 - 2022/08/10

第 42 回交通工学研究発表会

強化学習を用いた信号制御パラメータ最適化に関する基礎的研究

桑原雅夫, 福田和輝, 橋本申, 佐津川功季, 田名部淳

著者情報

キーワード: 信号制御, 強化学習, 深層学習, Q 学習, Dueling Network

会議録・要旨集フリー

p. 563-570

詳細

抄録

本研究では，強化学習を用いた信号制御パラメータの決定方法について基礎的な分析を行い，強化学習を用いることの実用性について整理した．まず，対象交差点全体の最適制御パラメータを求めるための条件を整理し，状態，行動，報酬を定義した．次に，深層強化学習モデルの Dueling Network を用いて，簡単な 2 交差点ネットワークで制御パラメータの最適化を行い，制御パラメータの妥当性，計算の実用性について分析した．その結果，対象交差点全体の最適制御パラメータの算出には多くの学習が必要であることや実務に適用することが難しい制御パラメータを算出する場合があることがわかった．一方，個別交差点単位の学習や状態変数を減らした学習でも，全体最適と同等の制御パラメータを算出できる可能性があり，計算の実用性にむけた工夫の余地があることを確認した．

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）