主催: 一般社団法人 交通工学研究会
会議名: 第42回交通工学研究発表会
回次: 42
開催地: 早稲田大学(東京都)・オンライン同時配信
開催日: 2022/08/09 - 2022/08/10
p. 563-570
本研究では,強化学習を用いた信号制御パラメータの決定方法について基礎的な分析を行い,強化学習を用いることの実用性について整理した.まず,対象交差点全体の最適制御パラメータを求めるための条件を整理し,状態,行動,報酬を定義した.次に,深層強化学習モデルの Dueling Network を用いて,簡単な 2 交差点ネットワークで制御パラメータの最適化を行い,制御パラメータの妥当性,計算の実用性について分析した.その結果,対象交差点全体の最適制御パラメータの算出には多くの学習が必要であることや実務に適用することが難しい制御パラメータを算出する場合があることがわかった.一方,個別交差点単位の学習や状態変数を減らした学習でも,全体最適と同等の制御パラメータを算出できる可能性があり,計算の実用性にむけた工夫の余地があることを確認した.