2021 年 76 巻 5 号 p. I_1273-I_1285
交通渋滞を緩和する施策として,1 日の中での交通需要の変動を考慮する動的混雑課金の有用性が提唱されている.また,課金主体と道路利用者間の情報の非対称性に対応するため,Trial-and-error 型の課金額決定手法が提案されている.本研究では,強化学習を用い,様々な環境に対応可能かつ課金額更新を速やかに行う Trial-and-error 型の動的混雑課金手法を構築する.具体的には,複数ボトルネックを有する動的交通ネットワークにおける出発時刻と経路の同時選択問題の時間帯別課金額を Q 学習により最適化する手法を構築した.更に,交通シミュレーションにより,既存研究との比較・環境変化への対応の検証を行った.その結果,時間帯別・ボトルネック別にほぼ独立に課金額を調整する分散制御型手法の有効性が確認された.