...
首页> 外文期刊>Promet-traffic & transportation >ROAD ARTERY TRAFFIC LIGHT OPTIMIZATION WITH USE OF REINFORCEMENT LEARNING
【24h】

ROAD ARTERY TRAFFIC LIGHT OPTIMIZATION WITH USE OF REINFORCEMENT LEARNING

机译:借助强化学习优化道路交通流量

获取原文
获取原文并翻译 | 示例
           

摘要

The basic principle of optimal traffic control is the appropriate real-time response to dynamic traffic flow changes. Signal plan efficiency depends on a large number of input parameters. An actuated signal system can adjust very well to traffic conditions, but cannot fully adjust to stochastic traffic volume oscillation. Due to the complexity of the problem analytical methods are not applicable for use in real time, therefore the purpose of this paper is to introduce heuristic method suitable for traffic light optimization in real time. With the evolution of artificial intelligence new possibilities for solving complex problems have been introduced. The goal of this paper is to demonstrate that the use of the Q learning algorithm for traffic lights optimization is suitable. The Q learning algorithm was verified on a road artery with three intersections. For estimation of the effectiveness and efficiency of the proposed algorithm comparison with an actuated signal plan was carried out The results (average delay per vehicle and the number of vehicles that left road network) show that Q learning algorithm outperforms the actuated signal controllers. The proposed algorithm converges to the minimal delay per vehicle regardless of the stochastic nature of traffic. In this research the impact of the model parameters (learning rate, exploration rate, influence of com-munication between agents and reward type) on algorithm effectiveness were analysed as well.%Temeljno načelo optimalnega krmiljenja prometa je ustrezen odziv na dinamične spremembe prometa v real-nem času. Učinkovitost krmilnega programa je odvisno od velikega števila vhodnih parametrov. Prometno odvisni sig-nalni programi se dobro prilagajajo prometnim razmeram, vendar se ne morejo popolnoma prilagoditi stohastični naravi prometa. Zaradi kompleksnosti problema analitične metode niso uporabne, zato v tem članku predstavljamo uporabo hevristične metode za optimizacijo svetlobno sig-nalnih naprav (SSN) v realnem času. Z razvojem področja umetne inteligence so se pojavile nove možnosti reševanja kompleksnih problemov. Namen članka je prikazati uporab-nost algoritma učenja Q za krmiljenje SSN. Algoritem smo preverjali na arteriji s tremi križišči in njegovo uspešnost in učinkovitost primerjali s prometno odvisnimi SSN. Analiza rezultatov povprečnih zamud na vozilo in število prepeljanih vozil skozi prometno mrežo je pokazala, da je predlagan algoritem učenja Q uspešnejši od krmiljenja SSN s prometno odvisnim krmiljenjem. V predstavljeni raziskavi smo analizirali tući vpliv parametrov modela (faktor stopnje učenja, faktor stopnje raziskovanja, vpliv poznavanja informacij med agenti, vrsta nagrade) na uspešnost algoritma.
机译:最佳交通控制的基本原理是对动态交通流变化进行适当的实时响应。信号计划效率取决于大量输入参数。激励信号系统可以很好地适应交通状况,但不能完全适应随机的交通流量振荡。由于问题的复杂性,分析方法不适用于实时分析,因此本文的目的是介绍一种适用于实时交通信号灯优化的启发式方法。随着人工智能的发展,已经提出了解决复杂问题的新可能性。本文的目的是证明将Q学习算法用于交通信号灯优化是合适的。 Q学习算法在具有三个交叉点的道路动脉上得到验证。为了评估所提出算法的有效性和效率,与激励信号计划进行了比较。结果(每辆车的平均延迟和离开路网的车辆数量)表明,Q学习算法的性能优于激励信号控制器。所提出的算法收敛到每辆车的最小延迟,而与交通的随机性质无关。在这项研究中,还分析了模型参数(学习率,探究率,代理之间的通信和奖励类型的影响)对算法有效性的影响。%真实性-nemčasu。乌尔维尼加计划党和参议员。 Prometno odvisni sig-nalni Programme se dobro prilagajajo prometnim razmeram,vendar se ne morejo popolnoma prilagoditistohastičninaravi prometa。 Zaradi kompleksnosti problemaanalitičnemetode niso uporabne,zato v temčlankupredstavljamo uporabohevrističnemetode za optimizacijo svetlobno sig-nalnih naprav(SSN)v realnemčasu。 Z razvojempodročjaumetne intligence,所以我们从头开始了新的尝试。 Namenčlankaje prikazati uporab-nost algoritmaučenjaQ za krmiljenje SSN。 Algoritem smo preverjali na arteriji s tremikrižiščiin njegovouspešnostinučinkovitostprimjalis prometno odvisnimi SSN。 Analiza rezultatovpovprečnihzamud na vozilo inšteviloprepeljanih vozil skozi prometnomrežoje pokazala,da je predlagan algoritemučenjaQuspešnejšiod krmiljejej SSN s prometno odvisnm kr。 V predstavljeni raziskavi smo analiziralitućivpliv parametrov modela(faktor stopnjeučenja,faktor stopnje raziskovanja,vpliv poznavanja med agenti,vrsta nagrade)和我们的算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号