交叉口交通信号动态回报值强化学习控制

夏新海

首页> 中文期刊> 《数学的实践与认识》 >交叉口交通信号动态回报值强化学习控制

交叉口交通信号动态回报值强化学习控制

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

强化学习能有效的实现随机动态交通环境下的自适应交通信号控制.为了适应交叉口交通需求水平的变化,在强化学习回报值定义中引入多重动态回报值结构.以孤立多相位信号控制交叉口为例,设计交叉口不同交通需求水平和交通需求变化情景,将算法与定时信号控制、Q-学习、SARSA进行性能比较,并分析不同回报定义和动作选择策略对算法性能的影响.结论表明,在所有交通情景下基于强化学习的自适应交通信号控制的鲁棒性比固定配时控制更强.在高交通需求情景下,算法均优于具有其他各种类型的回报定义的强化学习.最合适的回报定义是累计车辆延误的减少.在动作选择策略方面,协同ε-greedy和softmax方法可以获得更好的收敛性能.

著录项

来源
《数学的实践与认识》 |2020年第22期|153-166|共14页
作者
夏新海;
展开▼
作者单位

广州航海学院港口与航运管理学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
交通工程; 强化学习; 交通信号控制; 交叉口;

相似文献

中文文献
外文文献
专利

1. 引入MARKOV过程预测的强化学习下的城市交叉口自适应交通信号配时决策 [J] . 夏新海 ,许伦辉 . 公路工程 . 2018,第1期
2. 交叉口有交通信号控制时用户最优动态配流模型 [J] . 徐建闽 ,许伦辉 ,撒元功 . 控制理论与应用 . 2000,第1期
3. 环形交叉口交通信号控制改造设计——以来安城南交叉口为例 [J] . 周广 ,王建军 ,陈永茂 . 道路交通与安全 . 2009,第3期
4. 基于模糊控制的多相位交叉口交通信号控制 [J] . 王艳娜 ,周子力 ,王新伟 . 计算机工程 . 2006,第2期
5. 基于移动控制代理技术的交叉口交通信号控制算法 [J] . 宫晓燕 ,李振龙 . 中国公路学报 . 2006,第5期
6. 基于强化学习的交通信号控制方法综述 [C] . Huo Yusen ,霍雨森 ,Hu Jianming . 第十二届中国智能交通年会 . 2017
7. 基于深度强化学习的城市交叉口自适应交通信号控制研究 [A] . 相强强 . 2021

交叉口交通信号动态回报值强化学习控制

摘要

著录项

相似文献

相关主题

期刊订阅