首页> 中国专利> 一种基于Categorical-DQN乐观探索的交通控制方法

一种基于Categorical-DQN乐观探索的交通控制方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供一种基于Categorical‑DQN乐观探索的交通控制方法，涉及乐观探索技术领域，包括以下步骤：S1：将交叉口建模为智能体，初始化当前网络Z(o,a；θ)和目标网络Z′(o,a；θ′)，其中：o为局部观测，a为下一刻要选择的信号相位，θ为当前网络参数，θ′为目标网络参数；S2：将经验回放池ERM进行初始化；S3：设置贪婪因子ε及乐观因子τ为1；S4：设置训练次数M，将S1所述智能体重复训练M次；该方法可以应用到交通环境中，将交叉口建模为智能体，在多智能体环境下训练各个交叉口，实现交叉口之间的协作，有效缓解交通拥堵。方法效果的提升在交通环境中也带来了效果的提升。

著录项

公开/公告号CN113393667B

专利类型发明专利
公开/公告日2022-05-13

原文格式PDF
申请/专利权人大连海事大学;
展开▼

申请/专利号CN202110649807.8
发明设计人张程伟;田宇;房迪娜;
展开▼

申请日2021-06-10
分类号G08G1/01;G08G1/08;G08G1/081;G06N3/00;
代理机构
代理人
地址 116026 辽宁省大连市高新园区凌海路1号
入库时间 2022-08-23 13:38:06

法律信息

法律状态公告日

法律状态信息

法律状态
2022-05-13

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种基于Categorical-DQN乐观探索的交通控制方法 [P] . 中国专利： CN113393667A . 2021-09-14
2. 一种基于RDMA和HTM的分布式乐观并发控制方法 [P] . 中国专利： CN105955801B . 2018.12.18
3. 一种基于集成学习的工业控制系统入侵检测方法 [P] . 世界知识产权组织专利： WO2020/143226A1 . 2020.07.16
4. 一种功率控制的方法以及功率控制的装置 [P] . 世界知识产权组织专利： WO2020/143514A1 . 2020.07.16
5. 一种基于变分自编码器的训练样本数据扩充方法、存储介质及计算机设备 [P] . 世界知识产权组织专利： WO2020/143321A1 . 2020.07.16