首页> 中国专利> 一种基于Categorical-DQN乐观探索的交通控制方法

一种基于Categorical-DQN乐观探索的交通控制方法

摘要

本发明提供一种基于Categorical‑DQN乐观探索的交通控制方法,涉及乐观探索技术领域,包括以下步骤:S1:将交叉口建模为智能体,初始化当前网络Z(o,a;θ)和目标网络Z′(o,a;θ′),其中:o为局部观测,a为下一刻要选择的信号相位,θ为当前网络参数,θ′为目标网络参数;S2:将经验回放池ERM进行初始化;S3:设置贪婪因子ε及乐观因子τ为1;S4:设置训练次数M,将S1所述智能体重复训练M次;该方法可以应用到交通环境中,将交叉口建模为智能体,在多智能体环境下训练各个交叉口,实现交叉口之间的协作,有效缓解交通拥堵。方法效果的提升在交通环境中也带来了效果的提升。

著录项

  • 公开/公告号CN113393667B

    专利类型发明专利

  • 公开/公告日2022-05-13

    原文格式PDF

  • 申请/专利权人 大连海事大学;

    申请/专利号CN202110649807.8

  • 发明设计人 张程伟;田宇;房迪娜;

    申请日2021-06-10

  • 分类号G08G1/01;G08G1/08;G08G1/081;G06N3/00;

  • 代理机构

  • 代理人

  • 地址 116026 辽宁省大连市高新园区凌海路1号

  • 入库时间 2022-08-23 13:38:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-13

    授权

    发明专利权授予

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号