首页> 中国专利> 基于深度强化学习的实时集中式无线网络调度方法和设备

基于深度强化学习的实时集中式无线网络调度方法和设备

摘要

本发明提出一种基于深度强化学习的实时集中式无线网络调度方法和系统,包括:获取由一个接入点和多个用户节点互连组成的无线网络,在每个时隙,接入点根据所有数据流对应的发送队列信息,得到各数据流的状态,集合所有数据流的状态构成当前时隙的环境状态,接入点获取所有数据流的流量模型与链路质量作为环境特征信息,将环境状态和环境特征信息输入至决策模型,接入点执行决策模型输出结果对应的调度决策;接入点执行调度决策后,收到网络环境的反馈;将交互信息和环境状态和环境特征信息作为经验,存储至子区域;从经验回放池中抽取经验,以训练更新当前决策模型。本发明训练时间不会随数据流数量增加而快速增长,能够快速的收敛到最优实时吞吐量。

著录项

  • 公开/公告号CN114189937A

    专利类型发明专利

  • 公开/公告日2022-03-15

    原文格式PDF

  • 申请/专利权人 中国科学院计算技术研究所;

    申请/专利号CN202111327752.5

  • 发明设计人 王琪;何晨涛;黄建辉;徐勇军;

    申请日2021-11-10

  • 分类号H04W72/04(20090101);H04W24/02(20090101);H04W24/06(20090101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11006 北京律诚同业知识产权代理有限公司;

  • 代理人祁建国

  • 地址 100080 北京市海淀区中关村科学院南路6号

  • 入库时间 2023-06-19 14:29:46

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-15

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号