首页> 中国专利> 基于深度强化学习的实时集中式无线网络调度方法和设备

基于深度强化学习的实时集中式无线网络调度方法和设备

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提出一种基于深度强化学习的实时集中式无线网络调度方法和系统，包括：获取由一个接入点和多个用户节点互连组成的无线网络，在每个时隙，接入点根据所有数据流对应的发送队列信息，得到各数据流的状态，集合所有数据流的状态构成当前时隙的环境状态，接入点获取所有数据流的流量模型与链路质量作为环境特征信息，将环境状态和环境特征信息输入至决策模型，接入点执行决策模型输出结果对应的调度决策；接入点执行调度决策后，收到网络环境的反馈；将交互信息和环境状态和环境特征信息作为经验，存储至子区域；从经验回放池中抽取经验，以训练更新当前决策模型。本发明训练时间不会随数据流数量增加而快速增长，能够快速的收敛到最优实时吞吐量。

著录项

公开/公告号CN114189937A

专利类型发明专利
公开/公告日2022-03-15

原文格式PDF
申请/专利权人中国科学院计算技术研究所;
展开▼

申请/专利号CN202111327752.5
发明设计人王琪;何晨涛;黄建辉;徐勇军;
展开▼

申请日2021-11-10
分类号H04W72/04(20090101);H04W24/02(20090101);H04W24/06(20090101);G06N3/04(20060101);G06N3/08(20060101);
代理机构11006 北京律诚同业知识产权代理有限公司;
代理人祁建国
地址 100080 北京市海淀区中关村科学院南路6号
入库时间 2023-06-19 14:29:46

法律信息

法律状态公告日

法律状态信息

法律状态
2022-03-15

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 基于深度强化学习的实时分布式无线网络调度方法和系统 [P] . 中国专利： CN114173418A . 2022-03-11
2. 基于深度强化学习的动态生产调度方法、装置及电子设备 [P] . 中国专利： CN112508398A . 2021-03-16
3. 信息传输方法、传输调度方法、终端及网络侧设备 [P] . 世界知识产权组织专利： WO2020/143759A1 . 2020.07.16
4. 触发调度请求的方法、设备及系统 [P] . 世界知识产权组织专利： WO2020/143693A1 . 2020.07.16
5. 一种基于变分自编码器的训练样本数据扩充方法、存储介质及计算机设备 [P] . 世界知识产权组织专利： WO2020/143321A1 . 2020.07.16