退出
我的积分:
中文文献批量获取
外文文献批量获取
公开/公告号CN112052947B
专利类型发明专利
公开/公告日2021-06-25
原文格式PDF
申请/专利权人 清华大学;
申请/专利号CN202010824196.1
发明设计人 杨君;梁斌;岑哲鹏;李承昊;陈章;
申请日2020-08-17
分类号G06N3/08(20060101);G06N3/04(20060101);G06N3/10(20060101);G06N3/063(20060101);
代理机构11201 北京清亦华知识产权代理事务所(普通合伙);
代理人张大威
地址 100084 北京市海淀区清华园
入库时间 2022-08-23 12:01:01
机译: 基于时空注意的深度强化学习,用于控制自主车辆的分层车道变化策略
机译: 基于线性模型的强化学习方法,装置参考和程序
机译: 基于主动学习的基于强化学习的在线学习方法和车辆控制方法
机译:基于策略梯度的独立于任务的高效强化学习方法(基于策略梯度的独立于任务的高效Ihi学习方法)
机译:利用连接自动化车辆的高速公路交通集成了最优控制策略:基于模型的强化学习方法
机译:基于强化学习方法的智能焊接控制策略
机译:具有用户首选项和时间相关请求的在线缓存策略:一种强化学习方法
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:上行链路中的分层QoS的双动态调度:强化学习方法
机译:基于首选项的策略迭代:利用首选项学习进行强化学习
机译:基于树的分层强化学习