首页> 中国专利> 基于一致性约束建模的强化学习机器人控制方法及系统

基于一致性约束建模的强化学习机器人控制方法及系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及一种基于一致性约束建模的强化学习机器人控制方法及系统，其包括：初始化环境和各网络参数；利用与真实环境的交互数据训练环境模型；利用策略网络πφ与训练后的环境模型交互，将交互数据存放在数据存放器Dmodel中；根据环境模型，采用Soft Actor‑Critic方法进行策略训练；重复执行直至收敛。本发明能减少对建模的误差，增加环境建模的准确性和鲁棒性，提高稳定性。本发明可以广泛在机器人控制领域中应用。

著录项

公开/公告号CN113485107A

专利类型发明专利
公开/公告日2021-10-08

原文格式PDF
申请/专利权人清华大学深圳国际研究生院;
展开▼

申请/专利号CN202110768179.5
发明设计人李秀;贾若楠;
展开▼

申请日2021-07-05
分类号G05B13/04(20060101);
代理机构11245 北京纪凯知识产权代理有限公司;
代理人孙楠
地址 518071 广东省深圳市南山区丽水路2279号
入库时间 2023-06-19 12:49:58

法律信息

法律状态公告日

法律状态信息

法律状态
2023-08-22

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 基于一致性约束建模的强化学习机器人控制方法及系统 [P] . 中国专利： CN113485107A . 2021-10-08
2. 一种基于强化学习的多组机器人协作控制方法及控制系统 [P] . 中国专利： CN109116854B . 2021.03.12
3. Programmable handling device e.g. robot, controlling method for production system, involves moving component e.g. arm, relative to another component based on movement of construction model of virtual image of former component [P] . 德国专利： DE102006036490A1 . 2008-02-07

机译：可编程处理设备，例如机器人，用于生产系统的控制方法，涉及移动部件，例如机器人。手臂，基于前一个组件的虚拟图像构建模型的运动相对于另一个组件
4. AXIS-INVARIANT-BASED MODELING AND CONTROL METHOD FOR MULTI-AXIS ROBOT SYSTEM [P] . 世界知识产权组织专利： WO2020034421A1 . 2020-02-20

机译：基于轴不变性的多轴机器人系统建模与控制方法
5. Method and system for automatic robot control policy generation via CAD-based deep inverse reinforcement learning [P] . 美国专利： US10828775B2 . 2020-11-10

机译：通过基于CAD的深度逆强化学习自动生成机器人控制策略的方法和系统