首页> 中国专利> 一种基于示范数据强化学习技术的水下航行器自主上浮控制方法

一种基于示范数据强化学习技术的水下航行器自主上浮控制方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及一种基于示范数据强化学习技术的水下航行器自主上浮控制方法，属于海洋设备控制技术领域，本发明基于深度强化学习中“演员‑评论家”算法框架，提出一种基于结合示范数据深度强化学习技术的水下航行器自主上浮控制方法。本发明基于DDPG算法，实现对连续动作空间水下航行器的上浮控制，并且在训练过程中使用示范数据，加速算法的收敛，同时对算法框架中的演员网络进行延迟更新，有效消除强化学习算法中存在的过估计问题。

著录项

公开/公告号CN113033118A

专利类型发明专利
公开/公告日2021-06-25

原文格式PDF
申请/专利权人山东大学;
展开▼

申请/专利号CN202110260783.7
发明设计人李沂滨;张天泽;缪旭弘;魏征;尤岳;周广礼;贾磊;庄英豪;宋艳;
展开▼

申请日2021-03-10
分类号G06F30/28(20200101);G06N3/04(20060101);G06N3/08(20060101);B63G8/18(20060101);B63G8/14(20060101);
代理机构37219 济南金迪知识产权代理有限公司;
代理人王楠
地址 250199 山东省济南市历城区山大南路27号
入库时间 2023-06-19 11:35:49

法律信息

法律状态公告日

法律状态信息

法律状态
2022-03-25

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种基于示范数据强化学习技术的水下航行器自主上浮控制方法 [P] . 中国专利： CN113033118A . 2021-06-25
2. 基于深度强化学习的自主水下航行器轨迹跟踪控制方法 [P] . 中国专利： CN108803321B . 2020.07.10
3. Autonomous-controlled underwater vehicles and autonomous control method of underwater vehicles [P] . 日本专利： JP5453992B2 . 2014-03-26

机译：自主控制的水下航行器和水下航行器的自主控制方法
4. METHOD OF INCREASING ACCURACY OF NAVIGATION OF AUTONOMOUS UNINHABITED UNDERWATER VEHICLE WITH INERTIAL NAVIGATION SYSTEM AND TECHNICAL VISION SYSTEM [P] . 俄罗斯专利： RU2680395C1 . 2019-02-20

机译：惯性导航系统和技术视觉系统提高自主无人水下航行器导航精度的方法
5. SPATIAL AND TEMPORAL ATTENTION-BASED DEEP REINFORCEMENT LEARNING OF HIERARCHICAL LANE-CHANGE POLICIES FOR CONTROLLING AN AUTONOMOUS VEHICLE [P] . 美国专利： US2020139973A1 . 2020-05-07

机译：基于时空注意的深度强化学习，用于控制自主车辆的分层车道变化策略