首页> 中国专利> 使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理

使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理

页面导航

摘要
著录项
相似文献

摘要

在一个实施方式中，系统生成多个驱动驾驶场景来训练强化学习(RL)代理并重放每个驱动驾驶场景以通过以下操作训练RL代理：将RL算法应用于驱动驾驶场景的初始状态，以从ADV的多个离散的控制/动作选项中确定多个控制动作，以达到基于多个离散的轨迹状态选项的多个轨迹状态，对于每个控制/动作确定通过RL算法的回报预测，确定轨迹状态的判断分数，并基于判断分数更新RL代理。

著录项

公开/公告号CN112034834A

专利类型发明专利
公开/公告日2020-12-04

原文格式PDF
申请/专利权人百度(美国)有限责任公司;
展开▼

申请/专利号CN201911266984.7
发明设计人何润欣;周金运;罗琦;宋适宇;缪景皓;胡江滔;王禹;许稼轩;姜舒;
展开▼

申请日2019-12-11
分类号G05D1/02(20200101);
代理机构11204 北京英赛嘉华知识产权代理有限责任公司;
代理人马晓亚;王艳春
地址美国加利福尼亚州
入库时间 2023-06-19 09:06:00

相似文献

专利
中文文献
外文文献

1. 使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理 [P] . 中国专利： CN112034834A . 2020-12-04
2. 基于强化学习的自动驾驶车辆换道轨迹规划方法及系统 [P] . 中国专利： CN113581182A . 2021-11-02
3. System and method for providing multiple agents for decision making, trajectory planning, and control for autonomous vehicles [P] . 美国专利： US10768626B2 . 2020-09-08

机译：用于为自动驾驶车辆的决策，轨迹规划和控制提供多个代理的系统和方法
4. Systems and methods for trajectory planning in an autonomous vehicle using different fixed durations for steering and speed parameters [P] . 美国专利： US10037037B1 . 2018-07-31

机译：使用转向和速度参数的不同固定持续时间的自动驾驶车辆轨迹规划的系统和方法
5. Automatic drive control system for road vehicle takes over from driver and steers, accelerates and brakes as required using computer program [P] . 德国专利： DE19936356A1 . 2000-11-09

机译：道路车辆的自动驾驶控制系统接管驾驶员和转向，使用计算机程序根据需要加速和制动