首页> 中国专利> 使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理

使用强化学习来加速自动驾驶车辆的轨迹规划的离线代理

摘要

在一个实施方式中,系统生成多个驱动驾驶场景来训练强化学习(RL)代理并重放每个驱动驾驶场景以通过以下操作训练RL代理:将RL算法应用于驱动驾驶场景的初始状态,以从ADV的多个离散的控制/动作选项中确定多个控制动作,以达到基于多个离散的轨迹状态选项的多个轨迹状态,对于每个控制/动作确定通过RL算法的回报预测,确定轨迹状态的判断分数,并基于判断分数更新RL代理。

著录项

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号