首页> 中国专利> 用于学习策略和运行该策略的方法和设备

用于学习策略和运行该策略的方法和设备

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及用于学习策略（π）的方法（20），所述策略（π）最佳地适配进化算法的至少一个参数（σ）。所述方法包括以下步骤：初始化所述策略，所述策略根据状态信息（S）确定所述参数（σ）的参数化（A）。借助于强化学习（英语：reinforcement learning）来学习所述策略（π），其中从CMA‑ES算法与借助于所述策略根据所述状态信息（S）确定的参数化的交互、与所述问题实例（14）的交互中以及从奖励信号（R）中学习到哪种参数化对于可能的状态信息是最佳的。

著录项

公开/公告号CN113971460A

专利类型发明专利
公开/公告日2022-01-25

原文格式PDF
申请/专利权人罗伯特·博世有限公司;
展开▼

申请/专利号CN202110830466.4
发明设计人 S·阿德里安森;A·别登卡普;F·胡特尔;G·沙拉;M·林道尔;N·阿瓦德;
展开▼

申请日2021-07-22
分类号G06N3/08(20060101);G06Q10/04(20120101);G06K9/62(20220101);G06V10/26(20220101);
代理机构72001 中国专利代理(香港)有限公司;
代理人姬亚东;刘春元
地址德国斯图加特
入库时间 2023-06-19 14:00:21

法律信息

法律状态公告日

法律状态信息

法律状态
2022-01-25

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 用于学习策略和运行该策略的方法和设备 [P] . 中国专利： CN113971460A . 2022-01-25
2. 基于对抗学习策略的机械装备运行状态异常检测系统和方法 [P] . 中国专利： CN112179691A . 2021-01-05
3. Method and apparatus for learning a strategy and operating the strategy [P] . DE102020209281A1 . 2022-01-27

机译：用于学习策略和操作策略的方法和装置
4. Method for operating motor vehicle with multiple actuators, involves determining operating strategy of motor vehicle from predetermined set of operating strategies depending on operating variable of motor vehicle [P] . 德国专利： DE102011078270A1 . 2013-01-03

机译：用于运行具有多个执行器的机动车的方法，包括根据机动车的运行参数由预定的一组运行策略来确定机动车的运行策略。
5. Method for operating vehicle e.g. commercial vehicle, involves determining momentary operating strategy by evaluation of operating mode and operating values by statistic method and by comparing data of operating mode and operating values [P] . 德国专利： DE102009042180A1 . 2011-03-24

机译：用于操作车辆的方法，例如商用车，涉及通过统计方法评估运行模式和运行值并比较运行模式和运行值的数据来确定瞬时运行策略