首页> 外国专利> Method and apparatus for learning a strategy and operating the strategy

Method and apparatus for learning a strategy and operating the strategy

机译:用于学习策略和操作策略的方法和装置

摘要

Method (20) for learning a strategy (π),which optimally adapts at least one parameter (σ) of an evolutionary algorithm. The method includes the following steps: Initializing the strategy, which determines a parameterization (A) of the parameter (σ) depending on state information (S). Learning strategy (π) through reinforcement learning,where from interactions of the CMA-ES algorithm with a parameterization determined by the strategy depending on the state information (S),with a problem instance (14) and a reward signal (R) learn which parameterization is optimal for possible state information.
机译:用于学习策略(π)的方法(20),其最佳地适应进化算法的至少一个参数(σ)。 该方法包括以下步骤:初始化策略,该策略根据状态信息确定参数(σ)的参数化(a)。 通过加强学习的学习策略(π),通过CMA-ES算法与策略确定的参数化的相互作用,根据状态信息,具有问题实例(14)和奖励信号(R)学习哪个 参数化是可能的状态信息的最佳状态。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号