机译:马尔可夫决策过程中价值函数的进化算法发现
Center for Mathematics and Computer Science (CWI), Amsterdam, The Netherlands;
Faculty of Sciences, VU University Amsterdam, Amsterdam, The Netherlands;
Center for Mathematics and Computer Science (CWI), Amsterdam, The Netherlands;
Sociology; Statistics; Convergence; Numerical models; Piecewise linear approximation; Approximation methods; Cybernetics;
机译:一种求解马尔可夫决策过程的进化随机策略搜索算法
机译:通过价值函数发现学习马尔可夫决策过程中的最优策略
机译:约束Markov决策过程的带函数逼近的在线Actor-Critic算法
机译:进化算法,马尔可夫决策过程,自适应批评家设计和聚类:共性,杂交和性能
机译:用于集中式和分散式部分可观察的马尔可夫决策过程的算法中的可伸缩性不断增强:在不确定的环境中进行有效的决策和协调。
机译:进化马尔可夫链蒙特卡罗算法的重组算子和选择策略
机译:马尔可夫决策过程中价值函数的进化算法发现