...
首页> 外文期刊>Journal of Economic Dynamics and Control >Fitted value function iteration with probability one contractions
【24h】

Fitted value function iteration with probability one contractions

机译:拟合值函数迭代概率为一收缩

获取原文
获取原文并翻译 | 示例
           

摘要

This paper studies a value function iteration algorithm based on nonexpanstve function approximation and Monte Carlo integration that can be applied to almost all stationary dynamic programming problems. The method can be represented using a randomized fitted Bellman operator and a corresponding algorithm that is shown to be globally convergent with probability one. When additional restrictions are imposed, an 0_P(n~(-1/2)) rate of convergence for Monte Carlo error is obtained.
机译:本文研究了一种基于非展开函数逼近和蒙特卡洛积分的值函数迭代算法,该算法可以应用于几乎所有平稳动态规划问题。可以使用随机拟合的Bellman算子和相应的算法表示该方法,该算法显示为以概率1全局收敛。当施加附加限制时,获得蒙特卡洛误差的0_P(n〜(-1/2))收敛速度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号