Department of Computer Science Brown University Providence, RI 02912;
机译:具有状态空间的一类马尔可夫决策过程中风险敏感的平均成本最优方程的求解
机译:具有BOREL空间和绑定成本的平均成本MARKOV决策过程的近似值迭代的扰动方法
机译:具有Borel空间和界限成本的平均成本马尔可夫决策过程近似值迭代的扰动方法
机译:通过贪婪搜索在有限状态控制器的空间中通过贪婪搜索近似解
机译:马尔可夫决策过程的近似解决方案
机译:基于子空间追求的神经磁逆问题的迭代贪婪层次解
机译:具有Borel空间和界限成本的平均成本马尔可夫决策过程近似值迭代的扰动方法