机译:具有无界转移和折扣率的连续时间马尔可夫决策过程
Discounted reward criterion; General state space; Optimal stationary policy; Q-process;
机译:具有无界转移和折扣率的连续时间马尔可夫决策过程
机译:具有无界转换率的连续时间马尔可夫决策过程的有限水平最优性
机译:具有约束条件的折扣连续时间马尔科夫决策过程:无限制的过渡和损失率
机译:线性时间逻辑规范下折扣奖励马尔可夫决策过程的最佳控制
机译:马尔可夫决策过程计算减排策略调查
机译:学习最大化奖励率:基于半马尔可夫决策过程的模型
机译:有限地平线风险敏感的连续时间马尔可夫决策流程,具有无限的过渡和成本率