Dynamic programming ; Decision theory ; Stochastic processes ; Management planning ; Probability density functions ; Time series analysis ; Queueing theory ; Inventory control ; Algorithms;
机译:跳率无限制且成本折扣的可数状态马尔可夫决策过程:最优性方程和逼近
机译:马尔可夫决策过程具有与状态相关的折扣因子和无限制的报酬/成本
机译:具有无界转移和折扣率的连续时间马尔可夫决策过程
机译:马尔可夫决定流程,折扣奖励:新行动消除程序
机译:基于后悔的马尔可夫决策过程的奖励启发。
机译:在概率贴现任务中滥用的吸入甲苯会损害内侧前额叶皮层活动和风险/奖励决策。
机译:具有无穷大奖励的可数状态无限视野折现马尔可夫决策过程的有限状态近似
机译:马尔可夫决策过程中可计算的方程组的解决方案技术报告no。 89