On Risk-Sensitive Piecewise Deterministic Markov Decision Processes

首页> 外文期刊>Applied mathematics and optimization >On Risk-Sensitive Piecewise Deterministic Markov Decision Processes

【24h】

On Risk-Sensitive Piecewise Deterministic Markov Decision Processes

机译：风险敏感分段确定型马尔可夫决策过程

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

We consider a piecewise deterministic Markov decision process, where the expected exponential utility of total (nonnegative) cost is to be minimized. The cost rate, transition rate and post-jump distributions are under control. The state space is Borel, and the transition and cost rates are locally integrable along the drift. Under natural conditions, we establish the optimality equation, justify the value iteration algorithm, and show the existence of a deterministic stationary optimal policy. Applied to special cases, the obtained results already significantly improve some existing results in the literature on finite horizon and infinite horizon discounted risk-sensitive continuous-time Markov decision processes.

机译：我们考虑一个分段确定的马尔可夫决策过程，其中总共（非负）成本的预期指数效用是最小化的。成本率，过渡率和跳跃后分布都处于控制状态。状态空间是硼，并且过渡和成本速率沿漂移局部可集成。在自然条件下，我们建立了最优性方程，证明了价值迭代算法，展示了确定性静止最佳政策的存在。适用于特殊情况，所获得的结果已经显着改善了有限地平线和无限地平线折扣风险敏感连续时间马尔可夫决策过程的文献中的一些现有结果。

著录项

来源
《Applied mathematics and optimization》 |2020年第3期|共26页
作者

展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类最优化的数学理论;
关键词
Continuous-time Markov decision processes; Piecewise deterministic Markov decision processes; Exponential utility; Dynamic programming;

机译：连续时间马尔可夫决策过程;分段确定性马尔可夫决策过程;指数效用;动态规划;

相似文献

外文文献
中文文献
专利

1. On Risk-Sensitive Piecewise Deterministic Markov Decision Processes [J] . Applied mathematics and optimization . 2020,第3期

机译：风险敏感分段确定型马尔可夫决策过程
2. Multiconstrained Finite-Horizon Piecewise Deterministic Markov Decision Processes with Unbounded Transition Rates [J] . Mathematics of operations research . 2020,第2期

机译：多元素有限地平线分段确定型马尔可夫决策过程，具有无限的过渡率
3. Finite-horizon piecewise deterministic Markov decision processes with unbounded transition rates [J] . Huang Yonghui, Guo Xianping Stochastics: An International Journal of Probability and Stochastic Processes . 2019,第1a4期

机译：有限地平线分段确定型马尔可夫决策过程，具有无限的过渡率
4. Risk-Sensitive Piecewise-Linear Policy Iteration for Stochastic Shortest Path Markov Decision Processes [C] . Henrique Dias Pastor, Igor Oliveira Borges, Valdinei Freire, Mexican International Conference on Artificial Intelligence . 2020

机译：随机最短路径马尔可夫决策过程的风险敏感分段 - 线性政策迭代
5. A hybrid genetic/optimization algorithm for piecewise affine and convex Markov decision processes. [D] . Lin, Zong-Zhi. 1999

机译：分段仿射和凸马尔可夫决策过程的混合遗传/优化算法。
6. Efficient analysis of stochastic gene dynamics in the non-adiabatic regime using piecewise deterministic Markov processes [O] . Yen Ting Lin, Nicolas E. Buchler 2018

机译：使用分段确定性马尔可夫过程对非绝热状态下的随机基因动力学进行有效分析
7. On risk-sensitive piecewise deterministic Markov decision processes [O] . Guo, Xin, Zhang, Yi 2017

机译：关于风险敏感的分段确定性马尔可夫决策过程

On Risk-Sensitive Piecewise Deterministic Markov Decision Processes

摘要

著录项

相似文献

相关主题

期刊订阅