Extreme Risk Averse Policy for Goal-Directed Risk-Sensitive Markov Decision Process

机译：目标导向的风险敏感马尔可夫决策过程的极端风险规避策略

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

The Goal-Directed Risk-Sensitive Markov Decision Process allows arbitrary risk attitudes for the probabilistic planning problem to reach a goal state. In this problem, the risk attitude is modeled by an expected exponential utility and a risk factor λ. However, the problem is not well defined for every λ, posing the problem of defining the maximum (extreme) value for this factor. In this paper, we propose an algorithm to find this e-extreme risk factor and the corresponding optimal policy.

机译：目标导向的风险敏感马尔可夫决策过程允许概率计划问题的任意风险态度达到目标状态。在这个问题中，风险态度由预期的指数效用和风险因子λ建模。但是，对于每个λ，问题并未得到很好的定义，从而带来了为此因子定义最大值（极值）的问题。在本文中，我们提出了一种算法来找到该电子极端风险因素和相应的最优策略。

著录项

来源
《Brazilian Conference on Intelligent Systems》|2016年|79-84|共6页
会议地点
作者
Valdinei Freire; Karina Valdivia Delgado;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类
关键词
Markov processes; Mathematical model; Art; Electronic mail; Probabilistic logic; Random variables; Bellows;

机译：马尔可夫过程;数学模型;艺术;电子邮件;概率逻辑;随机变量;贝娄;

相似文献

外文文献
中文文献
专利

1. Risk-sensitive control of Markov decision processes: A moment-based approach with target distributions [J] . Schlosser Rainer Computers & operations research . 2020,第Nova期

机译：马尔可夫决策过程的风险敏感控制：基于时刻的目标分布方法
2. Risk-Sensitive Markov Decision Processes with Combined Metrics of Mean and Variance [J] . Xia Li Production and operations management . 2020,第12期

机译：风险敏感的马尔可夫决策过程，具有均值和方差的组合度量
3. On Risk-Sensitive Piecewise Deterministic Markov Decision Processes [J] . Applied mathematics and optimization . 2020,第3期

机译：风险敏感分段确定型马尔可夫决策过程
4. Extreme Risk Averse Policy for Goal-Directed Risk-Sensitive Markov Decision Process [C] . Valdinei Freire, Karina Valdivia Delgado Brazilian Conference on Intelligent Systems . 2016

机译：目标导向风险敏感马尔可夫决策过程的极端风险厌恶政策
5. Multistage decisions and risk in Markov decision processes: Towards effective approximate dynamic programming architectures. [D] . Pratikakis, Nikolaos E. 2009

机译：马尔可夫决策过程中的多阶段决策和风险：建立有效的近似动态编程体系结构。
6. Optimal Decisions for Two Risk-Averse Competitive Manufacturers under the Cap-and-Trade Policy and Uncertain Demand [O] . Hongxia Sun, Jie Yang, Yang Zhong 2020

机译：总量管制和交易不确定条件下两个规避风险的竞争制造商的最优决策
7. RISK-AVERSE AND AMBIGUITY-AVERSE MARKOV DECISION PROCESSES [O] . YU PENGQIAN 2016

机译：规避风险和避免歧义的马尔可夫决策过程

Extreme Risk Averse Policy for Goal-Directed Risk-Sensitive Markov Decision Process

摘要

著录项

相似文献

相关主题

期刊订阅