...
机译:在时间逻辑约束下Markov决策过程的熵最大化
Univ Texas Austin Dept Aerosp Engn Austin TX 78705 USA;
Univ Illinois Dept Aerosp Engn Urbana IL 61801 USA|Univ Illinois Coordinated Sci Lab Urbana IL 61801 USA;
Univ Texas Austin Dept Aerosp Engn Austin TX 78705 USA;
Univ Texas Austin Dept Elect & Comp Engn Austin TX 78705 USA;
Univ Texas Austin Dept Aerosp Engn Austin TX 78705 USA;
Entropy; Markov processes; Random variables; Convex functions; Planning; Task analysis; Markov processes; entropy; temporal logic; convexity;
机译:具有线性时间逻辑约束的马尔可夫决策过程的最优控制
机译:通过近似策略改进对一般Markov决策过程进行时间逻辑控制
机译:马尔可夫和半马尔可夫过程的熵最大化
机译:约束马尔可夫决策过程的熵最大化
机译:隐藏马尔可夫模型的现代方法和止痛性的部分可观察马尔可夫决策过程
机译:学习最大化奖励率:基于半马尔可夫决策过程的模型
机译:在时间逻辑约束下Markov决策过程的熵最大化
机译:基于学习的线性时序逻辑规范马尔可夫决策过程综合控制方法。