机译:通过近似策略改进对一般Markov决策过程进行时间逻辑控制
机译:通过近似相似性关系和政策细化验证通用马尔可夫决策过程
机译:具有线性时间逻辑约束的马尔可夫决策过程的最优控制
机译:时限时间逻辑规范对连续时间马尔可夫过程控制策略的形式综合
机译:通过近似政策细化的马尔可夫决策过程的时间逻辑控制
机译:马尔可夫决策过程中的多阶段决策和风险:建立有效的近似动态编程体系结构。
机译:通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
机译:一般马尔可夫决策过程的时态逻辑控制 近似政策改进
机译:基于学习的线性时序逻辑规范马尔可夫决策过程综合控制方法。