首页> 中文期刊> 《系统工程与电子技术》 >部分可观测马尔可夫决策过程算法综述

部分可观测马尔可夫决策过程算法综述

         

摘要

部分可观测马尔可夫决策过程(POMDP)是马尔可夫决策过程(MDP)的扩展,它允许系统的状态信息部分可知.但POMDP的可能应用大部分没有实现,这主要是因为缺乏有效的算法.POMDP的算法分为近似算法和精确算法,精确算法是构造近似算法的基础.介绍了POMDP模型后,对离散时间、有限状态集的POMDP精确算法和近似算法进行了综述,分析了造成POMDP难以求解的主要原因,提出了进一步的研究方向.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号