一种基于独立任务的 POMDP 问题的解决方法

房俊恒; 朱斐; 刘全; 伏玉琛; 凌兴宏

首页> 中文期刊> 《计算机应用研究》 >一种基于独立任务的 POMDP 问题的解决方法

一种基于独立任务的 POMDP 问题的解决方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

通常利用 POMDPs 对在部分可观测的随机环境中决策的 agents 建模。针对完整 POMDP 的求解方法扩展能力弱的问题，提出把多元 POMDP 分解成多个受限制的 POMDPs，然后独立求解每个模型，以获得值函数，并将这些受限制的 POMDPs 的值函数结合起来以便获得完整 POMDP 策略。该方法主要阐述识别与独立任务相关的状态变量的过程，以及如何构造被限制在单独任务上的模型。将该方法应用到两个不同规模的岩石采样问题中，实验结果表明，该方法能够获得很好的策略。%POMDPs are widely used to model agents acting in a stochastic environment under partial observability.Because the complete POMDP solvers have poor ability to scale up,this paper proposed to decompose a factored POMDP into a set of restricted POMDPs and solved each such model independently,acquiring a value function.And then,it used the combination of the value functions of the restricted POMDPs to form a policy for the complete POMDP.It mainly explained the process of identifying state variables that corresponded to independent tasks,and how to create a model restricted to a single task.Using this method on RockSample domain with two different size,experiment results show that this method can gain a good policy.

著录项

来源
《计算机应用研究》 |2016年第1期|147-152|共6页
作者
房俊恒; 朱斐; 刘全; 伏玉琛; 凌兴宏;
展开▼
作者单位

苏州大学计算机科学与技术学院;

江苏苏州 215006;

苏州大学计算机科学与技术学院;

江苏苏州 215006;

吉林大学符号计算与知识工程教育部重点实验室;

长春 130012;

苏州大学计算机科学与技术学院;

江苏苏州 215006;

吉林大学符号计算与知识工程教育部重点实验室;

长春 130012;

苏州大学计算机科学与技术学院;

江苏苏州 215006;

苏州大学计算机科学与技术学院;

江苏苏州 215006;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
POMDP; 基于点的算法; 相互独立的任务; 多元 POMDP; 受限制的 POMDPs;

相似文献

中文文献
外文文献
专利

1. POMDP基于点的值迭代算法中一种信念选择方法 [J] . 冯奇 ,周雪忠 ,黄厚宽 . 北京交通大学学报 . 2009,第005期
2. 一种基于POMDP用户意图建模的智能轮椅导航控制方法 [J] . 陶永 ,王田苗 ,魏洪兴 . 东南大学学报：自然科学版 . 2009,第S1期
3. 基于POMDP框架的集群无人机侦察任务可靠性建模 [J] . 白桦 ,孙旭朋 ,黄文铮 . 环境技术 . 2020,第005期
4. 一种基于最优策略概率分布的 POMDP 值迭代算法 [J] . 刘峰 ,王崇骏 ,骆斌 . 电子学报 . 2016,第005期
5. SHP-Ⅵ:一种基于最短哈密顿通路的POMDP值迭代算法 [J] . 冯奇 ,周雪忠 ,黄厚宽 . 计算机研究与发展 . 2011,第012期
6. 一种基于POMDP用户意图建模的智能轮椅导航控制方法 [C] . 陶永 ,王田苗 ,魏洪兴 . 2009年中国智能自动化会议 . 2009
7. 一种基于20kW太阳炉生物质气化过程中焦油问题的解决方法 [A] . 魏鹏程 . 2021

一种基于独立任务的 POMDP 问题的解决方法

摘要

著录项

相似文献

相关主题

期刊订阅