首页> 外文会议>Proceedings of the Twenty-Third international joint conference on artificial intelligence >Path Integral Control by Reproducing Kernel Hilbert Space Embedding
【24h】

Path Integral Control by Reproducing Kernel Hilbert Space Embedding

机译:复制核Hilbert空间嵌入的路径积分控制

获取原文
获取原文并翻译 | 示例

摘要

We present an embedding of stochastic optimal control problems,of the so called path integral form,into reproducing kernel Hilbert spaces.Using consistent,sample based estimates of the embedding leads to a model-free,non-parametric approach for calculation of an approximate solution to the control problem.This formulation admits a decomposition of the problem into an invariant and task dependent component.Consequently,we make much more efficient use of the sample data compared to previous sample based approaches in this domain,e.g.,by allowing sample re-use across tasks.Numerical examples on test problems,which illustrate the sample efficiency,are provided.
机译:我们提出了一种随机最优控制问题的嵌入方法,即所谓的路径积分形式,以重现内核希尔伯特空间。使用一致的,基于样本的估计值,可以得出一种无模型的,非参数的方法来计算近似解这种表达方式允许将问题分解成不变的和任务相关的组件。因此,与该领域以前的基于样本的方法相比,我们可以更有效地利用样本数据,例如,通过允许样本重新跨任务使用。提供了有关测试问题的数字示例,这些示例说明了样本效率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号