首页> 中文学位 >动作依赖型自适应动态规划方法的实时控制应用研究
【6h】

动作依赖型自适应动态规划方法的实时控制应用研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1引言

1.2自适应动态规划的发展及研究现状

1.3课题来源

1.4课题研究意义

1.5研究内容

第二章自适应动态规划

2.1动态规划

2.1.1多阶段决策过程

2.1.2动态规划的基本概念

2.1.3最优化原理

2.1.4动态规划的思想

2.1.5动态规划的解

2.1.6动态规划的问题

2.2自适应动态规划

2.2.1 ADP方法的起源

2.2.2 ADP方法概述

2.2.3 HDP方法

2.2.4 ADHDP方法

2.2.5 DHP方法

2.2.6 ADDHP方法

2.2.7 GDP和ADGDHP方法

2.3总结

第三章ADP方法实时性分析

3.1引言

3.2神经网络

3.2.1神经网络概述

3.2.2 BP神经网络

3.3基于BP网的ADP方法

3.3.1基于BP网的ADP方法

3.3.2评价网络

3.3.3模型网络

3.3.4动作网络

3.4 ADP方法实时性分析

3.4.1三模块与双模块

3.4.2启发式和双启发式

3.4.3标准ADDHP与改进的ADDHP

3.4.4 GDHP和ADGDHP

3.5总结

第四章ADP实时控制器设计

4.1引言

4.2改进型ADDHP实时控制器

4.2.1基本框架和基本定义

4.2.2正向计算过程

4.2.3算法学习过程

4.3 ADHDP实时控制器

4.3.1 ADHDP网络结构及正向传播

4.3.2算法学习过程

4.4总结

第五章仿真与实时控制

5.1引言

5.2控制器算法程序设计

5.3三容液位实验装置及其系统模型

5.4三容液位实验装置实时控制环境

5.4.1实时控制系统硬件组成

5.4.2 MATLAB与数据采集卡的联接

5.5三容液位的仿真控制

5.5.1 ADHDP的仿真结果

5.5.2 ADDHP的仿真结果

5.6实时控制

5.6.1 ADHDP实时控制的实验结果

5.6.2 ADDHP实时控制的实验结果

5.7实验结果分析

第六章结论

参考文献

致谢

攻读学位期间发表论文情况

展开▼

摘要

本文介绍了一种基于动作依赖型自适应动态规划方法的新型实时优化神经控制器,包括其原理结构,训练算法和实现步骤。
   该方法能够提高计算效率,并且利用动作-评价结构克服“维数灾”问题。评价网络是用来近似动态规划方法的代价函数。动作依赖型(Action Depended)算法使得ADP控制器更加简单,更适合于复杂非线性系统的在线/实时控制。
   一种算法的计算复杂性、实时性等特性是其能否成功应用的关键。基于AD-ADP的神经控制器能够解决不确定非线性问题,特别是难以建模系统,同样可以很好的降低由于缺乏必要的先验知识给控制系统设计带来的困难。
   由于动作依赖自适应动态规划方法的结构在控制上有着特殊的优势,本文在实时性分析的基础上分别选取并设计了ADHDP和改进型ADDHP算法的控制器。
   为了说明该方法对于复杂非线性系统在线优化控制的效果,选取三容液位系统作为控制对象,一种强耦合非线性多变量系统,是用来验证各种控制算法的有效装置。在IPC、MATLAB和PCI1710平台上,分别进行了基于AD-ADP的仿真和实时控制实验。
   实验结果及其比较可以看出这种基于AD-ADP的新型优化神经控制器有强鲁棒性,强抗干扰性,控制精度高以及反应迅速等特点。显示了AD-ADP控制器,这种智能无模型控制方法在复杂非线性在线/实时控制上的优势,特别是在模型不确定系统控制的优势。相信该方法的发展和实际工业应用的前景是广阔的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号