首页> 中国专利> 基于深度强化学习的航空发动机剩余使用寿命估计方法

基于深度强化学习的航空发动机剩余使用寿命估计方法

摘要

本发明提供一种基于深度强化学习的航空发动机剩余使用寿命估计方法,根据航空发动机寿命估计的需求和特点,将其视为一种序列性的决策问题,因此建立对应的马尔可夫决策过程模型。针对此马尔可夫模型,制定了状态动作奖赏等交互规则,同时设计了寿命估计奖励函数,并且根据航空发动机寿命估计数据的特点,提出了寿命估计策略的深度学习模型。最后,利用深度强化学习算法,在此马尔可夫模型中学得最优的航空发动机寿命估计估计策略。本发明克服了传统的监督学习方法所带来的过拟合风险,有利于求得更优的航空发动机寿命估计策略,可以提高航空发动机寿命估计的准确度,改善视情维修的及时性,增强飞机飞行的安全性,节省不必要的维护费用。

著录项

  • 公开/公告号CN112329337A

    专利类型发明专利

  • 公开/公告日2021-02-05

    原文格式PDF

  • 申请/专利权人 南京航空航天大学;

    申请/专利号CN202011144498.0

  • 发明设计人 赵永平;胡乾坤;

    申请日2020-10-23

  • 分类号G06F30/27(20200101);G06N3/04(20060101);G06N3/08(20060101);G06N20/00(20190101);G06F119/02(20200101);G06F119/04(20200101);

  • 代理机构32249 南京瑞弘专利商标事务所(普通合伙);

  • 代理人秦秋星

  • 地址 210016 江苏省南京市秦淮区御道街29号

  • 入库时间 2023-06-19 09:49:27

说明书

技术领域

本发明针对航空发动机剩余使用寿命估计领域,首先将航空发动机剩余使用寿命估计问题建模为马尔可夫序列决策过程模型,然后利用深度强化学习(DeepReinforcement Learning)算法求得最优的剩余使用寿命估计策略,从而提高航空发动机剩余使用寿命估计的准确度。

背景技术

由于老化或其他突发状况,当代的工业系统有时会发生严重的故障。因此机器的维护管理在现代工业活动中起着关键的作用。视情维修(Condition-based Maintenance,CBM)作为一种高效的维护策略,已经被广泛应于现代的工业系统中。预断学(Prognostics)作为CBM实施的关键推动力,在CBM中起着重要的作用。预断技术通常备被用来分析所收集到的机器状况监控数据(Condition Monitoring,CM)。通过对CM数据的分析,机器的潜在故障信息可以被提前诊断出,因此可以安排适当及时的维修。CBM可以用来避免发生灾难性的错误,并且减少不必要的维修损失。在预断学中,一个关键性的技术即是对机器的剩余使用寿命进行估计(remaining useful life,RUL)。RUL表示机器距离发生故障或失效所剩余的使用时间。只要准备的预估出RUL的数值,则机器的故障时间可以提前准确的预知,相应的维修计划也可以及时得到安排。因此一个准确的剩余使用寿命估计模型可以提高系统的可靠性,改善机器维护的高效性,并且节省不必要的经济损失。由于其种种优点以及重要性,剩余使用寿命估计已经吸引了许多研究兴趣。

通常,目前存在的剩余使用寿命估计的方法可以分为三类:1)基于模型的方法。2)句驱动的方法。3)混合方法。若给出准确地物理系统退化过程模型,基于模型的方法可以准确的预估出剩余使用寿命值。然而,这种建模需要大量的对物理系统的先验知识,然而这些先验知识在实际过程中通常难以获得。另一方面,数据驱动的方法可以直接学习到机器的状态监控数据与剩余使用寿命之间的映射关系。在数据驱动方法中,无需关于机械系统的先验知识。并且随着传感器技术的发展,可以收集越来越多的机器监控数据。因此,基于数据驱动的方法目前在剩余使用寿命领域越来越受欢迎。

机器学习算法具有较强的泛化能力。近些年来,在数据驱动方法领域,越来越多的机器学习法被用来学习剩余使用寿命与机器监控数据之间的映射关系。例如,在2016年,支持向量回归(Support Vector Regression,SVR)算法被用来进行剩余使用寿命估计。在2016年,卷积神经网络(Convolutional Neural Networks,CNN)被用来进行剩余使用寿命估计方法的研究。同样在2016年,随机森林(Random Forest(RF)),梯度提升(GradientBoosting,GB),极限学习机(Extreme Learning Machine,ELM)算法,多层感知机(Multi-layer Perceptron,MLP),深度置信神经网络(Deep Belief Network,DBN)算法,被应用于剩余使用寿命估计。在2016年,多目标进化算法集成的深度置信神经网络被提出,用于剩余使用寿命估计。在2017年,长短时记忆神经网络(Long Short-Term Memory networks,LSTM)被应用于剩余使用寿命估计。在2018年,双向的LSTM神经网络被应用于使用寿命估计。在2019年,CNN混合LSTM被提出应用于剩余使用寿命估计。在2020年,双向门循环单元和CNN的混合算法被提出,并成功应用于航空发动机寿命估计领域,取得了优异的效果。

虽然许多机器学习的算法被应用于剩余使用寿命估计领域,但他们都属于监督学习算法的范畴,遵循相同的学习模式。在这种训练模式下,通过拟合训练集数据,来学习到一个剩余使用寿命估计模型,从而用于生产环境中的剩余使用寿命估计问题。但监督学习普遍存在过拟合的风险,因此为了避免过拟合,只能早停或其他的防治过拟合的策略,然而,这种处理方式会阻止对更优的剩余使用寿命估计策略的探索与发现。因此目前的机器学习算法,在航空发动机寿命估计领域存在一定的性能缺陷。作为机器学习算法的另一个分支,强化学习在未知环境探索中有着强大的能力。不同于监督学习算法,基于标签化的训练集学得一个剩余使用寿命估计模型,深度强化学习从未知环境中通过试错,逐步学得一个具有较强泛化性的策略。近些年来强化学习已经应用于许多交叉领域。

深度强化学习(Deep Reinforcement Learning,DRL)算法由Google DeepMind团队提出,是强化学习和和深度学习的一种结合。自提出以来,深度强化学习被广泛应用游戏、机器人控制以及金融等领域。深度强化学习通过与环境模型的交互,逐渐学得最优的控制策略。近年来深度强化学习已经成功解决了许多之前挑战性的序列性决策问题。例如,Mnih等提出了基于卷积神经网络的深度强化学习,并直接从游戏画面的高维输入中成功学习了控制策略。目前关于将深度强化学习应用于航空发动机剩余使用寿命估计领域的方法研究尚属空白。大部分的数据驱动方面的研究还是局限于监督学习算法领域。因此目前的方法存在一定的过拟合风险,会引起一定的性能缺陷。

发明内容

发明目的:

为了突破当前剩余使用寿命估计领域的基于数据驱动算法中,仅采用监督学习方法存在的局限,本发明将深度强化学习引入到航空发动机剩余使用寿命估计领域。针对航空发动机剩余使用寿命估计任务,首先将该估计问题建模为马尔可夫序列决策过程模型,然后利用深度强化学习算法求得最优的剩余使用寿命估计策略,从而提高航空发动机剩余使用寿命估计的准确度。

技术方案:

一种基于深度强化学习的航空发动机剩余使用寿命估计方法,包括以下步骤:

步骤1:收集航空发动机状态监控传感器数据以及对应的剩余使用寿命值,并对原始数据进行归一化。每个数据样本为一个数据对,其中包括传感器参数数据以及对应的航空发动机剩余使用寿命值。对收集到的航空发动机剩余使用寿命数据随机编号,组成带编号的航空发动机剩余使用寿命历史数据库。传感器监控数据主要包括21种数据,分别为:风扇进口总温、低压压气机出口总温、高压压气机出口总温、低压涡轮出口总温、风扇进口压力、外涵道总压、高压压气机出口总压、风扇物理转速、核心机物理转速、发动机压比、高压压气机出口静压、耗油率与高压压气机出口静压之比、修正风扇转速、修正核心机转速、外涵比、燃烧室油气比、抽气焓、额定风扇转速、额定修正风扇转速、高压涡轮冷却气抽气量、低压涡轮冷却气抽气量。航空发动机剩余使用寿命值为大于0的整数,表示发动机剩余使用周期。

步骤2:基于步骤1所建立的航空发动机剩余使用寿命历史数据库,对传统的航空发动机剩余使用寿命估计过程,建立其对应的马尔可夫决策过程模型,该马尔可夫模型主要包括以下内容:

1)状态:发动机寿命估计模型的状态量s

2)初始状态:初始状态即为航空发动机剩余使用寿命数据库中,第一个样本的传感器数据值。

3)动作:动作值a

4)奖励函数:奖励值r

其中t表示当前时刻,

5)状态转移概率:在航空发动机剩余使用寿命估计马尔可夫决策过程模型中,状态转移概率P(s

6)剩余使用寿命估计策略π

7)终止:当马尔可夫模型转移到航空发动机剩余使用寿命数据库中的终止状态是,当前估计交互任务终止,返回终止信号Terminal。

步骤3:初始化航空发动机寿命估计策略深度学习模型,本发明使用的深度学习模型为卷积神经网络与全连接神经网络模型(Fully Connected Networks,FCN)的组合模型。如图1所示,当前的发动机状态监控数据(s

本发明所提供的航空发动机寿命估计深度学习模型中,共有两个CNN层,每层包括一个卷积层和一个池化层。因此CNN模型由两层卷积(Convolution)层、两层最大池化层(Max-pooling)组成。CNN中的卷积层运算定义为:

z

其中I为输入矩阵,*表示卷积操作,f

g

意味着在矩阵中取最大值。P

步骤4:初始化交互步数t=0。

步骤5:根据当前的航空发动机寿命估计策略深度学习模型,对当前接收到的航空发动机传感器特征数据进行一次剩余使用寿命估计,根据剩余使用寿命估计值以及实际剩余使用寿命值,马尔可夫模型给出相应的奖励值。并将当前估计交互数据存储,估计交互数据包括:当前的状态、执行剩余使用寿命估计值、奖励值。并判断是都已经到达终止状态:t≥n?,若满足条件,则进行下一步,否则继续与航空发动机寿命估计马尔可夫模型进行估计交互。

步骤6:基于最新的n步剩余使用寿命估计交互数据,使用深度强化学习算法,对当前的剩余使用寿命估计策略深度学习模型进行更新,并增加迭代次数:i=i+1。判断i≥N?,若满足条件则终止训练,否则返回步骤4继续训练。本发明所采用的深度强化学习算法为Proximal Policy Optimization(PPO)算法。将由深度学习模型表示发动机控制策略记为π

其中L

其中

其中

有益效果:

通过将传统的航空发动机剩余使用寿命估计问题,建立对应的马尔可夫决策过程模型,可以使用深度强化学习来学习得最优的航空发动机剩余使用寿命估计策略。本发明所提供的方法避免了传统基于监督学习算法的航空发动机寿命估计算法中所存在的过拟合以及性能缺陷问题。同时本发明所提供的方法具有较强的泛化性,在实际使用过程中,可以提供更准确的剩余使用寿命估计精度。

附图说明

图1为航空发动机剩余使用寿命估计深度学习模型;

图2为航空发动机剩余使用寿命估计马尔可夫决策过程图;

图3为训练发动机传感器数据分布图;

图4为原始数据归一化效果图;

图5为测试发动机剩余使用寿命估计效果曲线。

具体实施例

本实施例采用航空发动机传感器状态监控数据,该数据由21个传感器收集而得,主要包括:风扇进口总温、低压压气机出口总温、高压压气机出口总温、低压涡轮出口总温、风扇进口压力、外涵道总压、高压压气机出口总压、风扇物理转速、核心机物理转速、发动机压比、高压压气机出口静压、耗油率与高压压气机出口静压之比、修正风扇转速、修正核心机转速、外涵比、燃烧室油气比、抽气焓、额定风扇转速、额定修正风扇转速、高压涡轮冷却气抽气量、低压涡轮冷却气抽气量。

发动机的原始传感器数据集分布如图3所示。在使用本发明所提供的基于深度强化学习的航空发动机剩余使用寿命估计方法之前,首先对原始传感器数据进行归一化处理。归一化处理公式定义如下:

其中x

将归一化处理后的数据随机编号,组成带编号的航空发动机剩余使用寿命历史数据库。基于该数据库,对传统的航空发动机剩余使用寿命估计过程,建立其对应的马尔可夫决策过程模型,该马尔可夫决策过程的交互如图2所示。初始化航空发动机寿命估计策略深度学习模型。每交互n步则使用PPO算法对当前的航空发动机寿命估计策略深度学习模型进行更新,记该策略模型为π

其中L

经过更新N步后,即可学习到最优的航空发动机寿命估计策略。为了评估所学的策略的剩余使用寿命表现效果,采用均方误差判据(Root mean squared error,RMSE),其定义如下:

其中T表示测试集的样本数,d

为了直观显示学得的剩余使用寿命估计策略的表现,本次实验挑选了四台测试发动机的传感器数据值,使用学得的剩余使用寿命估计策略对其进行估计。如图5所示,估计而得的剩余使用寿命与实际值非常吻合,而且精度较高。因此本发明所提供的方法可以提高剩余使用寿命估计的精度。

表1剩余使用寿命估计效果对比

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号