首页> 中国专利> 一种基于变量非线性自相关性剔除的动态过程监测方法

一种基于变量非线性自相关性剔除的动态过程监测方法

摘要

本发明公开一种基于变量非线性自相关性剔除的动态过程监测方法,旨在剔除采样数据各测量变量的非线性自相关性,并在此基础上建立非线性的动态过程监测模型。本发明方法首先利用核偏最小二乘算法建立各样本数据与其多个延时测量数据之间的非线性回归模型;然后,将模型误差作为新的被监测对象利用主成分分析算法建立过程监测模型,并实施故障监测。相比于传统方法,本发明方法将误差作为被监测对象不仅利用了误差具备的能够反映非线性自相关特征异常变化情况的能力,而且误差数据不再出现时间序列上的自相关性同样为后续基于PCA算法的过程监测模型的建立提供了便利。可以说,本发明方法更适合于动态过程监测。

著录项

  • 公开/公告号CN108803520A

    专利类型发明专利

  • 公开/公告日2018-11-13

    原文格式PDF

  • 申请/专利权人 宁波大学;

    申请/专利号CN201810658890.3

  • 发明设计人 宋励嘉;童楚东;俞海珍;

    申请日2018-06-11

  • 分类号G05B19/418(20060101);

  • 代理机构

  • 代理人

  • 地址 315211 浙江省宁波市江北区风华路818号信息学院521室

  • 入库时间 2023-06-19 07:12:32

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-16

    授权

    授权

  • 2018-12-07

    实质审查的生效 IPC(主分类):G05B19/418 申请日:20180611

    实质审查的生效

  • 2018-11-13

    公开

    公开

说明书

技术领域

本发明涉及一种数据驱动的过程监测方法,尤其涉及一种基于变量非线性自相关性剔除的动态过程监测方法。

背景技术

过程监测的目的在于及时而准确地发现故障,这对于保证安全生产与维持产品质量稳定是具有重要意义的。当前,过程监测的主流实施技术手段是数据驱动的方法,这主要得益于现代化工过程的大型化建设以及先进仪表与计算机技术的广泛应用,生产过程可以采集海量的数据。由于先进仪表技术的发展,采样时间间隔大为缩短,采样数据之间的时序自相关性是数据驱动的过程监测方法所必须考虑的一个问题。数据驱动的动态过程监测方法中最为典型的方法当属基于增广矩阵的动态主成分分析(Dynamic PrincipalComponent Analysis,DPCA)方法,其基本思想就是为各个训练样本数据引入延时测量值构成增广矩阵,然后对增广矩阵实施建模。使用增广矩阵可以同时将样本数据时序自相关性与变量之间的交叉相关性考虑进来,因此使用增广矩阵实施动态过程监测是最常见的技术手段。

此外,由于现代工业过程规模的复杂化,采样数据之间的自相关性使用线性模型进行描述已不再合适,理应使用非线性的自相关描述方式。近年来,核学习理论已经被广泛用于过程监测研究,比如核主成分分析(Kernel Principal Component Analysis,KPCA)与核偏最小二乘(Kernel Partial Least Squares,KPLS)等等。通过核函数的方式逼近训练数据之间的非线性关系,而不需要知道具体的非线性映射形式。虽然,可以直接的将增广矩阵应用于核主成分分析从而得到非线性动态过程监测方法,但是采用增广矩阵建立模型时通常是将自相关性与交叉相关性混淆在一起考虑。即使采用核学习这种非线性建模策略,所提取的主成分信息在采样时间上的自相关性却没有消除。在目前的科研文献与专利文件中,还鲜有考虑变量非线性自相关性问题的动态过程监测方法,如何消除这种非线性的自相关性特征急需进一步的深入研究。

发明内容

本发明所要解决的主要技术问题是:如何剔除采样数据各测量变量的非线性自相关性,并在此基础上建立非线性的动态过程监测模型。具体来讲,本发明方法首先利用非线性的KPLS算法建立各样本数据与其多个延时测量数据之间的回归模型;其次,由于回归模型的输出误差数据已不存在自相关性,可将其作为新的被监测对象利用主成分分析算法建立过程监测模型;最后,对剔除非线性自相关性特征后的在线监测样本实施过程监测。

本发明解决上述技术问题所采用的技术方案为:一种基于变量非线性自相关性剔除的动态过程监测方法,包括以下步骤:

(1)采集生产过程正常运行状态下的样本,按采样时间先后组成训练数据集X∈Rn×m,并对矩阵.X.中每列实施标准化处理,得到均值为0、标准差为1的新数据矩阵其中n为训练样本数,m为监测对象的测量变量数,R为实数集,Rn×m表示n×m维的实数矩阵。

(2)将矩阵中的后n-d个样本数据xd+1,xd+2,…,xn组成回归模型输出矩阵Y=[xd+1,xd+2,…,xn],回归模型的输入矩阵Z如下所示:

其中,d为延时测量数据的个数,上标号T表示矩阵或向量的转置。

(3)根据如下所示公式计算核矩阵K∈R(n-d)×(n-d)中的第i行第j列元素Kij

Kij=exp(-||zi-zj||2/δ)(2)

上式中,zi与zj分别为矩阵Z中的第i行与第j行,δ为核函数参数(若没有其他手段确定该参数取值,建议设置δ=5dm)。

(4)利用核偏最小二乘算法计算非线性回归模型的回归系数矩阵B,具体的实施过程如下所示:

①设置向量u为输出矩阵中的任意一列。

②依据公式计算得分向量t,其中并用公式t=t/||t||单位化得分向量t,I表示N×N维的单位矩阵、N=n-d、矩阵EN∈RN×N中所有元素都为1。

③依据公式计算向量c。

④依据公式计算向量u,并用公式u=u/||u||实施单位化处理。

⑤重复步骤②~④直至u收敛。

⑥依据公式分别更新矩阵

⑦返回步骤②,直至得到所有的r个向量u1,u2,…,ur及其对应的得分向量t1,t2,…,tr

⑧计算回归系数矩阵其中U=[u1,u2,…,ur]、T=[t1,t2,…,tr]、

值得注意的是,得分向量个数r的选取可以是人为给定,也可通过交叉验证法确定。

(5)依据公式计算剔除非线性自相关特征后的误差F∈RN×m

(6)对矩阵F中的每列实施标准化处理,得到均值为0、标准差为1的新数据矩阵

(7)利用主成分分析(Principal Component Analysis,PCA)算法为建立相应的PCA模型:其中S∈RN×k、P∈Rm×k、和E∈RN×m分别表示主成分矩阵、投影矩阵、和模型残差矩阵,具体的实施过程如下所示:

①计算的协方差矩阵

②求解C所有特征值γ1≥γ2≥…≥γm所对应的特征向量p1,p2…,pm

③设置保留的主成分个数k为满足如下所示条件的最小值,并将对应的k个特征向量组成载荷矩阵P=[p1,p2…,pk]。

④根据公式分别计算主成分矩阵S与模型残差矩阵E,那么相应的PCA模型为:

(8)根据如下所示公式计算监测统计指标D与Q的控制上限Dlim与Qlim

上式中,F(α,k,N-d-k)表示自由度为k与N-d-k的F分布在置信度α(一般取99%)下的取值、表示自由度为h=2a2/v的卡方分布在在置信度α下的取值、加权系数g=v/(2a)、a与v分别表示Q监测指标的估计均值与估计方差。

上述步骤(1)~(8)为本发明方法的离线建模阶段,如下所示步骤(9)~(15)为本发明方法的在线动态过程监测实施过程。

(9)收集最新采样时刻的数据样本xt∈Rm×1,并找出其延时测量数据xt-1,xt-2,…,xt-d,其中下标号t表示当前最新采样时刻。

(10)对xt,xt-1,…,xt-d分别实施与步骤(1)中相同的标准化处理得到

(11)根据如下所示公式计算核向量中的第i个元素

上式中,行向量

(12)根据公式计算中心化后的核向量其中向量Et∈R1×N中所有元素都为1。

(13)依据公式计算剔除非线性自相关特征后的误差f,并对f实施与步骤(6)中相同的标准化处理得到向量

(14)依据如下所示公式计算监测统计指标D与Q的具体数值:

上式中,矩阵Λ=STS/(N-1)。

(15)根据D与Q的具体数值以及步骤(8)中计算得到的上限Dlim与Qlim决策发生故障与否,即判断是否满足条件:D≤Dlim且Q≤Qlim?若是,则当前样本为正常工况采样,返回步骤(9)继续实施对下一个样本数据的监测;若否,则当前采样数据有可能来自故障工况。

与传统方法相比,本发明方法的优势在于:

首先,本发明方法利用基于核偏最小二乘的非线性回归模型剔除了测量变量中的非线性自相关特征的影响;其次,本发明方法将误差作为被监测对象,不仅利用了误差具备的能够反映非线性自相关特征异常变化情况的能力,而且误差数据不再出现时间序列上的自相关性同样为后续基于PCA算法的过程监测模型的建立提供了便利。可以说,本发明方法更适合于动态过程建模与监测。

附图说明

图1为本发明方法的实施流程图。

图2为监测对象测量变量的自相关性示意图。

图3为误差中自相关特征剔除示意图。

图4为TE过程物料C进口温度故障的监测详情对比图。

具体实施方式

下面结合附图与具体的实施案例对本发明方法进行详细的说明。

如图l所示,本发明公开一种基于变量非线性自相关性剔除的动态过程监测方法。下面结合一个具体的工业过程的例子来说明本发明方法的具体实施过程,以及相对于现有方法的优越性。

应用对象是来自于美国田纳西-伊斯曼(TE)化工过程实验,原型是伊斯曼化工生产车间的一个实际工艺流程。目前,TE过程因其流程的复杂性,已作为一个标准实验平台被广泛用于故障检测研究。整个TE过程包括22个测量变量、12个操作变量、和19个成分测量变量。该TE过程对象可以模拟仿真多种不同的故障类型,如物料进口温度阶跃变化、冷却水故障变化等等。为了对该过程进行监测,选取如表1所示的33个过程变量。由于采样间隔时间较短,TE过程采样数据不可避免的存在序列自相关性。而且,由于TE过程的复杂特性,采样数据间的非线性特征较明显,理应实施非线性建模。接下来结合该TE过程对本发明具体实施步骤进行详细的阐述。

表1:TE过程监测变量。

序号变量描述序号变量描述序号变量描述1物料A流量12分离器液位23D进料阀门位置2物料D流量13分离器压力24E进料阀门位置3物料E流量14分离器塔底流量25A进料阀门位置4总进料流量15汽提塔等级26A和C进料阀门位置5循环流量16汽提塔压力27压缩机循环阀门位置6反应器进料17汽提塔底部流量28排空阀门位置7反应器压力18汽提塔温度29分离器液相阀门位置8反应器等级19汽提塔上部蒸汽30汽提塔液相阀门位置9反应器温度20压缩机功率31汽提塔蒸汽阀门位置10排空速率21反应器冷却水出口温度32反应器冷凝水流量11分离器温度22分离器冷却水出口温度33冷凝器冷却水流量

首先,利用TE过程正常工况下的960个采样数据建立动态过程监测模型,包括以下步骤:

步骤(1):采集生产过程正常运行状态下的样本,按采样时间先后组成训练数据集X∈R960×33,并对矩阵X中每列实施标准化处理,得到均值为0、标准差为1的新数据矩阵..。

为验证训练数据中各测量变量的自相关性,特将前24个测量变量的自相关性示意图显示于图2中。从图2中可以发现,原测量变量存在较为明显的自相关性。因此,在建模的过程中需考虑自相关性特征。

步骤(2):将矩阵中的后n-d=958个样本数据x3,x4,…,x960组成回归模型输出矩阵Y=[x3,x4,…,x960],回归模型的输入矩阵Z如下所示:

步骤(3):根据公式(3)计算核矩阵K∈R958×958

步骤(4):利用核偏最小二乘算法计算非线性回归模型的回归系数矩阵B。

步骤(5):依据公式计算剔除非线性自相关特征后的误差F∈R958×33

步骤(6):对矩阵F中的每列实施标准化处理,得到均值为0、标准差为1的新数据矩阵

为验证误差中已经不再包含非线性自相关特征,特将误差矩阵中前24列向量对应的自相关示意图显示于图3中。从图3中可以发现,原训练数据的非线性自相关特征已经剔除,误差中不存在显著自相关性。

步骤(7):利用主成分分析(Principal Component Analysis,PCA)算法为建立相应的PCA模型:

步骤(8):根据公式(4)计算监测统计指标D与Q的控制上限Dlim与Qlim

其次,采集TE过程为TE过程物料C进口温度故障条件下的测试数据集,实施在线过程监测。值得指出的是,该测试数据集前160个样本数据采集自正常工况,故障工况从161个时刻起引入。

步骤(9):收集最新采样时刻的数据样本xt∈R33×1,并找出其延时测量数据xt-1,xt-2

步骤(10):对xt,xt-1,xt-2分别实施与步骤(1)中相同的标准化处理得到

步骤(11):根据公式(5)计算核向量

步骤(12):根据公式计算中心化后的核向量

步骤(13):依据公式计算剔除非线性自相关特征后的误差f,并对f实施与步骤(6)中相同的标准化处理得到向量

步骤(14):依据公式(6)计算监测统计指标D与Q的具体数值。

步骤(15):根据D与Q的具体数值以及步骤(8)中计算得到的上限Dlim与Qlim决策发生故障与否,即判断是否满足条件:D≤Dlim且Q≤Qlim?若是,则当前样本为正常工况采样,返回步骤(9)继续实施对下一个样本数据的监测;若否,则当前采样数据有可能来自故障工况。

最后,将本发明方法与传统DPCA方法的过程监测详情对比显示于图4中。从图4中可以发现,本发明方法对于该故障的监测效果要优越于传统DPCA方法,在故障发生后的故障漏报率显著低于传统DPCA方法的故障漏报率。

上述实施案例只用来解释说明本发明的具体实施,而不是对本发明进行限制。在本发明的精神和权利要求的保护范围内,对本发明做出的任何修改,都落入本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号