首页> 中国专利> 基于核主元分析的非线性工业过程故障检测方法

基于核主元分析的非线性工业过程故障检测方法

摘要

本发明提出一种基于核主元分析的非线性工业过程故障检测方法,对训练数据进行归一化处理后,建立KPCA模型,从训练数据中提取非线性特征作为核成分,并为每个核成分确定正常阈值,依据核主成分的个数划分核主成分空间PCS和核残差空间RCS,利用局部离群分析算法计算对应的局部离群值统计量LOFPCS和LOFRCS,并确定控制限;采集测试数据,利用KPCA模型提取对应的核主成分向量和核残差向量,利用核成分的正常阈值对其进行加权,计算加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h),并用控制限进行监控。该方法将核成分加权技术和局部离群因子技术引入到KPCA方法中,能够精确地衡量工业过程数据中的非线性特征信息,提高故障检测率。

著录项

  • 公开/公告号CN107544477A

    专利类型发明专利

  • 公开/公告日2018-01-05

    原文格式PDF

  • 申请/专利权人 中国石油大学(华东);

    申请/专利号CN201710991994.1

  • 发明设计人 邓晓刚;王磊;曹玉苹;孙雪莹;

    申请日2017-10-23

  • 分类号G05B23/02(20060101);

  • 代理机构青岛联信知识产权代理事务所(普通合伙);

  • 代理人张玲;梁春艳

  • 地址 266580 山东省青岛市黄岛区长江西路66号

  • 入库时间 2023-06-19 04:08:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-05-31

    授权

    授权

  • 2018-01-30

    实质审查的生效 IPC(主分类):G05B23/02 申请日:20171023

    实质审查的生效

  • 2018-01-05

    公开

    公开

说明书

技术领域

本发明属于工业过程故障检测技术领域,涉及非线性工业过程故障检测方法,具体地说,涉及一种基于核主元分析的非线性工业过程故障检测方法。

背景技术

现代工业过程日益趋于大型化、复杂化,故障检测与诊断技术已经成为保证工业过程安全性的重要技术。随着现代计算机测控系统的广泛应用,工业过程中采集并存储了丰富的过程运行数据。因此,基于数据驱动的故障检测与诊断技术逐渐成为研究热点。典型的基于数据驱动的故障检测与诊断方法包括主元分析(PCA)、独立元分析(ICA)、偏最小二乘(PLS)、Fisher判别分析(FDA)等。然而大多数的工业生产过程往往是非线性、非高斯的,上述提到的故障检测与诊断方法在适用场合上具有很大的局限性。因此,针对过程数据的非线性及非高斯特征,如何从测量数据中提取有用的特征信息以监控工业过程的运行状态是一种具有挑战性的研究课题。

近年来,核主元分析(KPCA)已成为非线性过程监控领域的代表性方法,该方法利用核函数映射处理非线性优化问题。Lee等首先提出了基于KPCA的非线性监控方法,其通过构造T2和SPE统计量进行故障检测。然而,在实际应用中,传统KPCA仍存在不足:一方面,上述T2和SPE两个统计量在计算过程中将各核成分等同看待,而实际上只有某些核成分能显著突出故障信息,因此,将各核成分等同看待无法有效地体现故障信息;另一方面,传统KPCA是基于核成分服从高斯分布的假设,然而实际工业过程数据分布复杂,无法保证核成分严格服从高斯分布,因此,传统的T2和SPE的控制限并不能满足实际过程监控的需求,进而影响故障检测的效果。

发明内容

本发明针对传统KPCA方法未考虑核成分权重信息且依赖于高斯分布假设的不足,提出一种基于核主元分析的非线性工业过程故障检测方法,该方法将核成分加权技术和局部离群因子技术引入到KPCA方法中,能够更加精确地衡量工业过程数据中的非线性特征信息,提高故障检测率,进而改善故障检测结果。

为了达到上述目的,本发明提供了一种基于核主元分析的非线性工业过程故障检测方法,包括以下步骤:

(一)收集历史数据库的正常操作工况数据作为训练数据Xo,并使用均值mean(Xo)和标准差std(Xo)对所述训练数据Xo进行归一化处理,得到归一化后的训练数据X;

(二)选择高斯核G(β,γ)作为核函数,将所述训练数据X映射到高维特征空间得到KPCA模型,利用所述KPCA模型提取所述训练数据X的非线性特征作为核成分,并为每个所述核成分确定正常阈值;

(三)确定核主成分的个数,将所述核成分划分为核主成分和核残差,得到所述训练数据X对应的核主成分向量和核残差向量,并将所述训练数据X的样本划分为核主成分空间PCS和核残差空间RCS;

(四)利用局部离群分析算法,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS,在核残差空间RCS中计算所述训练数据X对应的核残差向量的局部离群值统计量LOFRCS,并基于给定的置信水平α确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim

(五)采集测试数据xnew,利用步骤(一)获得的所述均值mean(Xo)和标准差std(Xo)对所述测试数据xnew进行归一化处理,得到归一化后的测试数据xt

(六)基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量和核残差向量;

(七)利用步骤(二)得到的所述正常阈值,对步骤(六)获得的测试数据xt对应的核主成分向量和核残差向量进行加权,通过局部离群分析算法计算对应的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h);

(八)依据所述加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)是否超出控制限LOFPCS,lim和LOFRCS,lim判断归一化后的测试数据xt是否是故障数据。

作为优选,所述步骤(一)中,利用所述均值mean(Xo)和标准差std(Xo)通过公式(1)对所述训练数据Xo进行归一化处理,公式(1)的表达式为:

X=(Xo-mean(Xo))/std(Xo)>

作为优选,所述步骤(二)中,选取的高斯核G(β,γ)的表达式为:

公式(2)中,G(β,γ)为高斯核函数;c为高斯核参数。

作为优选,所述步骤(二)中,提取所述训练数据X的非线性特征的具体步骤为:

对于归一化后的训练数据X=[x1,x2,…,xn]T,首先计算所述KPCA模型中的核矩阵K,所述核矩阵K中的每个元素k(i,j)的计算公式如下:

公式(3)中,n为所述训练数据X的样本数;c为高斯核参数;

通过公式(4)将所述核矩阵K归一化,公式(4)的表达式如下:

公式(4)中,为归一化后的核矩阵;K为核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;

对所述核矩阵K开展公式(5)中所示的特征值分解,公式(5)的表达式为:

求解公式(5)得到个非零特征值以及与之对应的特征向量

对于所述训练数据X中在第h个采样时刻的样本xh,通过公式(6)提取对应的非线性特征作为核成分,公式(6)的表达式为:

公式(6)中,ts(h)为训练数据X中第h个采样时刻的样本xh对应的第s个核成分;kx=[k(h,1),k(h,2),...,k(h,n)]T∈Rn,为核向量;αs为求解公式(5)获得的第s个特征向量;

通过公式(7)计算每个核成分ts(h)的正常阈值,公式(7)的表达式为:

公式(7)中,为训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值;tmax1(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值最大的核成分;tmax2(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值第二大的核成分。

作为优选,所述步骤(三)中,所述训练数据X对应的核主成分向量和核残差向量分别表示为:

公式(8)-(9)中,t(h)为训练数据X中第h个采样时刻的样本xh对应的核主成分向量;为训练数据X中第h个采样时刻的样本xh对应的核残差向量;p为核主成分的个数。

作为优选,所述步骤(四)中,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS的具体步骤为:

在核主成分空间PCS中,依据欧式距离为所述核主成分向量t(h)寻找L个邻居,通过公式(10)计算所述核主成分向量t(h)与它的局部邻居tl(h)的欧式距离D(t(h),tl(h)),公式(10)的表达式为:

D(t(h),tl(h))=||t(h)-tl(h)||2,1≤l≤L>

为所述核主成分向量t(h)的局部邻居tl(h)寻找L个邻居,通过公式(11)计算所述局部邻居tl(h)与它的第L个邻居tl,L(h)的欧式距离D(tl(h),tl,L(h)),公式(11)的表达式为:

D(tl(h),tl,L(h))=||tl(h)-tl,L(h)||2,1≤l≤L>

通过公式(12)计算所述核主成分向量t(h)和它的局部邻居tl(h)间的局部可达距离Rd(t(h),tl(h)),公式(12)的表达式为:

Rd(t(h),tl(h))=max{D(t(h),tl(h)),D(tl(h),tl,L(h))},1≤l≤L>

通过公式(13)计算所述核主成分向量t(h)的局部可达密度LRD(t(h)),公式(13)的表达式为:

通过公式(14)计算所述核主成分向量t(h)的局部离群值统计量LOFPCS,公式(14)的表达式为:

公式(14)中,LRD(tl(h))为核主成分向量t(h)的局部邻居tl(h)的局部可达密度;

同理,在核残差空间RCS中,通过公式(15)计算所述核残差向量的局部离群值统计量LOFRCS,公式(15)的表达式为:

公式(15)中,为核残差向量的局部可达密度;为核残差向量的局部邻居的局部可达密度;

所述步骤(四)中,基于给定的置信水平α,通过核密度估计方法确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim

作为优选,所述步骤(五)中,利用所述均值mean(Xo)和标准差std(Xo)通过公式(16)对所述测试数据xnew进行归一化处理,公式(16)的表达式为:

xt=(xnew-mean(X0))/std(X0)>

作为优选,所述步骤(六)中,基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量tt和核残差向量的具体步骤为:

计算归一化后的测试数据xt对应的测试核向量kt,kt中的每个元素kt(j)的计算公式如下:

公式(17)中,n为所述训练数据X的样本数;c为高斯核参数;

通过公式(18)将所述测试核向量kt归一化,公式(18)的表达式如下:

公式(18)中,为归一化后的测试核向量;K为所述训练数据X对应的核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;It=1/n[1,…,1]T∈Rn×1,Rn×1表示n×1维的矩阵;

对于所述测试数据xt中在第h个采样时刻的样本xt,h,通过公式(19)从归一化后的测试核向量中提取非线性特征,公式(19)的表达式如下:

公式(19)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为归一化后的测试核向量;αs为求解公式(5)获得的第s个特征向量;

所述测试数据xt对应的核主成分向量和核残差向量分别表示为:

公式(20)-(21)中,tt(h)为测试数据xt中第h个采样时刻的样本xt,h对应的核主成分向量;为测试数据xt中第h个采样时刻的样本xt,h对应的核残差向量;p为所述步骤(三)中确定的核主成分的个数。

作为优选,所述步骤(七)中,进行加权时,所述测试数据xt的核主成分向量tt(h)和核残差向量的权值分别为:

公式(22)-(23)中,W(h)为测试数据xt中第h个采样时刻的样本xt,h的核主成分向量tt(h)的权值;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值;p为所述步骤(三)中确定的核主成分的个数;为测试数据xt中第h个采样时刻的样本xt,h对应的每个非线性特征tt,s(h)的权值,采用公式(24)计算获得,公式(24)的表达式为:

公式(24)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为步骤(二)中计算得到的训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值;

所述步骤(七)中,计算所述测试数据xt对应的核主成分向量和核残差向量的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)的具体步骤为:

在核主成分空间PCS中,依据欧式距离为所述测试数据xt的核主成分向量tt(h)寻找L个邻居,通过公式(25)计算所述核主成分向量tt(h)与它的局部邻居的加权欧式距离公式(25)的表达式为:

为所述核主成分向量tt(h)的局部邻居寻找L个邻居,通过公式(26)计算所述局部邻居与它的第L个邻居的欧式距离公式(26)的表达式为:

通过公式(27)计算所述核主成分向量tt(h)和它的局部邻居间的加权局部可达距离公式(27)的表达式为:

通过公式(28)计算所述核主成分向量tt(h)的加权局部可达密度LRD(tt(h)W(h)),公式(28)的表达式为:

通过公式(29)计算所述核主成分向量tt(h)的加权局部离群值统计量WLOFPCS(h),公式(29)的表达式为:

公式(29)中,为核主成分向量tt(h)的局部邻居的局部可达密度;

同理,在核残差空间RCS中,通过公式(30)计算所述核残差向量的加权局部离群值统计量WLOFRCS(h),公式(30)的表达式为:

公式(30)中,为核残差向量的加权局部可达密度;为核残差向量的局部邻居的局部可达密度;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值。

作为优选,所述步骤(八)中,当WLOFPCS(h)≤LOFPCS,lim或WLOFRCS(h)≤LOFRCS,lim时,认为过程处于正常工况状态;否则,认为过程中出现了故障。

与现有技术相比,本发明的优点和积极效果在于:

本发明提供的基于核主元分析的非线性工业过程故障检测方法,其采用的监控统计量基于局部离群因子LOF,能有效克服传统核主元分析方法仅适用于高斯分布的缺陷。进一步,本发明中,对能体现故障信息的核成分赋以较大权值,从而使得最终的加权局部离群值统计量WLOF能更为明显的反映过程中的故障信息,进而改善故障检测结果,提高故障检测率。

附图说明

图1为本发明实施例所提供的基于核主元分析的非线性工业过程故障检测方法的流程框图;

图2(a)-(c)为本发明实施例一所提供的对非线性数值系统的故障监控结果示意图,其中,图2(a)采用的是KPCA方法,图2(b)采用的是LOF-KPCA方法,图2(c)采用的是本发明提供的WLOF-KPCA方法;

图3为本发明实施例二所提供的田纳西-伊斯曼(TE)过程的结构图;

图4为本发明实施例二所提供的对田纳西-伊斯曼(TE)过程中故障5的监控结果示意图,其中,图4(a)采用的是KPCA方法,图4(b)采用的是LOF-KPCA方法,图4(c)采用的是本发明提供的WLOF-KPCA方法;

图5为本发明实施例二所提供的对田纳西-伊斯曼(TE)过程中故障10的监控结果示意图,其中,图5(a)采用的是KPCA方法,图5(b)采用的是LOF-KPCA方法,图5(c)采用的是本发明提供的WLOF-KPCA方法。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1,本发明实施例提供了一种基于核主元分析的非线性工业过程故障检测方法,包括以下步骤:

(一)收集历史数据库的正常操作工况数据作为训练数据Xo,并使用均值mean(Xo)和标准差std(Xo)对所述训练数据Xo进行归一化处理,得到归一化后的训练数据X;

(二)选择高斯核G(β,γ)作为核函数,将所述训练数据X映射到高维特征空间得到KPCA模型,利用所述KPCA模型提取所述训练数据X的非线性特征作为核成分,并为每个所述核成分确定正常阈值;

(三)确定核主成分的个数,将所述核成分划分为核主成分和核残差,得到所述训练数据X对应的核主成分向量和核残差向量,并将所述训练数据X的样本划分为核主成分空间PCS和核残差空间RCS;

(四)利用局部离群分析算法,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS,在核残差空间RCS中计算所述训练数据X对应的核残差向量的局部离群值统计量LOFRCS,并基于给定的置信水平α确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim

(五)采集测试数据xnew,利用步骤(一)获得的所述均值mean(Xo)和标准差std(Xo)对所述测试数据xnew进行归一化处理,得到归一化后的测试数据xt

(六)基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量和核残差向量;

(七)利用步骤(二)得到的所述正常阈值,对步骤(六)获得的测试数据xt对应的核主成分向量和核残差向量进行加权,通过局部离群分析算法计算对应的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h);

(八)依据所述加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)是否超出控制限LOFPCS,lim和LOFRCS,lim判断归一化后的测试数据xt是否是故障数据。

上述方法中,步骤(一)至(四)为离线建模阶段,步骤(五)至(八)为在线监控阶段。需要说明的是,本发明在线监控阶段依然采用离线建模阶段的正常数据训练集所求的控制限的依据为:在线监控阶段计算加权局部离群值统计量是在连续两个采样时刻某核成分超出其正常范围时实际实施的,而步骤(二)中为每个所述核成分确定的正常阈值相对来说较为宽泛,因此在工程意义下,在线监控时对于正常样本依然不会出现远超置信度范围的误报率。

实施例一:以非线性数值系统为例进行说明。仿真一个具有六个监控变量[x1,x2,x3,x4,x5,x6]的非线性数值系统,其数学描述如下:

x1=r1+e1>

x2=r2+e2

x3=2r1+3r2+e3

x4=5r1-2r2+e4

x5=r12-3r2+e5

x6=-r13+3r22+e6

公式(31)中,e1,e2,e3,e4,e5,e6∈N(0,0.01)表示六个相互独立的高斯噪声变量,r1,r2∈[0,2]是独立的均匀分布随机变量,系统的输出[x1,x2,x3,x4,x5,x6]作为过程监控变量。在公式(31)所示的正常操作工况下仿真400个样本作为用于建模的训练数据。为了产生故障数据,在仿真过程的第201个时刻对变量x6添加幅值为8的正弦波动,并使故障一直持续到第400个时刻仿真结束为止。

对上述非线性数值系统的故障进行检测,含有以下步骤:

(一)收集正常操作工况数据作为训练数据Xo,并使用均值mean(Xo)和标准差std(Xo)通过公式(1)对所述训练数据Xo进行归一化处理,得到归一化后的训练数据X,公式(1)的表达式为:

X=(Xo-mean(Xo))/std(Xo)>

(二)对于归一化后的训练数据X=[x1,x2,…,xn]T,首先计算所述KPCA模型中的核矩阵K,所述核矩阵K中的每个元素k(i,j)的计算公式如下:

公式(3)中,n为所述训练数据X的样本数;c为高斯核参数;

通过公式(4)将所述核矩阵K归一化,公式(4)的表达式如下:

公式(4)中,为归一化后的核矩阵;K为核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;

对所述核矩阵K开展公式(5)中所示的特征值分解,公式(5)的表达式为:

求解公式(5)得到个非零特征值以及与之对应的特征向量

对于所述训练数据X中在第h个采样时刻的样本xh,通过公式(6)提取对应的非线性特征作为核成分,公式(6)的表达式为:

公式(6)中,ts(h)为训练数据X中第h个采样时刻的样本xh对应的第s个核成分;kx=[k(h,1),k(h,2),...,k(h,n)]T∈Rn,为核向量;αs为求解公式(5)获得的第s个特征向量;

通过公式(7)计算每个核成分ts(h)的正常阈值,公式(7)的表达式为:

公式(7)中,为训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值;tmax1(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值最大的核成分;tmax2(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值第二大的核成分。

(三)确定核主成分的个数,将所述核成分划分为核主成分和核残差,得到所述训练数据X对应的核主成分向量和核残差向量,并将所述训练数据X的样本划分为核主成分空间PCS和核残差空间RCS;所述训练数据X对应的核主成分向量和核残差向量分别表示为:

公式(8)-(9)中,t(h)为训练数据X中第h个采样时刻的样本xh对应的核主成分向量;为训练数据X中第h个采样时刻的样本xh对应的核残差向量;p为核主成分的个数。

(四)利用局部离群分析算法,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS,在核残差空间RCS中计算所述训练数据X对应的核残差向量的局部离群值统计量LOFRCS,具体步骤如下:

在核主成分空间PCS中,依据欧式距离为所述核主成分向量t(h)寻找L个邻居,通过公式(10)计算所述核主成分向量t(h)与它的局部邻居tl(h)的欧式距离D(t(h),tl(h)),公式(10)的表达式为:

D(t(h),tl(h))=||t(h)-tl(h)||2,1≤l≤L>

为所述核主成分向量t(h)的局部邻居tl(h)寻找L个邻居,通过公式(11)计算所述局部邻居tl(h)与它的第L个邻居tl,L(h)的欧式距离D(tl(h),tl,L(h)),公式(11)的表达式为:

D(tl(h),tl,L(h))=||tl(h)-tl,L(h)||2,1≤l≤L>

通过公式(12)计算所述核主成分向量t(h)和它的局部邻居tl(h)间的局部可达距离Rd(t(h),tl(h)),公式(12)的表达式为:

Rd(t(h),tl(h))=max{D(t(h),tl(h)),D(tl(h),tl,L(h))},1≤l≤L>

通过公式(13)计算所述核主成分向量t(h)的局部可达密度LRD(t(h)),公式(13)的表达式为:

通过公式(14)计算所述核主成分向量t(h)的局部离群值统计量LOFPCS,公式(14)的表达式为:

公式(14)中,LRD(tl(h))为核主成分向量t(h)的局部邻居tl(h)的局部可达密度;

同理,在核残差空间RCS中,通过公式(15)计算所述核残差向量的局部离群值统计量LOFRCS,公式(15)的表达式为:

公式(15)中,为核残差向量的局部可达密度;为核残差向量的局部邻居的局部可达密度;

基于给定的置信水平α,通过核密度估计方法确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim

(五)采集测试数据xnew,利用步骤(一)获得的所述均值mean(Xo)和标准差std(Xo)通过公式(16)对所述测试数据xnew进行归一化处理,得到归一化后的测试数据xt,公式(16)的表达式为:

xt=(xnew-mean(X0))/std(X0)>

(六)基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量和核残差向量,具体步骤为:

计算归一化后的测试数据xt对应的测试核向量kt,kt中的每个元素kt(j)的计算公式如下:

公式(17)中,n为所述训练数据X的样本数;c为高斯核参数;

通过公式(18)将所述测试核向量kt归一化,公式(18)的表达式如下:

公式(18)中,为归一化后的测试核向量;K为所述训练数据X对应的核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;It=1/n[1,…,1]T∈Rn×1,Rn×1表示n×1维的矩阵;

对于所述测试数据xt中在第h个采样时刻的样本xt,h,通过公式(19)从归一化后的测试核向量中提取非线性特征,公式(19)的表达式如下:

公式(19)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为归一化后的测试核向量;αs为求解公式(5)获得的第s个特征向量;

所述测试数据xt对应的核主成分向量和核残差向量分别表示为:

公式(20)-(21)中,tt(h)为测试数据xt中第h个采样时刻的样本xt,h对应的核主成分向量;为测试数据xt中第h个采样时刻的样本xt,h对应的核残差向量;p为所述步骤(三)中确定的核主成分的个数。

(七)利用步骤(二)得到的所述正常阈值,对步骤(六)获得的测试数据xt对应的核主成分向量和核残差向量进行加权,其中,进行加权时,所述测试数据xt的核主成分向量tt(h)和核残差向量的权值分别为:

公式(22)-(23)中,W(h)为测试数据xt中第h个采样时刻的样本xt,h的核主成分向量tt(h)的权值;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值;p为所述步骤(三)中确定的核主成分的个数;为测试数据xt中第h个采样时刻的样本xt,h对应的每个非线性特征tt,s(h)的权值,采用公式(24)计算获得,公式(24)的表达式为:

公式(24)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为步骤(二)中计算得到的训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值。

通过局部离群分析算法计算对应的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h),具体步骤为:

在核主成分空间PCS中,依据欧式距离为所述测试数据xt的核主成分向量tt(h)寻找L个邻居,通过公式(25)计算所述核主成分向量tt(h)与它的局部邻居的加权欧式距离公式(25)的表达式为:

为所述核主成分向量tt(h)的局部邻居寻找L个邻居,通过公式(26)计算所述局部邻居与它的第L个邻居的欧式距离公式(26)的表达式为:

通过公式(27)计算所述核主成分向量tt(h)和它的局部邻居间的加权局部可达距离公式(27)的表达式为:

通过公式(28)计算所述核主成分向量tt(h)的加权局部可达密度LRD(tt(h)W(h)),公式(28)的表达式为:

通过公式(29)计算所述核主成分向量tt(h)的加权局部离群值统计量WLOFPCS(h),公式(29)的表达式为:

公式(29)中,为核主成分向量tt(h)的局部邻居的局部可达密度;

同理,在核残差空间RCS中,通过公式(30)计算所述核残差向量的加权局部离群值统计量WLOFRCS(h),公式(30)的表达式为:

公式(30)中,为核残差向量的加权局部可达密度;为核残差向量的局部邻居的局部可达密度;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值。

(八)依据所述加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)是否超出控制限LOFPCS,lim和LOFRCS,lim判断归一化后的测试数据xt是否是故障数据,具体判断标准为:当WLOFPCS(h)≤LOFPCS,lim或WLOFRCS(h)≤LOFRCS,lim时,认为过程处于正常工况状态;否则,认为过程中出现了故障。

检测到故障发生后,为了评价不同检测方法的故障检测效果,通过故障漏报率(MDR)指标进行不同方法的故障检测效果对比。故障漏报率(MDR)定义为未被检测出的故障数据与实际总的故障数据之比。很显然,MDR的数值越小,意味着过程监控方法的故障检测效果越好;反之,过程监控方法的故障检测效果越差。

在本实施例的非线性数值系统仿真中,本发明采用基于加权局部离群因子的核主元分析(WLOF-KPCA)方法,其中,步骤(二)中,高斯核G(β,γ)的高斯核参数c选为5m,其中m是变量个数;高维特征空间维数为特征值的累加和超过总体特征值和99.99%的个数,在本实施例中,高维特征空间维数具体为18。步骤(三)中,核主成分的个数p通过特征值的累加和贡献率和平均特征值方法求得,最终核主成分的个数p确定为两种方法结果的平均值,在本实施例中,核主成分的个数p具体为4。步骤(四)中,计算局部离群值统计量LOFPCS和LOFRCS中的邻域参数L确定为15,确定控制限LOFPCS,lim和LOFRCS,lim时的置信水平α为99%。

采用传统核主元分析法(KPCA)和基于局部离群因子的核主元分析法(LOF-KPCA)与本发明的方法进行对比,三种方法的故障漏报率(MDR)的比较结果参见表1。

表1 KPCA、LOF-KPCA和WLOF-KPCA三种方法的故障漏报率结果

图2(a)-(c)分别给出了KPCA、LOF-KPCA和WLOF-KPCA三种方法对故障的监控结果。从图2(a)中可以看出,传统KPCA方法的T2统计量很难检出故障而SPE统计量的监控结果也不理想,两者的故障漏报率分别为0.98和0.82。根据图2(b)、图2(c)以及表1,可以看出,与KPCA方法相比,基于LOF统计量的LOF-KPCA方法和WLOF-KPCA方法获得了更好的监控效果。具体来说,对于在核主成分空间PCS的监控结果,两个统计量LOFPCS和WLOFPCS拥有同样的故障检测结果,故障漏报率均为0.815。对于在核残差空间RCS的监控结果,由图2(b)可见,LOFRCS统计量能够在第252个时刻检出故障,故障漏报率降为0.395;然而,由图2(c)可见,通过加入对不同核成分的权值处理,WLOFRCS统计量能够在第205个时刻给出故障报警信号,其故障漏报率进一步降低为0.135。由此可见,本发明提供的WLOF-KPCA方法提供了最佳的故障检测性能。

实施实例二:田纳西-伊斯曼(TE)过程是由美国伊斯曼化学公司的Downs和Vogel根据一个实际的化工过程建立的实验平台,现被广泛用于验证控制算法和过程监控方法的优劣。TE过程主要由五个单元组成,包括反应器、产品冷凝器、气液分离器、循环压缩机和汽提塔组成,其结构图如图3所示。TE过程共53个变量,其中包括22个连续测量变量、19个成分变量和12个操作变量,本实施例采用TE过程中的33个变量,具体如表2所示。本实施例中采用的21个故障如表3所示,用来验证各方法的监控性能。

表2本实施例采用的TE过程的33个变量

变量标号变量描述变量标号变量描述1A进料(流1)18汽提器温度2D进料(流2)19汽提器流量3E进料(流3)20压缩机功率4A和C进料(流4)21反应器冷却水出口温度5再循环流量(流8)22分离器冷却水出口温度6反应器进料速度(流6)23D进料量(流2)7反应器压力24E进料量(流3)8反应器等级25A进料量(流1)9反应器温度26A和C料量(流4)10放空速率27压缩机再循环阀11产品分离器温度28放空阀12产品分离器液位29分离器罐液流量(流10)13产品分离器压力30汽提器液体产品流量(流11)14产品分离器塔底流量(流10)31汽提器水流阀15汽提器等级32反应器冷水流量16汽提器压力33冷凝器冷水流量17汽提器塔底流量(流11)

表3本实施例采用的21个故障

针对上述TE过程的故障进行检索,含有以下步骤:

(一)收集正常操作工况数据作为训练数据Xo,并使用均值mean(Xo)和标准差std(Xo)通过公式(1)对所述训练数据Xo进行归一化处理,得到归一化后的训练数据X,公式(1)的表达式为:

X=(Xo-mean(Xo))/std(Xo)>

(二)对于归一化后的训练数据X=[x1,x2,…,xn]T,首先计算所述KPCA模型中的核矩阵K,所述核矩阵K中的每个元素k(i,j)的计算公式如下:

公式(3)中,n为所述训练数据X的样本数;c为高斯核参数;

通过公式(4)将所述核矩阵K归一化,公式(4)的表达式如下:

公式(4)中,为归一化后的核矩阵;K为核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;

对所述核矩阵K开展公式(5)中所示的特征值分解,公式(5)的表达式为:

求解公式(5)得到个非零特征值以及与之对应的特征向量

对于所述训练数据X中在第h个采样时刻的样本xh,通过公式(6)提取对应的非线性特征作为核成分,公式(6)的表达式为:

公式(6)中,ts(h)为训练数据X中第h个采样时刻的样本xh对应的第s个核成分;kx=[k(h,1),k(h,2),...,k(h,n)]T∈Rn,为核向量;αs为求解公式(5)获得的第s个特征向量;

通过公式(7)计算每个核成分ts(h)的正常阈值,公式(7)的表达式为:

公式(7)中,为训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值;tmax1(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值最大的核成分;tmax2(h)为训练数据X中第h个采样时刻的样本xh对应的全部核成分中绝对值第二大的核成分。

(三)确定核主成分的个数,将所述核成分划分为核主成分和核残差,得到所述训练数据X对应的核主成分向量和核残差向量,并将所述训练数据X的样本划分为核主成分空间PCS和核残差空间RCS;所述训练数据X对应的核主成分向量和核残差向量分别表示为:

公式(8)-(9)中,t(h)为训练数据X中第h个采样时刻的样本xh对应的核主成分向量;为训练数据X中第h个采样时刻的样本xh对应的核残差向量;p为核主成分的个数。

(四)利用局部离群分析算法,在核主成分空间PCS中计算所述训练数据X对应的核主成分向量的局部离群值统计量LOFPCS,在核残差空间RCS中计算所述训练数据X对应的核残差向量的局部离群值统计量LOFRCS,具体步骤如下:

在核主成分空间PCS中,依据欧式距离为所述核主成分向量t(h)寻找L个邻居,通过公式(10)计算所述核主成分向量t(h)与它的局部邻居tl(h)的欧式距离D(t(h),tl(h)),公式(10)的表达式为:

D(t(h),tl(h))=||t(h)-tl(h)||2,1≤l≤L>

为所述核主成分向量t(h)的局部邻居tl(h)寻找L个邻居,通过公式(11)计算所述局部邻居tl(h)与它的第L个邻居tl,L(h)的欧式距离D(tl(h),tl,L(h)),公式(11)的表达式为:

D(tl(h),tl,L(h))=||tl(h)-tl,L(h)||2,1≤l≤L>

通过公式(12)计算所述核主成分向量t(h)和它的局部邻居tl(h)间的局部可达距离Rd(t(h),tl(h)),公式(12)的表达式为:

Rd(t(h),tl(h))=max{D(t(h),tl(h)),D(tl(h),tl,L(h))},1≤l≤L>

通过公式(13)计算所述核主成分向量t(h)的局部可达密度LRD(t(h)),公式(13)的表达式为:

通过公式(14)计算所述核主成分向量t(h)的局部离群值统计量LOFPCS,公式(14)的表达式为:

公式(14)中,LRD(tl(h))为核主成分向量t(h)的局部邻居tl(h)的局部可达密度;

同理,在核残差空间RCS中,通过公式(15)计算所述核残差向量的局部离群值统计量LOFRCS,公式(15)的表达式为:

公式(15)中,为核残差向量的局部可达密度;为核残差向量的局部邻居的局部可达密度;

基于给定的置信水平α,通过核密度估计方法确定所述局部离群值统计量LOFPCS和LOFRCS的控制限LOFPCS,lim和LOFRCS,lim

(五)采集测试数据xnew,利用步骤(一)获得的所述均值mean(Xo)和标准差std(Xo)通过公式(16)对所述测试数据xnew进行归一化处理,得到归一化后的测试数据xt,公式(16)的表达式为:

xt=(xnew-mean(X0))/std(X0)>

(六)基于步骤(二)得到的所述KPCA模型,提取所述测试数据xt对应的核主成分向量和核残差向量,具体步骤为:

计算归一化后的测试数据xt对应的测试核向量kt,kt中的每个元素kt(j)的计算公式如下:

公式(17)中,n为所述训练数据X的样本数;c为高斯核参数;

通过公式(18)将所述测试核向量kt归一化,公式(18)的表达式如下:

公式(18)中,为归一化后的测试核向量;K为所述训练数据X对应的核矩阵;IK为n×n维的矩阵,其每一个元素都为1/n;It=1/n[1,…,1]T∈Rn×1,Rn×1表示n×1维的矩阵;

对于所述测试数据xt中在第h个采样时刻的样本xt,h,通过公式(19)从归一化后的测试核向量中提取非线性特征,公式(19)的表达式如下:

公式(19)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为归一化后的测试核向量;αs为求解公式(5)获得的第s个特征向量;

所述测试数据xt对应的核主成分向量和核残差向量分别表示为:

公式(20)-(21)中,tt(h)为测试数据xt中第h个采样时刻的样本xt,h对应的核主成分向量;为测试数据xt中第h个采样时刻的样本xt,h对应的核残差向量;p为所述步骤(三)中确定的核主成分的个数。

(七)利用步骤(二)得到的所述正常阈值,对步骤(六)获得的测试数据xt对应的核主成分向量和核残差向量进行加权,其中,进行加权时,所述测试数据xt的核主成分向量tt(h)和核残差向量的权值分别为:

公式(22)-(23)中,W(h)为测试数据xt中第h个采样时刻的样本xt,h的核主成分向量tt(h)的权值;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值;p为所述步骤(三)中确定的核主成分的个数;为测试数据xt中第h个采样时刻的样本xt,h对应的每个非线性特征tt,s(h)的权值,采用公式(24)计算获得,公式(24)的表达式为:

公式(24)中,tt,s(h)为测试数据xt中第h个采样时刻的样本xt,h对应的第s个非线性特征;为步骤(二)中计算得到的训练数据X中第h个采样时刻的样本xh对应的第s个核成分的正常阀值。

通过局部离群分析算法计算对应的加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h),具体步骤为:

在核主成分空间PCS中,依据欧式距离为所述测试数据xt的核主成分向量tt(h)寻找L个邻居,通过公式(25)计算所述核主成分向量tt(h)与它的局部邻居的加权欧式距离公式(25)的表达式为:

为所述核主成分向量tt(h)的局部邻居寻找L个邻居,通过公式(26)计算所述局部邻居与它的第L个邻居的欧式距离公式(26)的表达式为:

通过公式(27)计算所述核主成分向量tt(h)和它的局部邻居间的加权局部可达距离公式(27)的表达式为:

通过公式(28)计算所述核主成分向量tt(h)的加权局部可达密度LRD(tt(h)W(h)),公式(28)的表达式为:

通过公式(29)计算所述核主成分向量tt(h)的加权局部离群值统计量WLOFPCS(h),公式(29)的表达式为:

公式(29)中,为核主成分向量tt(h)的局部邻居的局部可达密度;

同理,在核残差空间RCS中,通过公式(30)计算所述核残差向量的加权局部离群值统计量WLOFRCS(h),公式(30)的表达式为:

公式(30)中,为核残差向量的加权局部可达密度;为核残差向量的局部邻居的局部可达密度;为测试数据xt中第h个采样时刻的样本xt,h的核残差向量的权值。

(八)依据所述加权局部离群值统计量WLOFPCS(h)和WLOFRCS(h)是否超出控制限LOFPCS,lim和LOFRCS,lim判断归一化后的测试数据xt是否是故障数据,具体判断标准为:当WLOFPCS(h)≤LOFPCS,lim或WLOFRCS(h)≤LOFRCS,lim时,认为过程处于正常工况状态;否则,认为过程中出现了故障。

在本实施例中,步骤(二)中,高斯核G(β,γ)的高斯核参数c选为500m,其中m是变量个数;其余步骤中的参数设置同实施例一。

采用传统核主元分析法(KPCA)和基于局部离群因子的核主元分析法(LOF-KPCA)与本发明的方法进行对比,以故障5和故障10为例说明故障检测效果。

故障5由冷凝器冷却水进料温度产生的阶跃变化引起。图4(a)-(c)分别给出了KPCA、LOF-KPCA和WLOF-KPCA三种方法对故障5的监控结果。根据图4(a)可以看出,传统KPCA方法的T2统计量和SPE统计量均在第161个时刻检出故障,然而两个统计量在第350个时刻后又处于控制限以下,这会给现场工程师提供错误的信号。与之相比,虽然图4(b)中LOFPCS统计量没有太明显的改善,但是LOFPCS统计量能够成功检出该故障并一直持续到末尾时刻。同样的,WLOF-KPCA方法的两个统计量亦能成功给出持续的故障信号,尤其是WLOFRCS统计量,报警信号非常明显。

故障10是由进料C的温度(流4)产生随机波动引起的。图5(a)-(c)分别给出了KPCA、LOF-KPCA和WLOF-KPCA三种方法对故障10的监控结果。根据图5(a)可以看出,传统KPCA方法的SPE统计量在第192个时刻检出故障,然而大量样本点被认为处于正常状态。两个统计量T2和SPE的故障漏报率分别为0.66和0.371,监控效果较差。作为对比,图5(b)中LOF-KPCA方法的LOFRCS统计量在第185个时刻检出故障,并且两个统计量LOFPCS和LOFRCS的故障漏报率分别降为0.619和0.169,监控性能有了明显提高。由图5(c)可见,通过对不同核成分进行加权,WLOF-KCPA方法获得了更优秀的监控效果,两个统计量WLOFPCS和WLOFRCS的故障漏报率进一步降低为0.56和0.135。因此,本发明所提的WLOF-KPCA能够改善对TE过程故障10的故障检测性能。

表4给出了KPCA、LOF-KPCA和WLOF-KPCA三种方法对于TE过程21种故障的故障漏报率。从表4可以看出,传统KPCA方法对于故障5、10、16、19、20和21不能给不满意的监控效果。通过结合LOF技术的LOF-KPCA方法对于这六种故障能获得明显的改善。本发明提供的基于核主元分析的非线性工业过程故障检测方法,在结合LOF技术的基础上,进一步地对不同核成分加权以突出故障信息,能进一步改善监控性能。综合以上分析,本发明提供这种基于加权局部离群因子的核主元分析(WLOF-KPCA)的非线性工业过程故障检测方法,其故障检测效果明显优于KPCA方法和LOF-KPCA方法。

表4 KPCA、LOF-KPCA和WLOF-KPCA对TE过程故障的故障漏报率

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号