基于动态高效潜结构投影的质量相关故障检测

2022-01-24 14:19孔祥玉王晓兵罗家宇杨治艳
控制理论与应用 2021年12期
关键词:动态矩阵变量

孔祥玉,王晓兵,罗家宇,杨治艳

(火箭军工程大学导弹工程学院,陕西西安 710025)

1 引言

近年来,随着现代工业流程如化工、制药、发电以及复杂装备系统等逐渐向大型化和复杂化的趋势发展,使得基于传统物理模型的过程监控方法难以适应现代大型工业过程以及复杂装备测试的需求;同时伴随着现代先进传感器和物联网技术的不断提高,采集到的过程数据也越来越复杂.因此基于数据驱动的建模方法得到了广泛关注并成功应用于多种复杂工业过程及装备测试监控中[1-4].其中主成分分析(principal component analysis,PCA)[5]、规范变量分析(canonical variable analysis,CVA)[6]、独立成分分析(independent component analysis,ICA)[7],偏最小二乘(partial least squares,PLS)[8-9]等是多元统计过程监控的代表性方法,它们能够有效地处理高维度且相互耦合的数据.

在多元统计过程监控领域,PLS利用质量变量与过程变量的相关性在数据建模中引导过程变量的投影分解,所引导的投影空间能够反应过程变量与质量变量相关的变化.因此,PLS算法在质量相关故障检测中具有明显的优势.然而标准PLS算法在迭代建模的过程中存在两个缺点[10]:1)PLS提取潜变量的原则是基于X和Y协方差最大,并未完全按照X的特征信息大小降序提取,导致残差子空间存在较大变异;2)由于对输入X采用斜交分解,导致X的主元子空间中含有与输出Y正交的信息,这些信息对预测无用.针对PLS算法的缺点1,Zhou等[10]提出了全潜结构投影(total projection to latent structures,TPLS)算法,将主元空间和残差空间进一步分为4个子空间.针对TPLS存在多空间分解问题,Qin等[11]提出了并行潜结构投影(concurrent projection to latent structures,CPLS)算法,该算法将输入数据空间简洁的分解为输入相关和输出相关的部分.针对缺点2,Yin等[12]提出改进的潜结构投影(modified projection to latent structures,MPLS)算法,采用奇异值分解(singular value decomposition,SVD)构造正交投影算子,将X正交投影到质量相关子空间和质量无关子空间.Peng等[13]针对MPLS在推导中协方差的逆矩阵可能导致X与Y相关信息丢失的问题,提出了将MPLS中的残差空间进一步主元分析的高效潜结构投影(efficient projection to latent structures,EPLS)算法.

上述方法都只考虑了质量变量和过程变量之间的静态关系,然而复杂工业及装备系统通常具有随时间变化的动态特性.对于这一特征,目前有子空间辨识思想的CVA[6]、描述非平稳变量间关系的协整分析(cointegration analysis,CA)[14]、建立自回归状态挖掘过程动态特征的动态因变量模型(dynamic latent variable,DLV)[15]、通过静态和动态信息联合分析提取数据动静态特征的慢特征分析(slow feature analysis,SFA)[16]以及时序拓展[17]等多种分析方法用于动态系统的故障检测.其中时序拓展的思想是利用历史时间序列拟合的数学模型提取各变量之间的互相关及过程的自相关关系,可以描述系统的动态特征.基于时序拓展的思想,Lee等[18]在2003年最先提出动态偏最小二乘方法(dynamic PLS,D-PLS)用于质量相关故障检测.Li等[19]提出一种内外模型一致的动态PLS算法用于动态过程建模,并扩展到动态TPLS(dynamic inner TPLS,Di-TPLS)算法用于故障检测,针对MPLS算法对质量相关故障检测时存在的静态模型问题,Jiao等[20]提出了一种动态MPLS(dynamic MPLS,D-MPLS)质量相关故障检测算法,Kong等[21]利用时滞过程数据与时延质量数据之间的关系,建立了在线监控动态潜结构投影(online monitoring dynamic projection to latent structures,OMD-PLS)模型,并在此基础上提出在线监控并行动态潜结构投影(online monitoring dynamic concurrent projection to latent structures,OMDC-PLS)模型,实现微小故障的检测.

基于时序拓展的思想已经被应用于多种质量相关故障检测算法中,但所拓展的动态算法仍存在静态模型本身同样的不足.例如D-PLS对输入X仍采用斜交分解,导致X的主元子空间中含有与输出Y正交的信息,这些信息对预测无用;D-MPLS采用正交分解,但求解系数过程中仍存在广义逆,这将导致信息丢失影响质量相关故障的检测性能.静态EPLS算法的提出在质量相关故障检测时具有空间分解清晰且高效的优势,保证了模型信息的完备性.但EPLS算法在建模过程没有考虑实际过程中存在动态特性,忽略了样本数据受到历史数据的影响,导致所建立的模型对于动态过程并不适用,从而降低了模型精度和质量相关故障的检测性能,因此有必要对该模型进行动态扩展.

通常工业过程中当前时刻的样本值受历史采样样本的影响,自回归移动平均(auto-regressive moving average exogenous,ARMAX)模型是通过历史样本值对当前样本值进行预测的模型,所以该模型能够反映工业过程的动态特征.基于此模型思想,在EPLS算法的基础上,本文提出一种基于ARMAX模型的动态高效潜结构投影(dynamic efficient projection to latent structures,D-EPLS)的质量相关故障检测方法.该方法首先采用ARMAX模型的矩阵形式,将大量的历史输入及历史输出加入建模样本矩阵中,然后利用奇异值分解和主成分分析将扩充的样本矩阵分解为质量相关子空间、质量无关子空间和残差子空间,最后设计相应的指标进行动态系统中的故障检测.该方法不仅考虑了变量的动态自相关,同时建立了质量变量与过程变量之间清晰的空间分解模型,有效减少了质量相关空间中对预测无用的信息,保证了空间分解的完备性.

本文的主要创新如下:

1) 在EPLS算法的基础上,利用ARMAX模型的时滞性获取变量时间序列的自相关性动态模型,提出一套基于D-EPLS完整的质量相关故障检测方法.

2) D-EPLS在空间分解中采用了SVD分解的方法,避免了PLS中大量的迭代过程,并在质量相关故障检测中表现出较好的检测性能,同时对质量相关故障检测率有了全面提高.

2 PLS和EPLS基础

输入矩阵X和输出矩阵Y是对m个过程变量和p个质量变量进行n次采样得到.

PLS是由输入数据矩阵X和输出数据矩阵Y对潜变量ti和ui(i=1,2,···,A)回归建模的算法,A为主元个数.而潜变量的选取一般满足两个原则[18]:第1,ti和ui尽可能多的携带各自数据矩阵的变异信息;第2,ti和ui之间的相关程度达到最大.两个原则可由如下式表示:

其中wi和ci分别是过程潜变量ti和ui的权向量.

PLS模型参数求解通常有非线性迭代法[22]和特征分解法[23].通过对过程变量X和质量变量Y分别对潜结构变量ti和ui进行回归建模,得到如下模型:

Yin等[12]提出对X采取正交分解的MPLS模型,减少了中对预测无用的变化[24].通过对输入矩阵X和输出矩阵Y空间分解,得到MPLS模型.

EPLS算法是在MPLS算法的基础上提出的,通过对X奇异值分解和主成分分析将过程变量分解为3个空间,有效的解决了工业过程质量相关故障检测的实时性和有效性的问题.建立过程变量和质量变量关系模型:

其中:Ψ是系数矩阵,E为残差矩阵.

为了使输入与残差正交,需要输入矩阵的列向量与残差矩阵的列向量正交,即

因此,式(3)可以转化为

由式(5)可以得到系数矩阵Ψ=(XTX)†XTY.根据SVD分解得到两个正交投影空间,然后将输入矩阵投影到两个正交空间.对于残差子空间,利用PCA产生两个子空间,对影响质量相关的干扰或噪声完全分解.通过EPLS算法,得到如下模型:

其中:TX和PX分别为的得分矩阵和负载矩阵,为残差空间.

注1PLS模型潜变量的选取是基于潜变量尽可能多的携带数据矩阵的变异信息和输入输出潜变量的相关程度尽可能大两个原则,这使得模型参数的获取需要大量的迭代过程.而EPLS模型根据SVD分解和PCA分解得到3个正交投影空间,即将ΨΨT进行SVD分解,然后将质量无关空间进一步分解分为两个空间,该过程有效避免了PLS中大量的迭代过程,减少了计算量.文献[13]对EPLS,PLS,MPLS,TPLS,CPLS等多种算法的计算量进行了详细的对比,显示出EPLS算法在质量相关故障检测中高效的优势.

3 基于D–EPLS的故障检测技术

对于大型工业及复杂装备系统的动态过程,当前变量值通常受到过去时刻变量值的影响.为了更好的表征系统中过程变量与质量变量之间的动态关系,采用ARMAX模型的矩阵形式,将采样样本进行时序拓展,构造反应系统动态特性的增广矩阵.假设采样的时间滞后为q,即每个变量的当前样本值x(t)利用q个历史样本数据值x(t-1),x(t-2),···,x(t-q)表示,获取连续样本间动态相关性.构造过程变量时序拓展矩阵Xg=[X1X2··· Xq],其中Xi的含义如图1所示.其中x(i)为初始每个采样时刻的样本.对于质量变量的样本采用相同的方式进行时序拓展.

图1 动态系统中过程变量时序拓展图Fig.1 Time series expansion diagram of process variables in dynamic system

每个采样样本包括m个过程变量和p个质量变量,根据变量时序拓展形式构造的过程变量和质量变量矩阵,有如下形式:

其中Xi和Yi(i=1,2,···,q)为每个时滞矩阵,具体形式如下:

建立过程变量Xg与质量变量Yg之间的关系模型

此时构造两个正交投影矩阵,即

将Xg向span{M}和span{M}⊥投影,得到两个正交子空间.

考虑到求解系数矩阵Mg时存在广义逆,可能会导致Xg和Yg相关信息的丢失,在质量无关子空间中变量的变化会影响产品的质量空间,因此有必要对进一步主成分分解,提高质量相关故障检测性能,即

4 数值算例和TEP实验

本节将采用两个指标:故障检测率(fault detection rate,FDR)和故障误报率(false alarm rate,FAR)作为评价指标,表达式如下:

其中:Neff和Nerr分别表示有效报警和错误报警的数目,Ntfs代表故障样本的总数.

在工业过程中,良好的故障检测效果体现在以下两方面:1)当检测数据是质量相关故障时,质量相关的统计指标FDR高;2)当检测数据是质量无关故障时,质量相关的统计指标FAR低.

4.1 数值仿真

通过式(25)建立初始数值模型[15]:

在正常输入空间加入以下形式故障:

其中:为式(25)生成的正常数据,Ξx为故障方向,fx为故障幅值.

为了验证本文所提算法的有效性,将正常数据中加入质量相关故障和质量无关故障数据.在fx=0的条件下生成500个正常数据用于建立模型,然后生成1000个测试数据用于故障检测,其中前500个数据为正常样本,后500个数据为动态状态下分别加入质量相关与质量无关方向的故障样本.根据预测误差最小化原则[21],确定时滞矩阵个数q=3.下面通过两个场景分别检验算法在动态模型中对质量相关数据和质量无关数据的检测性能.

情景1质量相关故障,参考文献[20]设计质量相关故障方向为

图2为对加入质量相关故障数据的仿真结果.红色虚线为统计量控制限,蓝色实线为每个采样时刻的统计量,当统计量超过控制限时表示有故障发生.由图2可知采用D-EPLS检测方法对前500个正常样本检测时,其统计量都在控制限以下,表示样本无故障发生.后500个采样时刻为加入质量相关故障后的样本数据,在质量相关空间检测时,统计量都在控制限以上,表示质量相关故障发生,能够有效报警.由此可以验证所提算法在数值仿真下对质量相关故障检测的可行性.

图2 数值仿真中D-EPLS算法对质量相关故障检测结果Fig.2 Quality related fault detection results of D-EPLS algorithm in numerical simulation

情景2质量无关故障,参考文献[20]设计质量无关故障方向:

图3为数值仿真模型加入质量无关故障的仿真结果.由图可知,采用D-EPLS检测方法对前500个正常样本检测时,其统计量都在控制限以下,表示样本无故障发生.当质量无关故障发生时,质量相关空间的统计量几乎都在控制限以下,有较低的误报率;在质量无关空间统计量从第501个采样时刻开始均超过控制限,表示能够对质量无关故障有效报警,由此验证了算法对质量无关故障有较低的误报警,并能够在质量无关空间检测到故障发生.

图3 数值仿真中D-EPLS算法对质量无关故障检测结果Fig.3 Quality unrelated fault detection results of D-EPLS algorithm in numerical simulation

4.2 TEP实验

TEP是由美国Tennessee Eastman化学公司过程控制部门Downs和Vogel于1993年开发的一个工业过程的基准过程仿真模型[25],已经广泛用于评估各种过程控制和监控技术.该过程动态模型主要由5个主要操作单元的动态模型所组成,包括化学反应器、冷凝器、压缩机、汽/液分离器和分离器,具体流程由图4所示.该过程包括12个操作变量和41个过程变量,表1-2分别列出了变量在工业过程中的实际物理意义.本文将选取数据集中的11个操纵变量XMV(1-11)、22个过程变量XMEAS(1-22)和1个质量变量XMEAS(35)作为建模变量数据集.根据预测误差最小化原则[21],确定时滞矩阵个数q=4.建模数据为500个正常样本,在线测试数据样本数为1300,其中测试数据前500个为正常数据,后800个为故障数据.根据文献[26]引入对故障数据的描述,IDV(1,2,5-8,10,12,13)为质量相关故障数据集,IDV(3,4,9,11,14,15)为质量无关故障数据集.为了验证所提算法在实际过程中的检测性能,对比了D-EPLS,EPLS[13]和Di-TPLS[19]在质量相关故障发生时的检测率以及质量无关故障发生时的误报率.

图4 田纳西伊斯曼过程Fig.4 Tennessee eastman process

表1 12个操作变量(XMV)Table 1 12 operating variables(XMV)

为了验证D-EPLS对质量相关故障的检测能力,给出了EPLS和D-EPLS对质量相关故障IDV(10)的监控结果,由图5-6显示.IDV(10)是随机扰动下物料温度发生变化的故障,该故障当前时刻的样本受到前几个时刻的影响.故障都是在第501个时刻发生,并一直持续到第1300个采样时刻.良好的检测算法表现在当故障发生时能够迅速报警,并能够持续报警,提醒工程师及操作人员做出及时处理,避免重大事故的发生.图5为EPLS对质量相关故障IDV(10)的检测结果,由图可知质量相关空间的统计量在前500个样本均在控制限以下,但在故障发生的后800个样本有较多的故障样本在控制限以下,存在较高的漏报警,未能持续报警.由表3可知EPLS对IDV(10)的检测率只有46.00%,检测效果并不理想.

表2 41个过程变量(XMEAS)Table 2 41 process variables(XMEAS)

图5 EPLS算法在TEP中对IDV(10)检测结果Fig.5 Detection results of EPLS algorithm to IDV(10)in TEP

图6为D-EPLS对质量相关故障IDV(10)的检测结果.IDV(10)为物料C的温度发生变化,是典型的随时间变化的故障,其当前值受之前时刻的影响.D-EPLS考虑了过程中的动态特征,引入的时滞矩阵能够反映过程中的动态特性,能够充分考虑变量的自相关性及不同变量间的互相关性.由图可知在质量相关空间的统计量在前500个样本均在控制限以下,表示对正常样本检测时没有误报警,后800个样本为故障发生时的样本,通过观测统计量与控制限的比较,统计量表现出较低的漏报警.由表3可知D-EPLS算法对IDV(10)的检测率达到95.60%,相对于静态的EPLS算法提高了49.60%,能够对该质量相关故障发生时持续报警.

图6 D-EPLS算法在TEP中对IDV(10)检测结果Fig.6 Detection results of D-EPLS algorithm to IDV(10) in TEP

表3列出了3种不同算法对TEP中质量相关故障IDV(1,2,5-8,10,12,13)的检测率,其中加粗数据为3种算法中检测率较高的数据,即具有较好检测性能的数据.由表3可知D-EPLS对TEP中质量相关故障的检测率相对于EPLS和Di-TPLS算法均得到了有效提高;并且除IDV(7)的检测率为92.34%外,其它质量相关故障的检测率均高于95%,尤其对质量相关故障IDV(1,5,6,12)的检测率可以达到100%.综上数据分析,当动态系统中质量相关故障发生时,本文所提算法用于故障检测可以效报警.

表3 TEP中质量相关故障的有效报警率(100%)Table 3 FDR(100%)of quality-related faults in the TEP

图7为D-EPLS对TEP中质量无关故障IDV(4)检测效果图.IDV(4)是阶跃下反应器冷凝水入口温度发生变化的故障.该故障发生时并不会影响产品质量.工程师及操作人员对工业过程中质量相关故障发生时要求有较高的检测率,而对质量无关故障发生时要求有较少的误报警.本文对提出的算法在质量无关空间的误报警状况进行了检验.由图可知D-EPLS算法对质量相关空间检测时有较少的误报警,并由表4知其误报警率为8.91%,而对质量无关空间检测时可以有效检测到质量无关故障发生,这将为检验人员提供准确的故障报警信号.

图7 D-EPLS算法在TEP中对IDV(4)检测结果Fig.7 Detection results of EPLS algorithm to IDV(4)in TEP

由于质量无关故障发生时并不影响最终产品质量,工程技术人员可以较少的关注质量无关故障,因此质量无关故障发生时并不用报警,这将要求算法对质量无关故障有较低的误报警.表4列出了不同算法对质量无关故障IDV(3,4,9,11,14,15)的误报情况,其中加粗数据为3种算法中检测较低的数据.由表4可知,本文所提出的算法对质量无关故障IDV(3,4)的误报率相对于EPLS和Di-TPLS算法有所降低,对IDV(9,11,14,15)的误报率略有提高,但这并不影响实际工业过程中对质量相关故障的检测性能.

表4 TEP中质量无关故障的误报警率(100%)Table 4 FAR(100%)of quality-unrelated faults in the TEP

5 结论

本文对EPLS检测算法进行动态扩展,提出一种基于动态高效潜结构投影(D-EPLS)算法的质量相关故障检测方法.该方法利用ARMAX模型的矩阵形式获取数据间的动态特征,建立增广矩阵间的关系模型,实现对动态过程中质量相关故障的检测.通过数值仿真和TEP实验验证了该算法的有效性;相对于EPLS,全面提升了EPLS算法在动态系统中质量相关故障的检测率,扩大了EPLS算法在实际工业过程中的应用范围.研究中发现D-EPLS对质量相关故障的检测效果较好,但对一些质量无关故障的误报率略高,这将是后续需要解决的难题.

猜你喜欢
动态矩阵变量
国内动态
国内动态
国内动态
抓住不变量解题
动态
多项式理论在矩阵求逆中的应用
矩阵
矩阵
矩阵
分离变量法:常见的通性通法