基于主元分析的滑动窗口累积和的微小故障检测

2023-06-07 09:48谢彦红贾冬妮
计算机应用与软件 2023年5期
关键词:主元滑动工况

谢彦红 杨 滕 贾冬妮 张 成 李 元*

1(沈阳化工大学理学院 辽宁 沈阳 110142) 2(沈阳化工大学技术过程故障诊断与安全性研究中心 辽宁 沈阳 110142)

0 引 言

20世纪90年代以来,生产过程的复杂度逐渐提高,自动化系统的结构日益复杂。实际工业工程中产生的微小故障若不能及时检出,不仅会影响产品质量和生产效率,更有可能导致大型事故的发生。因此,微小故障检测成为近年来学术界和工业界的研究热点[1-3]。

故障初始定义是指在一个过程中至少有一个变量或特性超出正常工作范围。根据故障的演变过程,将故障划分为显著故障和微小故障。微小故障普遍存在于化工过程中,如催化剂性能的缓慢变化和元器件的老化等。很多严重的设备故障是由微小故障经过长期积累造成的[4]。故障发生前会出现相应的前兆,观测值与正常值偏离程度较大的为显著故障;故障前兆较为微弱,观测值与正常值偏离程度较小的为微小故障。文献[5]将故障幅值低、故障特征不明显、易被扰动和噪声掩盖的故障定义为微小故障。微小故障与显著故障是相对而言的,相比于显著故障检测,微小故障检测是一种更精细的检测方法,其诊断难度也更大。文献[6]将微小故障分为缓变微小故障、突变微小故障和间歇微小故障,并提出了定性诊断方法、定量诊断方法和半定性半定量方法。

由于微小故障具有幅值小和故障特性不明显等特点,所以传统故障检测方法检测率较低。其中,主元分析(PCA)和独立成分分析(Independent Component Correlation Algorithm,ICA)是经典的多元统计方法,在过程监控与诊断、医学和金融等多个领域中得到广泛应用[7-9]。PCA将数据原始空间分解为主元子空间和残差子空间,同时利用统计量T2和SPE对工业过程进行故障检测[10-14]。ICA是PCA和因子分解的扩展,能够利用有效的高阶统计信息经变换得到相互独立的数据的基础上,构造统计量进行故障检测。但由于微小故障具有幅值小的特点,所以微小故障很难被PCA诊断出来。针对微小故障的缺陷,邱天等[15]将多元指数加权移动平均(Multivariate Exponentially Weighted Moving Average,MEWMA)与PCA结合,利用MEWMA对数据进行筛选和平滑,重新构造统计量对微小故障进行检测。但MEWMA的引入导致故障检测产生延迟,导致该方法对于突发故障检测不灵敏。文献[16]提出了一种基于修正的ICA分散式非高斯监测方法,但忽略了子块间的联系,并没考虑微小故障问题。

累积和(Cumulative Sum,CUSUM)控制图是Page[17]依据采集样本数据的均值和假设检验的原理,提出一种反映样本偏差效果的方法。该方法通过对观测值与目标值的误差进行累积,将过程中微小偏移量放大,提高检测微小偏移量的灵敏度。近年来,CUSUM控制图在故障检测和统计控制等方面得到了广泛应用[18-20]。其中,在故障检测领域Du等[21]提出一种基于集合经验模分解(Ensemble Empirical Mode Decomposition,EEMD)的PCA方法提取故障特征,利用CUSUM重新构建模型对微小故障进行故障检测的方法。这一系列成功的应用和实验表明,CUSUM是一种有效辅助微小故障检测的方法。

本文针对工业过程中的微小故障,提出基于主元分析的滑动窗口累积和(PCA-MWCUSUM)的微小故障检测方法。首先,利用PCA将样本数据分解,计算得到主元得分T2,去除数据相关性;然后,利用滑动窗口技术并结合CUSUM,在指定窗口宽度内对每一个窗口内的主元得分与主元得分的均值误差进行累加构成新的统计量,完成对样本的微小故障检测。通过数值例子和TE过程仿真实验,验证本文方法的有效性。

1 基本算法

1.1 主元分析原理

(1)

T2=xpΛ-1pTxT

(2)

(3)

式中:p为负载矩阵,p=[p1p2…pl];pi为负载向量,代表投影方向;Λ为X的协方差矩阵前l个特征值构成的对角阵。控制限通过核密度估计得到,置信度通常被选取为0.99或0.95[22-23]。

1.2 滑动窗口

滑动窗口技术是一种利用动态窗口调整模型内包含的样本集,并反映样本集变化的技术手段。将相邻的几个数据界定为一个窗口,滑动窗口以固定窗口为单位不断更新,形成等步长的时间区间段[24-26]。

1.3 累积和控制图

CUSUM描述了数据被控过程中随时间变化的连续关系,是连续过程中用来检验微小偏移量的有效手段。该方法通过对历史信息的累加,加大微小故障偏移量,使故障工况和正常工况分离来检测微小故障[27-28]。在滑动窗口内利用CUSUM进行累加,重新构建统计量Ci。

(4)

式中:Ci为数据叠加运算之后的统计量;ti为数据本身的统计量;μi,c为数据本身统计量的均值;h为松弛变量,即允许偏移的量。

2 基于PCA-MWCUSUM的微小故障检测

若被测数据出现微小变化,将导致被测数据与被测数据均值的误差偏值增大,累积和Ci按照时间推移对偏值进行累积。

本文针对传统PCA在检测微小故障时的局限性,提出基于主元分析的滑动窗口累积和的微小故障检测方法。该方法通过PCA将正常工况下的样本集分解成主元子空间和残差子空间,再利用滑动窗口将相邻数据的统计量作为一个窗口进行滑动检测,在每个窗口内利用CUSUM对统计量与统计量均值的误差进行累加。该方法增加微小故障的偏移量,将正常工况和故障工况分开,提高微小故障检测效率。

假设样本集X包含n个样本、m个变量。首先,利用PCA对标准化后的数据进行特征分解,计算得到主元子空间的统计值表示为:

T2=xpΛ-1pTxT

(5)

然后,利用滑动窗口技术,计算每个窗口内累加和,更新过程变量数据。该累加和为主元得分与主元得分的误差累加,其计算式表示为:

(6)

Ci=max[0,Ci-1+T2-(E(T2)+h)]

(7)

1) 离线建模。

(1) 应用Z-SCORE对训练样本进行标准化处理。

(2) 应用PCA对标准化后的样本特征分析,利用式(5)计算训练样本的得分。

(3) 通过式(6)对训练样本的得分叠加。

(4) 以步骤(3)计算得到的累积和构建滑动窗口。

(5) 利用核密度估计确定控制限ucl[23]。

2) 在线检测。

(1) 应用Z-SCORE对测试数据进行预处理。

(3) 利用滑动窗口技术对数据进行分时检测。

3 仿真研究

3.1 数值例子

本节通过一个数值例子进行仿真研究,具体模型表示为:

(8)

式中:ei(i=1,2,3)是分布在[-1,1]上的独立白噪声变量;t服从[0,1]分布。产生1 000个样本组成训练数据集,1 000个样本组成测试数据集(包含500个校验数据,500个故障数据),在x1变量上增加0.1的阶跃故障构成故障数据。根据主元贡献率85%,ICA的独立主元个数选取为2,PCA-SVDD和PCA-MWCUSUM主元个数选取为2。KNN的近邻数K经交叉验证选取为3。PCA-MWCUSUM的窗口宽度w选取为1,松弛因子h选取为0.5。根据置信水平0.99,应用ICA、PCA-SVDD、KNN和PCA-MWCUSUM对该数值例子进行检测。检测结果分别如图1-图4所示,其中:DIST表示检测样本距离球心的距离的统计量;D表示根据检测样本与训练样本的k个最近邻的距离所计算的统计量;Ctf表示主元得分与主元得分的误差累加。各方法检测结果如表1所示。

图1 ICA检测结果

图2 PCA-SVDD检测结果

图3 KNN检测结果

图4 PCA-MWCUSUM检测结果

表1 各方法故障检测结果

由于ICA仅对高阶统计信息有影响,在对微小故障检测方面仍存在困难,所以对故障尺度较小的故障检测率较低。PCA-SVDD在确定支持向量时存在一定的不确定性,在检测微小故障时存在一定的误检。KNN通过计算训练样本和测试样本的距离对故障进行检测,当故障尺度过小时,KNN对微小故障不敏感。但是,本文方法可将有效的历史信息叠加,加大了正常工况与故障工况的尺度,所以本文方法比ICA、PCA-SVDD和KNN检测微小故障的效率更高。

3.2 Tennessee Eastman(TE)过程

田纳西-伊斯曼(TE)过程是由Eastman化工公司建立,以实际化工联和反应为背景的仿真实验平台。该过程包含五个操作单元和四种气体原料[29]。其产生的数据具有时变、强耦合和非线性特征,在故障检测方面得到广泛应用。因此本节利用TE过程验证本文算法的有效性。图5为TE过程流程。

图5 TE过程流程

TE过程包含22组数据,第一组数据为正常数据的收集,其余21组为故障数据。其中每组故障数据包含960个样本(前160个数据为正常数据,后800个数据为故障数据)[30-31]。其中故障3、故障9和故障15为微小故障,在传统算法下很难被检测出来[32]。

本节利用PCA-MWCUSUM对TE过程的故障3、故障9和故障15进行故障检测,并与ICA、PCA-SVDD和KNN进行对比分析。根据主元贡献率达到85%,PCA-SVDD和PCA-MWCUSUM主元个数选取50。为了加大故障尺度,加快微小故障检测速率,PCA-MWCUSUM窗宽w选取为1、松弛因子h选取为0.5。PCA-SVDDD的惩罚因子选取为0.02,核窗宽度为60。KNN的近邻数K经交叉验证选取为3。各方法的置信度为0.99。图6-图17分别是PCA、KNN和PCA-MWCUSUM检测故障3、故障9和故障15的检测结果。四种方法的检测率如表2所示。

图6 ICA检测故障3

图7 PCA-SVDD检测故障3

图8 KNN检测故障3

图9 PCA-MWCUSUM检测故障3

图10 ICA检测故障9

图11 PCA-SVDD检测故障9

图12 KNN检测故障9

图13 PCA-MWCUSUM检测故障9

图14 ICA检测故障15

图15 PCA-SVDD检测故障15

图17 PCA-MWCUSUM检测故障15

表2 各方法故障检测结果(%)

故障3和故障9都是由于TE过程中D进料温度发生了变化而产生的微小故障,由故障数据和正常数据的变量图可以看到均值和方差没有变化,所以传统的多元统计过程分析方法检测效果较差。传统的ICA仅能提取数据的统计信息,有效分离信号源,并不能有效地加大正常数据和故障数据之间的偏移量。PCA-SVDD由于微小故障幅值较小,检测边界具有不确定性,易发生误报。PCA-MWCUSUM方法能有效叠加故障尺度,所以本文方法能快速检测出微小故障。从图9可以看出在第126到第160个采样点时,校验数据发生了偏移。主要原因是在检测刚开始时工况本身处于不稳定状态,MWCUSUM的叠加出现偏差,但对故障3的检测工作影响较小。

故障15由冷凝器冷却水阀门粘滞引起的微小故障。从表2可以看出ICA检测不到生产过程发生的微小变化,检测率仅为5.87%,PCA-SVDD检测率仅为18.75%,KNN检测率仅为30.75%,而使用本文方法检测故障15的检测率为72.6%。主要原因为ICA、PCA-SVDD和KNN对微小故障不敏感,而本文方法使微小故障偏移量逐渐增加达到控制限,使得故障能够被检测出来。但此时产生一定时间的延迟,所以在第165到第320个采样点时发生了误报。仿真结果充分验证了PCA-MWCUSUM检测微小故障具有较好的检测结果。

4 结 语

本文提出一种基于主元分析的滑动窗口累积和的微小故障检测方法,利用对数据的叠加,增大微小故障的尺度,实现对微小故障的检测。通过PCA消除数据相关性,降低了数据自相关性对检测微小故障的影响;同时利用滑动窗口和CUSUM结合对微小故障进行叠加,避免了正常工况与故障工况的大面积重合,提高微小故障检测率。通过数值例子和TE过程的仿真实验进一步验证本文方法的可行性。

猜你喜欢
主元滑动工况
热网异常工况的辨识
不同工况下喷水推进泵内流性能研究
多元并行 谁主沉浮
基于非负矩阵分解的高速列车走行部工况识别
应用主元变换法分解因式
一种新型滑动叉拉花键夹具
Big Little lies: No One Is Perfect
运用结构的齐次化,选换主元解题
滑动供电系统在城市轨道交通中的应用
低水头工况下溪洛渡福伊特机组振摆工况的探讨