钟 纯 李 楠 杨煜普
(上海交通大学电子信息与电气工程学院,上海 200240)
基于核可预测元分析的非线性故障检测技术
钟 纯 李 楠 杨煜普
(上海交通大学电子信息与电气工程学院,上海 200240)
为克服可预测元分析方法在非线性领域的不足,并更好地反映工业监控过程的动态特性,将核可预测元分析方法引入非线性故障检测领域。首先将观测数据映射到高维特征空间,提取可预测元特征;然后基于贝叶斯定理构造统计量,用于监控工业过程进行并检测故障。在TE模型的仿真实验结果表明:基于核可预测元分析的非线性故障检测方法能有效提高系统的故障检测准确率。
非线性故障检测 核可预测元分析 统计量 TE过程
对于复杂的工业过程,要建立其精确的数学模型非常困难,而传统的故障检测技术,如主元分析(Principal Component Analysis,PCA)方法,不仅要假设数据服从高斯分布,而且在面对非线性复杂工业数据时存在明显不足。虽然核主元分析(KPCA)方法能较好地处理非线性数据,但不能反映数据的动态时序特性[1,2]。因此,基于数据驱动的故障检测技术成为研究热点,并获得了成功应用[3~5]。
可预测元分析(Forecastable Component Analysis,ForeCA)方法以全新的模型从大量数据中挖掘潜在的可预测特征,从而反映系统的动态特性,不需要假设数据服从高斯分布,更符合实际工业过程。但是,ForeCA方法是一种线性变换方法,对于大型工业过程中的非线性数据无法较好地提取动态时序特性(即可预测特征),影响故障检测准确率[6]。因此,引进核可预测元分析(KForeCA)方法,该非线性方法不仅能提取数据中的动态时序特性,而且弥补了ForeCA方法在非线性领域的不足,因此提取的特征更能反映实际工业过程状况。
在此,笔者提出用KForeCA方法进行故障检测,通过将输入样本映射到高维特征空间,对数据进行可预测元分析,选取合适的可预测元,并基于贝叶斯定理构造一个统计量来监控系统的运行状况。
KForeCA方法的基本思想是将低维非线性空间中的输入数据映射到高维线性特征空间,并使用核方法避免“维数灾难”,然后在特征空间中对数据进行ForeCA,提取可预测元特征,即寻找一个负载矩阵W,使S=WTU,其中,S为提取的可预测元特征,U为映射到特征空间后的数据。
k(xi,xj)=〈Φ(xi),Φ(xj)〉
(1)
其中〈·,·〉表示内积。核矩阵可定义为K=ΘTΘ,由此计算核矩阵K。标准化后的特征空间核矩阵为:
(2)
Λ=diag(λ1≥λ2≥…≥λd)
H=[α1,α2,…,αd]
(3)
由此可求出特征空间中的数据白化后为:
Θs=[Φs(X1),Φs(X2),…,Φs(XN)]
(4)
式中P——白化矩阵;
Θs——标准化后的数据。
最后对白化后的数据U进行可预测元分析。其基本思想是寻找一个线性变换矩阵WT∈Rd×m,使得S=WTU,其中,W为负荷矩阵,其列向量为负载向量,且彼此之间两两正交,S为得分矩阵。文献[6]给出了ForeCA的最优化问题:
s.t.wTΣUw=1
(5)
式中SU(ω)——多变量平稳过程的谱密度;
ΨU(k)——自协方差函数;
ΣU——协方差矩阵。
选取正常工况下的观测数据X∈Rn×N,其中,n为变量个数,N为采样点个数。首先将观测数据映射到高维特征空间,对数据进行标准化和白化后为U,然后对其运用ForeCA算法,得负荷矩阵为:
WT=[w1,w2,…,wn]T∈Rn×N
(6)
笔者基于贝叶斯定理构造一个新的统计量,将传统的统计量转换为概率测度。根据贝叶斯定理有:
(7)
(8)
(9)
根据概率值设置加权值,对反映故障信息的可预测元特征增加权重值,这样更能反映出系统的实际情况,提高故障检测的灵敏度。为减少监控结果的剧烈波动,提出移动时间窗策略,可以提高EL2统计量的监控性能,对EL2统计量可以描述为:
(10)
式中CL——EL2的控制限;
n——移动窗的点数;
Δs——加权矩阵函数。
(11)
综上所述,使用KForeCA方法提取系统的可预测元特征,基于贝叶斯定理构造计量,建立核可预测元模型用于在线数据对系统的监控。如果监控结果在统计量的控制限以下,则系统处于正常工作范围内;相反,则认为系统此时不在系统预测的变化范围内,进而检测出系统出现故障。
TE(Tennessee Eastman)过程是基于实际化工生产过程提出的一个仿真系统,由连续搅拌式反应釜、冷凝器、气液分离塔、汽提塔、再沸器及离心式压缩机等多个单元组成[10],其流程如图1所示。
图1 TE流程
TE模型有21个预设故障,训练集包含500个样本数据,测试集由前160个正常数据和后800个故障数据构成。将KForeCA方法与传统PCA方法、KPCA方法、ForeCA方法进行比较,7个故障的检测准确率见表1,其中IDV(4)为反应器冷却水的入口温度变化,IDV(5)为冷凝器冷却水的入口温度变化,IDV(10)为C的进料温度变化(流2),IDV(11)为反应器冷却水的入口温度变化,IDV(16)、IDV(19)和IDV(20)为未知类型故障。
表1 PCA、KPCA、ForeCA、KForeCA的故障检测率比较
由表1可知,KForeCA方法和KPCA方法明显优于PCA方法和ForeCA方法;KForeCA方法基于贝叶斯定理构造的EL2统计量的故障检测准确率要高于其他方法,说明基于贝叶斯定理的统计量对提高故障检测准确率具有有效性。
图2所示为故障10在4种方法下的故障检测监控图,可以看出KForeCA方法基于贝叶斯定理构造的统计量在故障检测中具有可行性和有效性。
a. PCA方法
b. KPCA方法
c. ForeCA方法
d. KForeCA方法
笔者介绍了一种基于KForeCA方法的非线性故障检测方法。该方法不仅继承了ForeCA方法的优点,而且克服了ForeCA方法无法处理非线性数据的不足,同时针对传统的PCA、KPCA方法更能有效地反映系统的动态特性。在可预测空间中构造基于贝叶斯定理的EL2统计量,用于反映故障信息的可预测元特征,增加权重值,并利用时间移动窗策略减少波动,提高了故障检测准确率。在TE模型上的仿真表明,KForeCA方法比传统的PCA方法、KPCA方法和ForeCA方法的检测精度更高、效果更好。
[1] Fan Y,Li P,Zhi H S.KPCA Based on Feature Samples for Fault Detection[J].Control and Decision,2005,20(12):1415.
[2] Lee J M,Yoo C K,Choi S W,et al.Nonlinear Process Monitoring Using Kernel Principal Component Analysis[J].Chemical Engineering Science,2004,59(1):223~234.
[3] 周东华,胡艳艳.动态系统的故障诊断技术[J].自动化学报,2009,35(6):748~758.
[4] 李晗,萧德云.基于数据驱动的故障诊断方法综述[J].控制与决策,2011,26(1):1~9.
[5] Kresta J V,MacGregor J F,Marlin T E.Multivariate Statistical Monitoring of Process Operating Performance[J]. The Canadian Journal of Chemical Engineering,1991,69(1):35~47.
[6] Goerg G.Forecastable Component Analysis[C].Proceedings of the 30th International Conference on Machine Learning. Atlanta:ACM,2013:64~72.
[7] Nuttall A H,Carter G C.Spectral Estimation Using Combined Time and Lag Weighting[J].Proceedings of the IEEE, 1982,70(9):1115~1125.
[8] Botev Z I,Grotowski J F,Kroese D P.Kernel Density Estimation via Diffusion[J].The Annals of Statistics,2010, 38(5):2916~2957.
[9] Chen Q,Kruger U,Leung A T Y.Regularised Kernel Density Estimation for Clustered Process Data[J].Control Engineering Practice,2004,12(3):267~274.
[10] Lyman P R,Georgakis C.Plant-wide Control of the Tennessee Eastman Problem[J].Computers Chemical Engineering, 1995,19(3):321~331.
NonlinearFaultDetectionTechnologyBasedonKernelForecastableComponentAnalysis
ZHONG Chun, LI Nan, YANG Yu-pu
(SchoolofElectronicInformationandElectricalEngineering,ShanghaiJiaotongUniversity,Shanghai200240,China)
Considering the forecastable component analysis’(ForeCA) insufficiency in the nonlinear field and in view of reflecting dynamic property of the industrial control, the Kernel forecastable component analysis(KForeCA) was introduced into the nonlinear fault detection. This method can map the data observed into a high-dimensional feature space to extract forecastable component’s features and then to constitute statistics based on Bayes’ theorem so as to monitor industrial process and detect any fault. Simulation on Tennessee Eastman (TE) shows that this KForeCA-based nonlinear fault detection method can improve the accuracy of fault detection.
nonlinear fault detection, KForeCA, statistics, TE process
TH862+.3
A
1000-3932(2016)01-0023-05
2015-06-15(修改稿)基金项目:国家自然科学基金资助项目——2013非完整数据过程的鲁棒故障检测与故障认知方法(61273161)