于 飞 王红蛟
(青岛科技大学自动化与电子工程学院,山东 青岛 266042)
随着计算机和电子测量技术的飞速发展,现代工业过程大都具有完备的传感器装置,可以在线获得大量的过程数据。对这些数据进行统计分析可以帮助操作人员及时发现过程故障,避免重大事故的发生。目前,基于数据分析的故障检测方法中应用最多的有主元分析、偏最小二乘及独立元分析等。主元分析在故障诊断、数据压缩、信号处理及模式识别等领域中均有广泛的应用[1~3],该方法是依据线性变换,将数据从原始的n维空间映射到新的m维子空间上(m 假设所研究的监测过程有n个样本,m个变量,将研究对象转换为一个n行m列的矩阵Xn×m。对矩阵X中的每个变量进行标准化处理,标准化后的数据矩阵为: (1) 求得标准化后的数据矩阵X的协方差矩阵为: (2) 确定主元的个数时常用特征值方差累计贡献率法,前k个主元累计贡献率CPV可表示为: (3) 当前k个主元的累积贡献率超过一个阈值时(阈值需根据实际情况确定,如85%),对应的k值就是需要保留的主元个数。由主元得分矩阵T=XP,可得主成分向量为: (4) 通过建立HotellingT2和预测误差统计量(SPE)判断过程是否发生故障。其方法是在主元子空间HotellingT2统计量进行统计检验;在残差子空间中建立预测误差统计量进行统计检测[6]。SPE统计量也称为Q统计量,即: (5) SPE统计量的控制限通过其近似分布来计算:当SPE≤SPEa时,系统运行正常;当SPE>SPEa时,系统出现故障。其中SPEa是检验水平a下的置信度,其计算式为: (6) h0=1-2θ1θ3/3θ2 式中Ca——正态分布在检验水平a下的临界值; HotellingT2统计量通过主元模型内部的主元向量模的波动来反映多变量的情况,可以定义为: (7) (8) 式中F(l,n-l,a)——对应于检验水平为a、自由度为l和n-l条件下的F分布临界点; Λ——前l个主元对应的特征值λ1,λ2,…,λl构成的l×l对角矩阵。 偏最小二乘法利用多变量输入和多变量输出组成的矩阵,通过矩阵的降维处理建立低维的输入和输出矩阵,再用线性回归法建立自变量(输入得分向量)与因变量(输出得分向量)之间的内在线性关系[7]。收集正常流程的质量数据[8],建立自变量输入矩阵X∈Rn×m和因变量输出矩阵Y∈Rn×p,其中n是样本点的个数,m是变量的个数,p是因变量的个数。偏最小二乘法把X和Y降维到一个低维空间,定义一个小数量的潜变量t1,…,tI,其中I是投影的隐潜在结构因素的个数。对X和Y均值中心化和标准化处理分解如下: (9) 其中,T=[t1,…,tI]是输入的得分向量,P=[p1,…,pI]和Q=[q1,…,qI]分别为X和Y的载荷,E和F分别是X和Y的偏最小二乘残差。潜在的得分向量ti的计算顺序以输入数据之间最大的协方差为标准,Xi=Xi-1-ti-1pi-1T,X1=X,输出数据为Y。 通过判断SPE统计量和T2统计量是否超过各自的控制限来检测系统是否发生故障。T2、SPE统计监测的计算式分别为: t=RTX F(l,n-l)是以l和n-l为自由度的F分布,χh2是以h为自由度的χ2分布。其中SPE统计量的分布还可以按Jackson和Mudholkar的方法来近似计算[9]: 笔者采用分析离线数据的方法进行故障诊断,首先对锅炉系统变量的离线数据进行预处理。笔者提取400个采样点进行数据分析,分析前200个数据得到控制限,分析后200个数据进行故障诊断。用主元分析法对故障进行仿真,得到的T2和SPE统计结果如图1所示;用偏最小二乘法进行故障诊断并建立回归模型,找到各自变量(输入)对因变量(输出)的回归关系,得到的故障检测结果如图2所示。 由图1、2可以看出:在采样点181~200添加一个变量引风调速阀位故障,两种方法都可以诊断得出结果;但是,偏最小二乘法比主元分析法有较高的正确率,而且偏最小二乘法在进行故障诊断时对正常数据与故障数据的区分更有效,对于故障数据的识别率和灵敏度更高。 图1 基于主元分析法的T2和SPE统计结果 图2 基于偏最小二乘法的T2和SPE统计结果 利用主元分析法和偏最小二乘法对工业锅炉故障进行诊断,通过仿真结果分析得出,偏最小二乘法比主元分析法有更高的正确率,对故障数据的识别率和灵敏性较高,并且能反映出线性回归的方法建立自变量(输入)与因变量(输出)之间的关系。1 主元分析法及其故障诊断①
1.1 主元分析法的基本原理
1.2 基于主元分析法的故障诊断
2 偏最小二乘法及其故障诊断
2.1 偏最小二乘法
2.2 基于偏最小二乘法的故障诊断
3 实例仿真
4 结束语