李纪云,王俊平,裴红星,翟 慧
(1.河南职业技术学院信息工程系,河南郑州 450046;2.郑州大学物理工程学院,河南郑州 450001)
传统的传感器故障诊断方法主要依赖于操作员的经验判断,很难进行精确的故障判断。随着工业生产技术的发展,针对传感器设备的故障诊断方法越来越多,现阶段主要划分为物理冗余和解析冗余2种方法[1]。其中,基于主元分析的解析冗余方法将相关数据投影到低维空间,能够在保留原有有用信息基础上有效提取过程信息,舍去噪声,显著简化了故障诊断过程,在传感器故障诊断领域有着广泛应用[2-4]。文中根据油田生产特点,提出一种针对油田传感器设备故障进行识别的新型PCA算法。
主成分分析(PCA)最早是由Karl Pearson于1901年提出的[5]。它的主要思想就是将训练数据映射到高维变量空间进行降维处理,寻找一组少数包含所有原样本特征的新数据变量代替原变量,利用T2和SPE统计量等性能指标对生产过程进行监控。
设样本数据集X={x1,x2,…,xi,…,xn}∈Rn×m,其中n表示样本个数,m表示过程变量个数。数据矩阵X可分解为
(1)
式中:T为主元得分向量,T=[t1,t2,…,tn];P为载荷矩阵,P=[p1,p2,…,pm].
为了清除测量噪声的影响,通常将E忽略掉。因而,数据X可近似表示为
(2)
对矩阵X的主元分析等效于对X的协方差矩阵XTX进行特征分解,其特征值对应的特征向量p1,p2,…,pm即为X的向量。PCA方法过程监测一般通过监测T2和SPE两个统计量是否超限来实现的,统计量的定义分别为:
T2=[t1,…,tp]Δ-1[t1,…,tp]T≤δT2
(3)
(4)
式中:δT2为T2控制限;δSPE为SPE控制限。
若监测过程中统计量超限,则认为可能有发生故障。
随着工业生产过程的复杂化,传统基于PCA的传感器故障诊断方法表现出了一些不足:PCA是一种静态建模方法,但实际工业生产过程都存在动态特性,测量变量不是序列无关的,采用传统的PCA建模方法进行故障识别,增加误报率;针对变工况生产过程的工况过渡时,变量的统计特性会发生较大变化,传统的PCA模型已无法描述整个过程特性。考虑到油田生产过程的多工况性及生产数据动态特性产生的过程检测和故障识别精度低的问题,提出了基于迭代多模型PCA传感器设备故障识别方法。
2.1迭代多模型PCA算法结构
基于多模型迭代PCA传感器故障识别方法框图如图1所示。首先根据分类规则对生产措施过程历史数据进行分类,并分别建立不同工况下的PCA模型,提高故障检测效率;对分类后的新采样数据进行主成分分析,运用T2和SPE统计量进行过程监测,若无异常,则运用迭代算法更新PCA模型,保证系统的动态特性;若出现异常,则进行故障诊断。
图1 迭代多模型PCA传感器故障识别方法框图
2.2算法的多模型确定
油田生产措施过程复杂,根据油井生产情况采取不同生产措施,使生产过程工况发生变化。而传统的传感器监测方法通常是以单一工况为前提的,PCA模型中的数据的统计特性满足某种分布特性,各统计量不会发生显著变化。将传统的传感器故障检测方法应用于复杂的油田生产过程,误报率高。针对以上问题,以工况的不同对历史生产措施数据进行分类,建立不同工况的PCA模型。
假设第i个PCA模型已有N组正常状态下的生产数据,建立如下用于故障监测的PCA子模型[6]:
(5)
式中i为建立的子模型的序号,i=1,2,…,r.
为了实现多模型PCA的过程监测的目的,需要计算子模型的权值,从而判断新数据属于哪类子模型,子模型的权值wij可以通过下面的公式获得:
(6)
式中cj为聚类中心。
若权值趋近于1,测试数据属于该样本集;若权值趋近于0,数据不属于该样本集。在两者之间,则属于多个样本集。
2.3迭代方法的选取
随着生产的进行,油井参数在缓慢变化,以及传感器等自身的问题导致生产数据具有明显的动态特性。由于传统的PCA模型建立以后便不再更改,不能实时反应生产过程的动态特性。Golub提出了一种迭代PCA算法,用于过程监控,通过求取新数据的相关矩阵实现PCA模型的更新。算法将历史数据标准化并建立PCA模型,得到相关矩阵可近似为
(7)
(8)
迭代算法的步骤为:现产生了第N+1组正常数据xN+1,计算新数据的各统计量,判断数据是否正常。如果新数据是正常数据,则运用上述迭代算法更新PCA模型。
2.4算法的实现过程
提出的迭代多模型传感器故障识别方法是通过监控各个统计量的变化来实现过程监控的。根据工况的不同建立m种工况离线主元模型,其建模步骤如下:
(1)将m种工况数据进行标准化,并根据式(7)计算关联矩阵;
(2)对关联矩阵进行特征值分解;
(3)根据主元贡献率和百分比(CPV)的方法,确定模型主元个数k,并根据以下公式计算T2和SPE控制限。
(9)
(10)
(4)计算各工况的聚类中心,假设第j个类中包含nj个样本,则该类的聚类中心:
根据建立的m种工况主元模型,对油田传感器设备进行在线监测。其在线监测的步骤为:
(1)在线采集1组新的监测数据,对其进行标准化处理。
(2)依据式(6)计算隶属权值,若权值趋近于1,则属于该类,利用相应的主元模型进行故障检测;若不属于任何一类,则作为故障数据;若为多样本数据,需做进一步判断。
(3)对新的监测数据在相应的主元模型中进行主元分析,通过式(3)、式(4)计算统计量值,若统计量都超限,找到可能的故障变量,进行故障处理;若统计量没有超限,则说明是正常数据。
(4)若监测数据正常,则运用迭代算法更新主元模型,根据式(8)重新计算关联矩阵,进行主元分析。当新数据累积到kN时,重新进行限值计算。
以油井传感器数据为研究对象,对日产液、日产油、含水、油压、套压、井口温度、电流和液面8个过程变量进行监测,图2、图3给出了传统PCA模型在多工况情况下发生故障1和故障2时的统计量图。故障1表示生产过程中流量计量设备故障;故障2表示电流传感器输出故障。利用CPV方法确定主元个数k=2;计算置信度α=0.95情况下的控制限,ts_ctr=6.155 2,spe_ctr=1.484 7。
(a)SPE统计图
(b)T2统计图
(a)SPE统计图
(b)T2统计图
从图1、图2可以看出,对故障1,由于工况的不同,导致数据统计量浮动较大,T2统计量对故障反应不灵敏,不能反映出故障问题。发生传感器故障时,故障数据具有连续性,而图1中的SPE统计量只能得到出第68~118组故障数据,之后统计量恢复正常,因此,不能准确判断故障的发生;对故障2,传统方法已经不能检测出故障。
为了验证方法的有效性,建立了油井在压裂、蒸汽吞吐等3种工况下的传感器设备PCA模型,并运用基于相关矩阵的迭代方法对模型进行更新。
图4~图7分别表示其在故障1和故障2情况下的统计量图。图4、图5表示故障1发生,对现场数据进行计算,根据式(6)得出权值,判断该数据属于哪组模型,在该模型的基础上进行T2和SPE的计算,如是正常数据,对该数据重新计算协方差矩阵对模型进行迭代更新;而故障数据则不进行迭代。与图2比较,可以看出,提出的迭代多模型PCA方法能够有效检测到故障,且从统计量的幅值来看,具有较高的灵敏度。
图4 迭代多模型PCA故障1SPE统计图
图5 迭代多模型PCA故障1 T2统计图
图6 迭代多模型PCA故障2 SPE统计图
由图6、图7可知,与图3相比,在发生故障2的情况下(即电流传感器输出发生故障),虽然生产过程中可能存在离散点,导致统计量变化幅度较大,但该方法可以有效
图7 迭代多模型PCA故障2 T2统计图
检测出故障2。由此可见,提出的迭代多模型PCA方法能够及时有效地反映出传感器故障,具有较高的灵敏度,是一种有效的故障识别方法。
针对油田传感器设备,提出了一种迭代多模型PCA方法进行在线故障识别。并以油井传感器为研究对象,与传统PCA方法进行了对比,证明了该方法在应对多工况上的优越性,检测灵敏度高,弥补了传统PCA方法在处理数据动态特性时容易出现误判、漏判问题时的不足。但该方法还存在一定的问题,检测过程中没有考虑过渡状态,有待进一步的研究。
参考文献:
[1]HE F J,LIU X L.A research on fault detection diagnosis technology for sensor.Mechatronics,2001(5):73-78.
[2]熊浩,孙才新.基于克隆选择分类算法的电力变压器故障诊断.电网技术,2006,30( 4):65-68.
[3]ZHANG L P,HUANG F Q.Study on sensor fault diagnosis of wet flue gas desulfurization system in thermal power plant based on PCA.Journal of Fuzhou University,2011(39):240-244.
[4]杜海峰,王孙安.基于 ART-人工免疫网络的多级压缩机故障诊断.机械工程学报,2002,38( 4):88-90.
[5]FU K C.Sensor fault diagnosis based on structure optimized PCA and its application.Hangzhou:Zhejiang University,2007.
[6]MENG L L,WU J Z,SUN Y.A process monitoring method based on multi-PCA models.Beijing:Transactions of Beijing Institute of Technology,2004:64-68.