胡永攀+李瑛+姚熠凯+王彩霞
摘要:以一台制冷量为90冷t(约316 kW)、制冷剂为R134a的离心式制冷机组为实验对象,从理论上分析该制冷系统的7种典型故障,分析故障征兆与故障间的理论关系,运用基于顺序向前选择(SFFS)算法的封装模型进行特征选择,降低乃至消除特征间的相关度,去除信息冗余,获得不同的能较好表征故障的特征子集.结果显示:运用SFFS算法时选择了22个特征,诊断正确率为89.63%,与原特征集的诊断正确率90.36%基本相当,极大地减少了原特征集的特征数,从64维降为22维;在保证故障检测与诊断正确率的前提下,减少了诊断所需传感器种类和数量,节约了初始投入成本.
关键词:制冷系统; 顺序向前选择算法; 故障诊断
中图分类号: TH 311 文献标志码: A
Abstract:An refrigeration system with a 90 t centrifugal chiller using R134a as refrigerant and its seven typical faults were analyzed theoretically.The relationship between the symptoms and faults was attained.The encapsulation model based on sequential forward order feature selection(SFFS) algorithm was adopted for feature selection,which could find better feature subset for reducing or even removing the feature correlation and eliminating the redundancy.The results showed that 22 features were selected by SFFS algorithm and diagnosis accuracy of 89.63% was achieved,which was close to the diagnosis accuracy of 90.36% for original feature set.But it could significantly eliminate the features of original feature set from 64 to 22.Due to the guarantee of the accuracy of fault detection and diagnosis,the type and quantity of sensor could be reduced.The first investment cost could be saved.
Keywords:refrigeration system; sequential forward order feature selection algorithm; fault diagnosis
制冷系统一旦发生故障,会造成环境的舒适性或所要求的冷冻温度得不到保证,严重的将导致系统设备损坏.其次,当制冷系统运行在故障状态时,系统能耗往往增大,造成能源浪费.因此,对制冷系统的故障机理进行研究,建立有效、准确的故障诊断模式对实现制冷系统的实时在线监控、故障先兆预测和优化运行十分重要[1].
近年来,制冷系统故障诊断的方法随着人工智能、计算机、模式识别、数据通讯、信号分析处理等技术的发展而不断完善和更新[2].常用的诊断方法有经典专家系统[3]、模糊理论[4]、神经网络[5]等.直接运用上述方法对制冷系统进行故障检测与诊断,需要测量的过程变量较多, 这意味着需要更多的传感器,进而使成本增加,而且变量维数过大,相互之间具有较强的相关性和冗余,影响识别的准确性.高维数据也对数据的测量、存储,以及训练和应用时间提出了更高的要求,以至在一些情况下,根本不能满足这类要求.因而,选择合适的特征描述模式或样本不仅对模式识别的精度、样本数和训练时间等诸多方面都有较大影响,而且对分类器的构造也起着十分重要的影响.正是由于上述原因,使得对特征选择的研究变得非常有必要.
1 制冷系统故障诊断的特征选择
制冷系统是一个变量多、耦合性强、非线性的热力学系统,系统参数之间存在一定的相关性、模糊性和不确定性.同一种故障的原因可能会表现出多种不同的故障征兆,同一故障征兆也可能在多种不同的故障中表现,而且彼此之间存在着一定的因果关系.制冷系统一旦出现故障,需要监测的参数多,获得的数据集特点表现为多特征、高噪声、非线性,这给故障诊断带来了极大的挑战.
假设系统可能发生n种故障,并将正常运行的状态设为N0,n种故障所处的状态分别设为N1、N2…Nn.状态Ni对应的可测特征向量Si=[Si1,Si2…Sim],诊断的过程即为由可测特征向量Si求出Ni所处状态的过程.
在实际应用中,
如果可测特征向量维数高,样本数量大,无论从计算复杂程度、系统监测成本还是故障诊断效果来看,都是不适宜的.
特征选择是从一组数量为D的特征中选择出数量为m(D>m)的一组最优特征.采用基于顺序向前选择算法对制冷系统进行故障诊断的特征选择,不仅能极大地减少数据集的维数,简化计算,降低设备投入初成本,还能有效地保证诊断效果.
2 模拟故障实验
2.1 模拟故障实验简介
本文数据源于ASHRAE的制冷系统故障模拟实验.实验装置为一台制冷量为90冷t(约316 kW)、制冷剂为R134a的离心式制冷机组.其中,冷凝器和蒸发器均为壳管式换热器,管程走水,下进上出,冷凝器侧制冷剂上进下出,蒸发器侧制冷剂下进上出,分别模拟正常运行模式及7种典型单发故障模式.为了便于分析,表1给出了离心式冷水机组正常运行模式及典型故障模式.制冷机组故障模拟数据采集系统如图1所示,采集时间间隔10 s.获取的制冷工况下正常运行及各故障模式模拟实验终态时的特征参数有64个,如表2所示,其中:16个参数由VisSim软件实时计算得到;48个参数由传感器直接测得,包括29个温度、5个压力、5个流量、7个阀位开度、电流和压缩机功率.为保证实验测量值的准确性,同时采用电阻测量器、热敏电阻对蒸发器侧进、出水温度,冷凝器测进、出水温度四个关键值进行测量.
2.2 制冷系统故障的理论分析
系统发生故障时,各参数偏离正常工况的程度与故障程度有关,一般故障越严重,参数偏离越严重.本文模拟了制冷系统正常运行及7种典型故障模式.7种典型故障的特征描述如表3所示。7种故障中,某些故障对热力状态的影响有一定的相似性,如冷凝器结垢、冷凝器水量不足、制冷剂充注过量、不凝性气体进入系统等均可导致冷凝压力和温度、排气压力升高;蒸发器侧水量不足和制冷剂充注不足均可导致蒸发压力和温度降低.所有故障均会导致不同程度的制冷量下降,压缩机功率增加,系统性能系数降低,严重的甚至导致压缩机烧毁等事故,所以故障必须早发现,早排除.
3 基于顺序向前选择算法的封装模型
顺序向前选择(SFSS)算法是一种寻找近似最优特征的渐进搜索算法.该算法采用一种“自下而上”的搜索方法,初始化的目标特征集为空集,每次计算时向特征集中增加一个特征,当达到要求时,所得到的特征集合就作为特征选择结果.图2为顺序向前选择算法示意图.设原始特征集为M,假设当前特征子集Xi包含i个特征,然后对剩余的每一个未入选的特征分别计算其准则函数J(Xi+1),选择使J(Xi+1)全局最优的特征加入特征子集Xi以生成新的特征子集Xi+1,然后重复上述步骤,直到找到满足要求的特征数时算法结束.本文算法通过Matlab软件实现.
4 基于顺序向前选择算法的特征选择结果分析
将基于顺序向前选择算法的封装模型与线性判别分析(linear discriminant analysis,LDA)算法相结合,对在上述正常运行及7种故障模式下获得的64维36 000个样本组成的特征集进行特征选择,以期选择出能够很好表征原始特征集的特征子集.LDA算法是一种常用的信号处理方法,对应于Matlab软件中的“Classify”函数,其并不直接以训练误差作为目标函数,因此难以找到最优的分类子空间.将LDA算法与顺序向前选择算法进行封装,通过顺序向前选择算法调节LDA算法中类间矩阵特征值的大小,可达到搜索最佳特征子空间的效果.
图3为特征数为1~64时,十折交叉验证的错误率.十折交叉验证时将64维36 000个样本组成的数据集分成10等份,轮流对其中1份做测试,9份做训练,10次测试结果的均值作为对算法精度的估计,以便得到可靠稳定的模型.从图3中可见,当特征数从1依次增加到22后,错误率达到最低;当选择特征数在23~42个之间时,错误率基本保持不变;继续增加特征数,错误率略微下降;采用全部特征(64个)时的错误率与22个特征时的基本相当,即64维与22维的诊断性能相近.这意味着在进行故障诊断时,可以极大地减少传感器的数量.基于顺序向前选择算法选择的特征如表4所示.
顺序向前选择算法是在剩余特征中选择与已选特征子集构成评价整体预测性能为最佳的新特征子集.从表4中可以看出:编号为48的特征符号PO_net最先被选中,说明当只选择一个特征组成特征子集时,PO_net对表1所列制冷系统7种典型单发故障描述效果最佳;其次,在剩余特征中选择加入的VE与PO_net所形成的两个特征的特征子集对7种典型故障的描述效果最好;随后依次加入的是FWC、冷凝器内制冷剂饱和温度与冷凝器侧出水温度之差TCA,其可以代表传热温差;接着是TO_sump、PO_feed、VSS等.从特征选择的结果可知,特征符号TRC和PRC分别位列第61和64,TRE和PRE分别位列第28和37,说明蒸发器内的参数相比冷凝器内的参数优先被选入.因此,就所研究的7种典型故障而言,蒸发器侧参数比冷凝器侧参数更具表征性.
取SFFS算法选择的前22个特征组成的特征集为最优特征集,由最优特征集和未经降维处理的原特征集分别得到故障诊断的总体诊断正确率和各类故障的诊断正确率,结果如图4所示.从图中可知,虽然原特征集的总体诊断正确率比运用SFFS算法的略高,但采用SFFS算法能够极大地减少原特征集的特征数(64个降为22个).一旦表征特征选定,其余非表征性特征则不需要监控,从而大大减少了传感器的使用数量,降低了初始投入成本.
由基于顺序向前选择算法的特征选择结果可以看出,前6个被选中的特征分别是编号为48、56、24、27、45、47的PO_net、VE、FWC、TCA、TO_sump和PO_feed.分别将随机样本点以二维形式显示于图5中,横坐标均为正常及各类故障的类别标识,纵坐标为各个特征的值.从图5(b)中可以看出,在出现蒸发器水量不足故障时,特征VE完全独立于其他故障时的样本值,即VE可以明确指示蒸发器水量不足故障;从图5(c)可以看出,在出现冷凝器水量不足故障时,FWC完全独立于其他故障时的样本值,即FWC可以明确指示冷凝器水量不足故障;由图5(d)可以发现,在特征TCA为13~17 ℃时,该特征可以明确指示系统中含有不凝性气体,说明该特征对指示不凝性气体故障有重要意义.采用同样的分析方式可以发现,PO_net、PO_feed对指示冷凝器结垢、TO_sump对指示润滑油过量均有重要意义.
5 结 论
特征选择的结果表明,采用基于顺序向前选择算法的封装模型,从64个原始特征中筛选出22个最佳表征特征.进一步分析所选择的22个最佳表征特征发现,就所研究的7种典型故障而言,蒸发器侧参数比冷凝器侧参数更具表征性;FWC可以明确指示冷凝器水量不足故障;VE可以明确指示蒸发器水量不足故障;TCA对指示不凝性气体故障有重要意义;PO_net、PO_feed对指示冷凝器结垢有重要意义;TO_sump对指示润滑油过量有重要意义.表征特征一经选定,其余非表征性特征则不需要监控,从而大大减少了传感器种类和数量,降低了初始投入成本.
参考文献:
[1] 韩华,谷波,任能.基于主元分析与支持向量机的制冷系统故障诊断方法[J].上海交通大学学报:自然科学版,2011,45(9):1355-1361.
[2] 鲍士雄,陈丽萍.制冷系统故障诊断若干方法研究[J].制冷学报,1997(4):28-32.
[3] 马鸣远.人工智能与专家系统导论[M].北京:清华大学出版社,2007.
[4] 周平,钱积新.模糊推理方法在控制系统故障诊断中的应用研究[J].化工自动化及仪表,2005,32(1):23-25.
[5] 刘相艳,谷波,黎远光.基于并行感知器的制冷系统故障诊断分析[J].上海交通大学学报:自然科学版,2005,39(8):1233-1239.