肖坤,李绍斌,谭泽汉,王江宇,陈焕新*,李冠男
(1-华中科技大学能源与动力工程学院,湖北武汉 430074;2-空调设备及系统运行节能国家重点实验室,广东珠海 517907;3-武汉科技大学城市建设学院,湖北武汉 430065)
近年来,多联机系统由于其节约能源、运行可靠、安装方便等优势在公寓、商场、写字楼等各类建筑中得到广泛应用[1-2]。但是多联机制冷空调系统一旦出现故障往往会导致系统节能性能降低、用户舒适性下降、经济损失、甚至安全问题[1-2]。而制冷剂泄漏就是其中的一种,制冷剂泄漏会给多联机空调机组的正常运行带来一系列不良的影响[3]。制冷剂向外部泄漏,会引起制冷剂充注量偏离最佳值,从而引起制冷量、制热量和制冷效率、制热效率的下降[4],同时,也会导致压缩机内部温度升高,导致润滑油的高温劣化和机械部件的磨损,甚至烧毁[5]。因此,对多联机系统制冷剂泄漏进行准确、实时、快速的故障诊断十分必要。
在多联机系统中,制冷剂泄漏的影响较大,而我国对制冷剂泄漏的检测大部分还是靠人工检测[6-7],不仅工作量较大,而且诊断正确率不高,同时无法保证实时检测。而利用计算机程序进行智能故障诊断不仅可以减少工作人员的工作量,而且还能在线监测机组制冷剂泄漏故障的发生,另外经过调试,故障诊断的准确率也可以有较大的提高。对于制冷空调系统的故障诊断目前已有一部分学者进行了研究,但是较少有人进行多联机制冷剂泄漏的故障诊断研究。吴勇华[3]研究了关于制冷系统制冷剂泄漏的故障诊断,但只是在螺杆式制冷系统中,其结构和故障诊断的方法与多联机系统存在一定的差异。
基于上述分析,本文对某型号的多联机系统建立决策树模型,并利用该模型进行制冷剂泄漏的在线故障诊断。由于多联机系统结构相对复杂[8],各部件传热关系和物理规律往往较为复杂,系统的工作工况较为多变,若建立物理模型较为困难,且模型数据量较大,执行难度较大。故本文采用数据驱动模型,即利用数据驱动算法决策树(Classification and Regression Tree,CART)来建立多联机制冷剂泄漏在线故障诊断的模型[9]。本文主要研究多联机系统制冷剂连续泄漏的过程,并设定虚拟制冷剂充注量(Virtual refrigerant charge,VRC)对实验过程中制冷剂状态进行实时监测[10-12],然后根据VRC 将机组运行状态分为制冷剂过充、正常、不足3 种状态,并通过数据处理和相关性分析,筛选变量建立决策树模型,从而进行故障诊断。结果表明,该模型能很好地利用于多联机组制冷剂泄漏的在线故障诊断,有良好的诊断效果。
决策树算法经过不断的发展,目前被广泛用于数据挖掘和机器学习领域,其利用一系列规则,将数据以树形结构的方式进行分类,而决策树算法中CART 算法使用得也较为广泛[13]。需要注意的是,在利用CART 算法建立决策树模型之前,需要进行数据处理,即相关性分析,利用数据之间的线性相关度去除冗余变量,从而选择特征变量用于模型的建立[14]。CART 模型的建立,往往分为2 个步骤,分别为决策树的生成和决策树的剪枝。
CART 算法适用于二元划分的思想[13],故而利用CART 算法所建立的决策树模型也是以二叉树为基本结构的,即每个父节点下面会有对应的2 个子节点。以CART 算法为基础建立的决策树模型如图1所示[9]。
建立决策树模型遵循“自顶而下”的原则,即从根节点开始建立,利用算法选取变量属性进行划分,直至所有叶节点中的样本属性属于同一类,或达到系统设置的阈值时,终止建树[9,15]。
图1 CART 算法建立的决策树模型结构
CART 算法的核心是用Gini(基尼)指数选取每个节点上的分裂属性,Gini(基尼)指数就是指数据的不纯净度,其表达式为[13]:
式中:
pi——S中样本属于i类占总样本的比例。
Gini 越小,说明该样本越纯净,二元划分的位置选取就更为合理,若Gini=0,则所有样本都属于一类。而对于样本集S,可以利用属性F 将该样本集分割成2 个部分,记作S1 和S2[13,16-18],为了确定划分效果,我们引用增益Δ(节点不纯度的差)来判定划分效果的好坏[17],即当某变量不纯度增益Δ 最大时,系统优先选取该属性进行模型划分,该属性划分的子树为最优分支。样本分割后的Gini(基尼)指数和增益Δ 可表示为:
式中:
N——该节点上的记录个数。
在CART 算法中,变量的重要性是由该变量作为决策树节点出现时所有不纯度增益和计算得到的[19]。
式中:
T——节点总数;
Nt——t节点中观测值的数量;
Δ(xj,t)——t节点中第j个变量的不纯度增益。
生成决策树模型后,为防止决策树过度拟合,需要考虑对树进行剪枝[18],从而提高该模型的简洁性和正确性。在决策树模型的剪枝中,有很多方法,包括最小错误剪枝MEP 法、悲观错误剪枝PEP 法、基于错误剪枝EBP 法和CART 算法采用的代价-复杂度剪枝CCP 法[17]。CCP 法自底向上进行剪枝,并利用树深参数控制剪枝,同时系统选取最优树,最后被剪枝。这样,既简化了决策树模型,又减少了各种数据的过适应,让模型能更准确地进行故障诊断[17]。
决策树模型建立完成后,本文欲对该模型进行评价,而CART 算法所建立的决策树模型往往采用分类正确率(Correct Rate,CR)衡量[9],即包含一切类别的所有样本被该决策树模型正确识别的比率。利用分类正确率CR 可以有效判定决策树模型对各种数据进行分类的能力,以及利用该模型进行故障诊断的准确性。
本文所研究的数据全部来源于如图2[9]所示的多联机机组中,该多联机机组与参考文献[9]中所用机组一致,由1 个室外机和5 个室内机组成。另外,其低压侧配备气液分离器[20],用于分离低压制冷剂蒸汽中的液滴,保证压缩机不出现液击现象。高压侧配置过冷器[20],配有电子膨胀阀(EEV),用于调节压缩机所吸入制冷剂气体的过热度和制冷剂过冷液体的过冷度。本文所研究的工况为制热工况,且该机组采用R410A 作为制冷剂,标准充注量为10 kg。该多联机系统在制热循环系统设置不同的传感器,用于获取机组实时运行参数,并通过监测运行参数、运算模块计算、转化EEV 开度指令及输出模块输出指令[20],实行对电子膨胀阀开度的控制。图中编号1-5 的线路[9]分别表示R410A 经过电子膨胀阀(EEV)节流后所在的管路(1)、R410A 经过压缩机压缩后所在的管路(2)、R410A 从高压侧引入然后导入位于低压换热器和气液分离器之间阀门的管路(3)、在制热循环中无用的管路(4)、回油管路(5)。本文所进行的实验以该多联机机组为平台,其室内环境温度20 ℃,室外环境温度7 ℃,在实验过程中,保持室内机5 台全开。
该多联机机组运行过程中制冷剂不断泄漏,从过充状态,即充注量高于标准充注量,一直缓慢泄漏至制冷剂不足状态,即制冷剂充注量明显低于标准充注量。而机组中的数据采集软件会每隔3 秒对机组各处传感器所显示的数据进行记录,并将其保存到PC 端。考虑到制冷剂充注量无法实时获得实际数据,故而本文采用虚拟制冷剂充注量VRC(Virtual Refrigerant Charge)代替实际充注量进行研究[10-11],并对实验过程中系统制冷剂状态进行实时监测,该虚拟制冷剂充注量VRC 的意义来源于参考文献[12]。本文利用实验记录的各种数据、各种变量之间的相互关系及专家知识获取实时的虚拟制冷剂充注量VRC[21-22],得到如图3所示的VRC曲线。如图所示,从整体上,VRC 随着时间的增长而缓慢减少,符合多联机机组制冷剂泄漏的实际情况。而VRC 的曲线明显存在一定的波动,经过原始数据的分析可知,其曲线波动是机组化霜所致,该多联机机组设有化霜电路,目的是防止室外机表面结霜而影响机组的制热能力[1-2]。由于机组化霜时,制冷剂逆流,部分实验参数会出现波动,且此时室外机由蒸发器改为冷凝器,室内机也随之改变,少数变量如模块高压、模块低压的意义也随之改变[1-2],故而利用专家知识所得的VRC 也会发生变化。化霜的时间相对较短,且考虑到制冷剂泄漏过程中时间的连续性,故本文不对化霜工况另作处理。结合理论分析和实际情况,本文将机组运行状态分为3类,分别为过充状态(VRC>130%)、正常状态(85%≤VRC≤130%)、不足状态(VRC<85%)。
图2 多联机组结构示意图
图3 虚拟制冷剂充注量(VRC)变化
本实验由于系统运行时间长、采样间隔短、传感器采样点较多,得到的原始数据的的数据量庞大。数据量过于庞大往会导致算法计算量大、运行的时间长、效率较低;而且,在该原始数据中存在许多缺失值、死值、高度线性相关的变量,这些变量对故障诊断的的贡献较小,甚至会影响在线故障诊断的正确率。所以,本文需要对该原始数据进行预处理。数据预处理往往包括数据清洗和特征变量提取。首先,将原始数据中的缺失值变量(观测值有一部分残缺)、死值变量(观测值始终保持为常数)、异常变量(观测值中超出实验正常范围)[14];然后,根据专家知识和实验本身的物理规律、变量的相互关系进行筛选变量,并对各种变量进行线性相关性分析[23],从而剔除高度线性相关的冗余变量[9];最后,提取以下13个特征变量:压缩机排气温度、压缩机壳顶温度、过冷器液出温度、过冷器气出温度、气分进管温度、气分出管温度、压缩机机电流、模块高压(冷凝温度)、模块低压(蒸发度度)、压缩机V 相电流、压缩机U 相电流、风机V相电流、风机U 相电流,并作为输入变量代入前文所建立的决策树模型进行在线故障诊断。
本文在提取了特征变量之后,需要实验所得的数据按泄漏时间进行均匀的分层抽样,选取3/4 的数据作为决策树模型的训练集,另外1/4 的数据作为测试集。并将训练集的数据代入决策树模型,利用CART 算法进行多联机制冷剂泄漏的在线故障诊断。
该决策树模型在建立的过程中,各变量起到了一定的作用,该故障诊断模型的变量重要度排序如图4所示。由图可知,模块高压(冷凝温度)、压缩机电流、模块低压(蒸发温度)和气分出、进管温度对故障诊断的重要度最为重要。对于模块高、低压(系统冷凝温度、蒸发温度)而言,根据检测前的理论分析,随着制冷剂的泄漏,从整体上看,系统制冷剂充注量和系统制冷剂循环流量均会减小,流入冷凝器、蒸发器的制冷剂量逐渐减小,冷凝压力、蒸发压力减小,故而模块高压(冷凝温度)、模块低压(蒸发温度)自然随之降低[2]。对于气分出、进管温度,由于制冷剂的泄漏,系统充注量和系统制冷剂循环流量减小,室外机内流入的制冷剂量减小,其中的相变换热会减小,其单位质量的制冷剂的显热换热量会增大,气液分离器进管处制冷剂过热度随之增加,气分进管温度自然也会增大。而制冷剂循环流量的减少,也会导致气液分离器中换热量的减少,故而气分出管温度会随着进管温度的增大而增大[2,24]。然后,就压缩机电流而言,制冷剂泄漏导致制冷剂循环流量的减小,又由于压缩机压比基本不变,压缩机功耗降低,所需的电能自然随之降低,压缩机电流减小[2,24-26]。模块高压、模块低压、气分出、进管温度和压缩机电流这些重要的变量,从理论上,都与机组制冷剂泄漏直接相关,所以,本模型的变量重要度和变量的整体趋势与理论分析一致。
图4 制冷剂泄漏故障诊断模型中变量重要度排序
本文利用CART 算法,以训练集数据为基础,建立了制冷剂泄漏的在线故障诊断模型,该决策树模型如图5所示。很明显,算法优先选取气分出管温度和模块高压作为分裂节点属性,如上所述,该分裂属性的选取来源于Gini 指数[13,15],即表明气分出管温度和模块高压(系统冷凝温度)对系统的不纯度增益是最大的。根据该决策树模型,我们可以提取其中的规则:当气分出管温度小于8.5 ℃且模块高压(冷凝温度)大于等于40 ℃时,系统处于过充状态;当气分出管温度小于8.5 ℃且模块高压(冷凝温度)小于40 ℃,系统处于制冷剂量正常状态;当气分出管温度大于等于8 ℃,系统处于制冷剂不足状态。理论上,气分出管温度和模块高压的物理意义如上所述,随着制冷剂的逐渐泄漏,气分出管温度会逐渐降低,模块高压会逐渐增高,故而该决策树模型规则与理论分析一致。从整体上看,该决策树模型中的规则与多联机制冷剂泄漏的实际情况较为吻合,且由图中可知决策树模型判别结果也较为准确。
图5 制冷剂泄漏故障诊断决策树模型
本文利用CART 算法对多联机机组进行制冷剂泄漏的在线故障诊断结果如表1所示,其为决策树模型对多联机制冷剂泄漏过程中制冷剂过充、正常、不足状态的各组数据进行分类所得到的混淆矩阵[23]。依上文所述,CR 是指正确分类的数据占总数据的比例[9],该多联机机组故障诊断的分类正确率为94.3%。所以,本文所作的决策树模型能较好地用于多联机制冷剂泄漏的在线故障诊断,模型的诊断结果与实际情况较为一致,在线诊断的正确率较高。
表1 制冷剂泄漏故障诊断结果的混淆矩阵
本文以多联机机组为研究平台,提出了一种基于决策树算法用于制冷剂泄漏的在线故障诊断方法。本文先根据CART 算法原理,建立了决策树模型,然后,对实验数据进行了预处理后,利用决策树模型对多联机机组的实验数据进行了分类。得到以下结论:
1)本文用专家知识所得到的VRC(虚拟制冷剂充注量),可反映机组化霜情况,也可有效模拟实际的制冷剂充注量,并对机组制冷剂量进行实时监测,可有效用于制冷剂泄漏的在线故障诊断;
2)本文利用CART 算法所建立的决策树模型能有效、实时地对多联机制冷剂泄漏进行故障诊断,且诊断正确率较高,与实际情况吻合得较好;
3)气分出管温度和模块高压可用于区分多联机制冷剂泄漏过程中制冷剂过充、正常和不足的状态,且压缩机电流、模块低压和气分进管温度也对故障诊断较为重要。