基于TrAdaBoost的冷水机组故障迁移诊断*

2024-01-25 03:31叶晖云任正雄杨钰婷刘飞天

暖通空调 2024年1期

叶晖云韩华任正雄杨钰婷刘飞天

(上海理工大学,上海)

0 引言

随着碳中和目标的提出,能源体系正在发生巨大的变化[1]。受安装、运行维护及系统本身复杂性等因素的影响,制冷系统可能发生故障,带故障运行会引发能源消耗增加、舒适性下降等问题[2],周期性地对硬件进行维修有助于提高运营措施经济性和硬件运行性能[3]。以机器学习的方法进行制冷系统故障检测与诊断是十分有效的措施,但是训练一个性能优良的模型往往需要大量的数据,而收集大量已知类别的数据经济性较差,因此机器学习的方法往往局限于科研项目[4]。解决该局限性可以采用迁移学习的思路,将用于数据丰富对象的、经过训练和验证的机器学习模型,通过一定的迁移手段,运用到数据数量有限或使用年限较长的制冷系统中。近年来,迁移学习主要运用于建筑自动控制或能耗预测。Chen等人构建了基于深度神经网络的迁移学习模型,利用神经网络实现了自动控制[5];Fan等人利用源建筑能耗数据进行预先训练得到预测模型,使用不同的策略对目标建筑能耗进行了预测[6];Qian等人通过调试基于已知数据训练的TrAdaBoost(TAB)算法对建筑HVAC系统能耗进行预测评估,主要解决了系统中的能耗预测问题[7]。部分学者将迁移学习应用于制冷系统故障诊断中。Zhu等人提出用异构数据标准化处理原始数据集,并通过添加域适应系数使神经网络模型能迁移不同螺杆式冷水机组的信息,完成故障诊断[8];范雨强等人采用不平衡数据技术处理数据集,提取离心式冷水机组信息,采用迁移的方法实现了螺杆式冷水机组的故障诊断[9]。

目前的制冷系统故障诊断主要针对单台机组已有工况及故障数据进行,或者在不同机组间对已有故障信息进行迁移,对于新工况数据缺乏这一普遍问题鲜有研究。本文针对制冷系统新工况故障数据难以获得的问题,提出对数据集进行方差选择、调整分布、进一步挤压数据空间等多重处理,缩小不同工况数据之间的差异,并基于TAB算法提出不同基分类器的迁移诊断方法,应用于离心式冷水机组典型故障的迁移诊断,并进行了详细的对比分析,实现了从已有工况数据到新工况数据的故障迁移学习。有效实现了机组新工况数据匮乏时,利用已有工况信息改善新工况下的故障诊断性能,有望在保证故障诊断性能的前提下缩减实验成本。

1 基本原理

1.1 TAB算法

TAB算法是AdaBoost(AB)算法[10]在迁移学习上的衍生算法。AB算法利用boosting(一种框架算法)技术,通过不断迭代训练,将弱分类器(默认采用决策树decision tree, DT)通过规则整合成性能更优异的分类器。AB算法对属于同一域的数据集进行权重迭代更新,而TAB算法则可同时对源域和目标域数据集进行权重迭代更新,减小源域中与目标域中样本差异较大的样本的权重,增大相似样本的权重,从而提高目标域与源域的相关性,利用源域知识增强模型对目标域数据的诊断能力[11]。

TAB算法流程如图1所示,需要2个已有标签的训练数据集Td(different-distribution)和Ts(same-distribution)、未标记的目标域测试数据集S、1个基分类器Learner和迭代次数N,其中,Td是与S不同域的源域数据集,含n个数据,Ts是与S相同域的目标域数据集,含m个数据,n≫m。

图1 TAB算法流程图

算法初始化:

(1)

式中ω1,i为第1次循环中第i个数据的权重。

初始权重向量分布集,确保模型在迁移学习的初始阶段能利用源域已知数据知识进行一定正确率的诊断。设置学习率参数β,根据迭代次数建立N次的迭代循环:

1) 对每个权重进行归一化处理,即用每个权重除以权重总和,确保它们的比例保持相同,以使模型调用的权重在合适的范围内。

(2)

式中pt为第t次循环归一化后的权重;ωt为第t次循环的权重;ωt,i为第t次循环中第i个数据的权重。

2) 为了方便分类,定义1个基分类器,根据合并后的训练数据T(Ts与Td)及T上的归一化权重分布pt和未标记数据S,得到1个x→y的标签集ht。

3) 计算模型在Ts数据集得到的标签的错误率εt。

(3)

式中ht(xi)为第t次循环基分类器对数据xi进行诊断得到的类别;c(xi)为数据xi的真实类别。

4) 设定2个学习率参数。

(4)

(5)

式(4)、(5)中βt为第t次循环中目标域数据更新权重的学习率;β为源域数据更新权重的学习率,是一个与源域数据量n、迭代次数N相关的常数。

5) 更新下一次迭代的数据权重ωt+1,i。与目标域适应的源域数据具有更大权重;反之,具有更小权重。

(6)

6) 获得决策函数hf(x),最终的分类器将采用该函数对目标域数据集S进行分类。

(7)

本文针对制冷系统故障诊断中的输出进行了一定更改:将输出的二分类强分类器更改为经过迭代更新权重设置的多分类强分类器。

1.2 制冷系统故障诊断模型

基于TAB算法的迁移分类能力能够解决制冷系统诊断中新工况数据缺失的问题,因此选择它建立故障诊断模型。图2为故障迁移诊断模型示意图。

注:AB、RCV、RF为基分类器。图2 故障迁移诊断模型示意图

对包含源工况数据集与目标工况数据集的原始数据集进行数据清洗,分为包含大量源工况已知数据、少量目标工况已知数据的训练数据集与包含了大量目标工况未知数据的测试数据集。将经过多重数据处理的训练数据集、测试数据集用于基于不同基分类器(AB、RCV、RF)、通过TAB算法搭建的不同模型(TAB_AB、TAB_RCV、TAB_RF)以进行故障诊断。

其中,RCV算法的核心思想是利用最小二乘估计法,在离差平方和上增加一个L2范数的惩罚项,即正则化下的最小二乘法[12]。

(8)

式中x为特征矩阵;y为因变量;a为正则化参数;x为线性回归系数。

RCV算法内置交叉验证对正则化参数进行调整,避免过拟合,得到更加可靠稳定的分类器。

而RF算法是一种集成算法,其核心思想是建立多个不同的决策树模型组合成“森林”,通过每一棵“树”对数据的分类进行投票决策[13],得票最多的类别作为最后的输出结果。建立不同决策树,通过对训练集进行重采样,得到多个子训练集,每一个子训练集对应生成一个“树”。

利用诊断指标对上述3类不同基分类器的不同模型进行性能评价,在多个模型中选择1个表现优异的故障迁移诊断模型,对该高性能诊断模型内的基分类器参数进行网格寻优,使模型达到最佳诊断状态,再将测试数据集输入该诊断模型进行故障诊断,得到最优结果。

2 冷水机组故障数据

掌握设备运行状态是空调系统节能的前提[14]。故障数据来源于美国供暖、制冷和空调工程师学会与普渡大学合作的1个故障模拟项目[15]。该项目采用1台316 kW(90 rt)的离心式冷水机组,在27个不同工况下,对离心式冷水机组的正常运行及7类典型故障进行测试。诊断类别如表1所示,包括:冷凝器水流量降低、蒸发器水流量降低、制冷剂泄漏/不足)、冷凝器结垢、制冷剂中含不凝性气体、制冷剂过量、润滑油过量。其中:制冷剂泄漏/不足、制冷剂过量和润滑油过量3种故障随着循环直接影响到冷水机组各个部分的运行情况,称为全局故障;剩余故障均发生在冷水机组局部(不凝性气体主要聚集在冷凝器中),称为局部故障。

表1 冷水机组诊断类别

所得数据集包含64个特征参数,其中有48个特征参数通过传感器直接测量获得,另外16个特征参数通过计算获得。故障诊断数据随机提取,确保模型具有一定客观性和鲁棒性。

从27个工况中选取如表2所示的2个工况进行迁移诊断研究,对源域、目标域数据集下的有标记故障数据进行训练学习。其中工况a为源域数据集(源工况),工况b为目标域数据集(目标工况)。a、b 2个工况下各提取3 000组数据,均包括200组正常运行数据和2 800组故障数据(每类故障400组)。设置工况b中只有随机选取的20组数据是故障类型已知的,即有标记数据,其余2 980组均为测试数据。表3显示了常规故障诊断与基于TAB算法的故障诊断调用数据集的区别[16],体现了迁移诊断的思想,即把工况a 8个类别(正常和7类典型故障)的信息迁移到工况b中,用于诊断工况b下机组的各类故障。

表2 迁移工况热力参数

表3 不同方法调用的数据集的区别

3 TAB算法下的故障诊断

3.1 评价指标及多重数据处理

在故障检测与诊断中,可以根据实际类别、诊断类别(见表4)进行数据评价,表5给出了采用的评价指标及含义,分别为精确率、召回率、F1值及正确率。

表4 数据混淆矩阵

表5 评价指标介绍

由于所采用的数据具有64个特征,其中可能存在与迁移学习任务无关的特征,因而对数据进行多重处理,以得到具有适量特征、适合本次迁移学习任务的数据。特征工程可以最大限度地从原始数据中提取特征以供模型使用。将训练数据集进行转化,从而更好地向迁移学习模型描述潜在问题,提高迁移学习模型对目标未知数据诊断的准确性。

图3 多重数据处理过程

(9)

(10)

(11)

采用无处理、方差选择、标准化、归一化和多重数据处理方法分别对TAB_AB、TAB_RCV、TAB_RF 3种迁移后的模型进行性能分析,正确率如图4所示。可见,多重数据处理对于TAB_AB、TAB_RF 2种模型采用的是非线性的分类算法,辅助优化效果明显,说明多重数据处理方法对于具有较强复杂问题识别能力的模型具有辅助优化效果。此外,该方法优于其他数据预处理方法,相比于无处理时诊断正确率分别提高了9.61%、1.95%。对于TAB_RF模型,增益效果不如TAB_AB模型明显,说明多重数据处理方法对于性能一般的复杂模型增强效果更好。而对于TAB_RCV模型,其本质为线性回归、学习能力有限的模型,多重数据处理方法的辅助优化效果无法体现,甚至表现为削弱效果,因此,对于该类模型应尽可能保留数据原始信息。所讨论的迁移诊断性能分析均采用多重数据处理的方法进行操作。

图4 不同模型不同数据预处理时的性能对比

3.2 迁移诊断性能分析

基于3种基分类器构建的诊断模型的正确率如图5所示,通过对比新工况下未采用迁移诊断和采用迁移诊断的结果,可以直观地表明TAB算法对冷水机组新工况数据有限时提升故障诊断性能的有效性,其中,基于RF基分类器的模型提升性能最为明显。

图5 不同模型正确率

1) AB模型与TAB_AB模型的诊断性能对比。工况迁移前(仅采用目标工况的20组数据训练),AB模型正确率为51.58%;学习源工况3 000组数据中的信息,进行迁移诊断后,正确率为62.93%,提升跨度为11.35%,即相比于未经过迁移学习的模型,正确率提高了22.00%。迁移前后的混淆矩阵及评价指标对比分别如图6、7所示。工况迁移前,AB模型能够实现对制冷剂泄漏、冷凝器结垢、冷凝器水流量不足和制冷剂含不凝性气体4种故障的诊断,对于正常运行及其他故障均存在半数以上的诊断错误。从图7可以看出,迁移后模型对局部故障的F1值整体上升,但对全局故障的F1值整体下降,且通过图6可以看出正常运行与全局故障均诊断为制冷剂过量故障。可见,经过迁移学习后,TAB_AB模型对于局部故障能够实现精确诊断,但放弃了更为复杂的全局故障诊断能力。

图6 基于AB模型迁移前后混淆矩阵对比

图7 AB模型与TAB_AB模型评价指标对比

2) RCV模型与TAB_RCV模型的诊断性能对比。工况迁移前后正确率分别为75.15%和77.03%,提升跨度为1.88%,较迁移前提高了2.50%。迁移前后的混淆矩阵及评价指标对比分别如图8、9所示。工况迁移前,RCV模型能够实现一定程度上的冷水机组故障诊断。工况迁移后,从混淆矩阵主对角线上的值可以看出,除正常运行与制冷剂泄漏和制冷剂过量2种故障外,对于其他故障正确诊断样本均增多。从图9可以看出,除制冷剂含不凝性气体故障外,其余局部故障的F1值均得到提升,但正常运行与全局故障的整体F1值均降低。在迁移学习前,特别是制冷剂过量这种全局故障,存在着明显的漏警现象,经过工况迁移后,可以看出整体漏警现象得到解决,但是对于正常运行的正确诊断数量减少,F1值下降。

图8 基于RCV模型迁移前后混淆矩阵对比

图9 RCV模型与TAB_RCV模型评价指标对比

3)RF模型与TAB_RF模型的诊断性能对比。工况迁移前后正确率分别为69.81%和92.38%,提升跨度为22.57%,较迁移前提高了32.33%。迁移前后的混淆矩阵及评价指标对比分别如图10、11所示。在进行工况迁移前,RF模型诊断中整体漏警现象明显,将大量实际故障数据诊断为正常运行数据,且整体诊断性能一般。工况迁移后的TAB_RF模型,从源工况数据集获得足够的目标工况知识,对全局故障能实现较优的诊断。由图10可见,整体漏警现象得到优化,对于冷凝器结垢、冷凝器水流量不足、蒸发器水流量不足和润滑油过量的4种故障不再出现漏警现象。从图11可见,正常运行和各类故障的F1值均得到大幅度提升,且4种局部故障的F1值均达到100%,实现了精确诊断。

图10 基于RF模型迁移前后混淆矩阵对比

图11 RF模型与TAB_RF模型评价指标对比

以每个类别样本数量占所有类别样本总数的比例作为权重,将各模型各类别不同诊断指标进行加权平均,结果如图12所示。各模型加权精确率、加权召回率、加权F1值和总体正确率均得到了一定程度的优化,表明TAB算法通过利用源工况数据的知识能够有效帮助模型从不同方面提升性能,实现性能更佳的制冷系统目标工况故障诊断。迁移前,RF模型并不是诊断中的最优模型,迁移后,TAB_RF的各诊断指标均为最大值,表明TAB_RF模型是最适合迁移学习且诊断效果最佳的模型,因此,对该模型进行参数寻优,尝试进一步优化模型的诊断性能。

图12 不同模型对比

3.3 高性能模型参数寻优

调整模型复杂度在故障诊断研究中有其重要性[18]。由于采用的RF基分类器为默认参数设置,从模型复杂度考虑,TAB_RF模型性能仍有提升空间。为此,对RF基分类器参数进行寻优。影响RF基分类器的参数分别为:最大迭代次数、树最大深度、拆分内部节点所需的最小样本数和叶节点所需的最小样本数。采用网格搜索方式进行寻优,寻优范围及结果见表6。

表6 参数寻优结果

参数寻优后模型记为TAB_RFop,对冷水机组故障测试集进行诊断,并与参数寻优前的TAB_RF模型进行对比分析。TAB_RFop正确率达到95.30%,提升跨度为2.92%。混淆矩阵及评价指标对比分别如图13、14所示。

图13 参数寻优前后混淆矩阵对比

图14 TAB_RF模型与TAB_RFop模型评价指标对比

如图13所示,寻优前,TAB_RF模型将大量正常运行数据虚警为制冷剂泄漏故障数据,导致正确诊断正常运行的数据数量少,经过寻优后,该现象得到大幅度优化,正常运行的正确诊断数据增加。此外,从图14可以看出,经过参数寻优后的TAB_RFop模型的整体诊断性能上升,除制冷剂含不凝性气体故障的F1值降低0.13%外,正常运行和其他故障的F1值均得到不同程度的提升,其中正常运行与制冷剂泄漏故障的F1值显著提升,正常运行的F1值由60.49%提升至83.72%,制冷剂泄漏的F1值由77.97%提升至85.49%。

3.4 不同模式验证分析

冷水机组的运行工况复杂,需要在不同工况下验证迁移诊断对冷水机组故障诊断的有效性,因而增补目标工况c、d(见表7),并对比分析迁移诊断和常规(无迁移)诊断在单模式和全模式下的性能,各模式的训练及测试数据集见表8。其中,工况c的蒸发器出水温度与工况a相同,工况d的冷凝器进水温度与工况a相同,单模式与全模式诊断的主要区别在于训练数据采用单个工况抑或全部工况。例如:迁移诊断是前述利用了源工况信息改善目标工况诊断性能的诊断模型,其训练集包含源工况数据,如果是单模式,则训练集为源工况数据加单个目标工况数据,如果是全模式,则训练集为源工况加3个目标工况数据的合集,测试集为某个目标工况;常规诊断是不利用源工况信息、仅用少量目标工况数据进行模型训练的常规故障诊断,测试集与迁移诊断相同。

表7 增补目标工况热力参数

表8 不同模式调用数据集区别

迁移诊断采用TAB_RF模型,常规诊断采用RF模型,工况a数据为源工况,工况b、c、d为目标工况,不考虑参数寻优时不同模式的诊断性能如图15所示。可见,不论单模式或全模式,迁移诊断均较常规诊断性能有所提升,单模式的提升尤为显著,对目标工况b、c、d的故障诊断正确率分别提高了22.43%、18.39%、20.77%,表明数据种类不够丰富且数量较少时,更加需要利用迁移诊断学习源工况中的信息以提升诊断性能。全模式迁移诊断较常规诊断性能提升范围为1.21%～2.55%,幅度较小,因全模式中模型学习到的知识相对单模式更为丰富,常规诊断性能已较单模式有显著提升(21.66%～26.37%),即便如此,迁移诊断仍旧可以进一步提升其性能。

图15 不同模式正确率对比

此外,从图15还可见,参数寻优对于单模式下的迁移诊断模型具有辅助提升效果,正确率提升了3.06%,而全模式下迁移诊断模型的正确率却降低了4.23%。观察其训练正确率高达99.68%,表明在训练集的工况较多时,参数优化易使模型过拟合,太过严苛的模型参数不利于模型由训练集到测试集的泛化。

基于源工况知识与目标工况少量数据建立迁移模型是解决冷水机组新工况数据缺乏问题的有效途径,多个工况数据训练的迁移模型可以比单模式获得更好的诊断性能,在有多个工况故障数据时优先考虑全模式,不需要参数优化;只有1个源工况故障数据时,迁移诊断对目标工况(少量数据)的故障诊断性能有显著提升,参数优化可以进一步提升其性能。

4 结论

与传统故障诊断不同,本文针对冷水机组工况复杂、获得故障数据成本高导致故障诊断模型泛化性能差的问题,就冷水机组不同工况下的正常运行及故障数据,设计了1种基于不同基分类器的TAB迁移诊断模型,实现了新工况下故障的有效诊断。对于冷水机组包含正常运行和7类故障共8个类别在内的数据,源工况训练样本3 000组,目标工况(新工况)训练样本仅20组,通过迁移源工况中的故障信息,对新工况2 980组测试数据进行了故障诊断,得到以下结论。

1) 对原始稳态数据依次进行方差选择、分布调整、进一步挤压数据空间的多重数据处理是有效的,可以通过空间挤压缩小不同数据集之间的差异,增加相似度,改善迁移诊断性能。该多重数据处理方法适用于不同工况或不同对象间迁移诊断时具有较强复杂问题识别能力的模型。

2) 通过对比新工况下未采用迁移诊断和采用迁移诊断的结果,验证了TAB算法对于冷水机组故障诊断性能的提升效果。其中,TAB_AB、TAB_RCV 及TAB_RF诊断模型总体正确率的提升跨度分别为11.35%、1.88%、22.57%,分别达到了62.93%、77.03%、92.38%,TAB_RF的性能提升最显著,局部故障F1值均达到100%。

3) 对TAB_RF诊断模型进行参数寻优可以进一步提升冷水机组的故障诊断性能。相较于未经参数寻优的模型,总体正确率提升了2.92%,达到了95.30%,且提升了制冷系统故障诊断性能:优化了正常运行虚警为制冷剂泄漏故障的现象,正常运行与制冷剂泄漏故障的F1值分别提升了23.23%、7.52%,对整体故障的诊断性能进一步提升。

4) 增补了工况c、d数据,对比分析了单模式与全模式下,冷水机组故障迁移诊断与常规诊断的性能。单模式下迁移诊断较常规诊断正确率提升显著(18.39%～22.43%),全模式下提升幅度为1.21%～2.55%。迁移诊断能有效解决冷水机组新工况数据缺乏问题,在有多个工况故障数据时推荐采用全模式,且不用进行参数优化以免出现过拟合,可以获得更优的诊断性能。

总之,新工况下的故障数据较为缺乏时,利用多重数据处理及TAB算法,结合不同基分类器,特别是RF基分类器,通过学习并迁移旧工况数据中的信息,实现对新工况故障的有效诊断,是冷水机组故障诊断的新出路,在提升诊断性能的同时,可以缩减实验成本。