赵丹,范波,Kushnazarov FARRUH
(美的集团暖通与楼宇事业部,上海 201702)
单元式空调广泛应用于家用和商用场所,与人民生产和生活密切相关,所以其系统运行的稳定性和高效性至关重要[1]。云技术在近些年得到了迅猛发展,单元机空调的实时运行状态参数可通过网络上传到云平台上。为了充分挖掘云平台数据价值,基于数据的线上空调故障诊断是一种主要应用方向。而在基于数据的故障诊断方法中,空调运行状态的异常检测是故障诊断的基础工作。
基于云数据的单元式空调的异常检测具有如下价值:1)可以在机组运行早期就及时发现问题,从而避免机组进一步的损坏,提高机组的可靠性;2)降低潜在维修成本,避免部件的不可逆损害;3)降低故障诊断和维修周期,异常运行数据提早发现,然后再通过对异常数据的分析诊断,精确故障定位,进而实现提早精准备件,及时维修;4)降低人力,基于机器学习的诊断算法代替人工经验判断,对于海量的数据,可大幅解决人力成本;5)提高售后服务质量,通过节省人力、物力和时间,可大幅提高售后服务效率,保证设备在整个生命周期内高效并安全运行,实现“无打扰”维保。
导致单元式空调异常运行的原因是空调发生了故障。按照故障产生原因可分为磨损性故障,错用性故障和固有的薄弱性故障;按照系统功能丧失程度分为永久性故障、非永久性故障;按照故障发生速度可分为突发性故障和渐发性故障。空调系统的故障主要包括传感器故障和热力系统故障,传感器的故障包括固定偏差、漂移故障、精度下降和完全失效等;热力系统故障包括制冷剂泄漏、换热器脏堵、风机故障、压缩机失效、系统效率下降等[2-4]。
对于空调系统异常检测,目前的研究主要集中在空调设备的故障诊断方面。KARAMI 等[5]提出了一种用高斯混合模型方法。VERBERT 等[6]采用贝叶斯网络开发了诊断模型。在能耗异常处理方面,广泛采用3 种方法。第一种是利用统计学方法设定阈值。刘丹丹[7]利用回归分类算法,在基于统计学算法设定每个类别的阈值,进而识别异常能耗。第二种是基于聚类算法检测离群数据,刘丹丹等[8]提出的方法不仅能检测出异常,还能给出离群程度。卿晓霞等[9]利用决策树算法识别异常能耗日用能模式,将每小时的平均能耗和最好能耗作为特征向量,再利用离群点检测算法(Local Outlier Factor,LOF)判定异常。第三种方法是通过对比模拟的基准数据和实际数据的偏差来判定异常,庄池杰等[10]采用主成分分析(Principal Components Analysis,PCA)算法进行降维,然后提出一种基于网络的LOF 算法异常检测。简富俊等[11]使用了一类支持向量机无监督机器学习方法对电力用户负荷异常进行检测。
空调设备云平台每时每刻都有大量数据产生,这样大数据、维度高、范围宽成为数据挖掘的难点。现有异常检测方法,虽然可靠性高、计算精确,但计算资源耗费高,更适合小样本、分类不均衡的环境[12-14]。另外,现有的异常检测算法多为对正常样本描述,会出现大量的误检和漏检情况。
孤立森林(Isolation Forest,IF)是一种高效的非监督的异常检测算法[15]。它利用异常点少、异常点特征值和正常数据差别大的特点来孤立异常点。此算法时间效率高,可处理海量数据。现有的基于云数据的异常检测,数据量大、维度高、要求计算资源小以及运算速度快。因此,孤立森林方法比较适合基于云平台的空调异常检测。
云平台上可采集大量的单元式空调运行数据,但合理应用此数据做异常检测还存在以下挑战:1)云平台的数据中标签化的异常数据非常少,所以无法采用监督的学习方法,只能采用无监督学习;2)出于成本原因,单元式空调器上布置的传感器非常少,导致上传到云端的数据点极少,进而用于异常判断的特征量较少;3)单元式空调的运行参数变化速度快、变化幅度大,这也增加了异常检测的难度;单元式空调器的种类多样,安装条件多样,对异常诊断模型的泛化能力和迁移能力也提出了挑战;4)现有的机器学习算法对计算资源要求高,能够适用于工程应用的算法较少[16-20]。
为了高效及时检测出单元式空调器的运行异常,满足工程中实际应用需求,部署在云平台上的异常诊断算法需要满足以下要求:1)尽可能检测出系统的运行异常;2)不允许有误报,因为误报会导致维修人员额外工作量,造成资源浪费;3)泛化能力强,可适用于不同类型、不同工况、不同安装条件的各种单元式空调器;4)检测周期不应超过12 h,保证问题可以当天处理完成。本文的研究目的在于开发满足以上需求的基于云数据平台的单元式空调器的异常检测方法。
针对在实际工程中很难获得标签化的异常数据的困难,本文提出了采用基于物理仿真模型生成大量正常和异常数据进而训练模型的思路。
针对单元式空调的运行参数变化速度快、变化幅度大、种类多样以及安装条件多样等情况,对异常诊断模型的泛化能力和迁移能力提出了挑战。本文提出在数据生成时穷举全运行范围数据进行模型训练,同时在特征工程中,采用基于专家经验,生成独立于机型和运行工况的新特征参数,进而提高模型的泛化能力。
基于云端数据的线上单元式空调器异常诊断方法具体开发思路如下:1)建立基于物理特性的单元式空调器仿真模型,仿真模型可以准确反映工况和控制变化对运行参数的影响趋势;2)基于实验数据对仿真模型修正,使仿真模型精度满足要求;3)再根据修正的仿真模型在空调器运行的全工况范围内生成正常运行数据和异常数据;4)针对生成的仿真数据,进行数据分析,包括数据关联度分析,敏感性分析,找出对系统运行异常比较敏感的特征和其关联性;5)基于专家经验,对选取的特性参数泛化处理,生成独立于工况和设备尺度的新特征;6)通过反复调参测试,找出性能最优的模型算法;7)采用实际云端数据验证异常诊断算法的有效性。具体如图1所示。
图1 异常方法开发思路
选取普遍应用的单元式空调器,由1 个压缩机、1 个翅片管式冷凝器、1 个翅片管式蒸发器、1 个电子膨胀阀、2 个风扇和其他电控部件组成。本文选取的单元机额定制冷量为11,546 W。
选用稳态基于物理公式的建模方法对此单元式空调器建模[21],然后采用标准工况下测试数据对模型进行修正,修正后模型预测换热和功率的误差在2%以内。模型的输出参数选取实际工程中可得到的参数,包括室内机进口空气温度(℃),室内机进口空气相对湿度(%),室外机进口空气温度(℃),室外机进口空气相对湿度(%),室外机盘管进口温度(℃),室外机盘管中间温度(℃),室外机盘管出口温度(℃),压缩机排气温度(℃),压缩机吸气温度(℃),排气压力(Pa),吸气压力(Pa),吸气压力对应饱和温度(℃),排气压力对应饱和温度(℃),室内机盘管中间温度(℃),室内机出口管壁温度(℃),压缩机转速(r/min),压缩机功率(W),压缩机电流(A),室内机风扇功率(W),室内机风扇转速(r/min),室外机风扇功率(W),室外机风扇转速(r/min)。
数据的工况范围需要覆盖全面运行工况,室内温度最低为14 ℃,最高为33 ℃,相对湿度最大为100%,最小为10%;室外温度最低为-30 ℃,最高为45 ℃,相对湿度最大为100%,最小为10%。
对于异常数据生成,选取常见的压缩机、风扇、内外换热器故障以及制冷剂泄漏下的性能数据。压缩机效率下降,由下降5%到下降50%;风机效率下降5%到下降50%;内机换热器脏堵率由5%到90%;外机换热器脏堵率由5%增至90%;制冷剂泄漏量由5%到泄漏50%。
按照以上范围均匀生成正常数据和异常数据,共生成50,988 组正常数据和3,136 组异常数据,其中单一故障导致的异常数据占总数据量的4%,混合故障导致的异常数据占总数据量的2%。
为了增强模型的泛化能力,使特征参数尽量独立于工况和空调型号大小,新特征包括压缩机排气过热度、吸气管过热度、压缩机压比、内机盘管进口空气温度与吸气口饱和温度差、排气压力对应饱和温度与外机盘管进口空气温度差、吸气压力对应的饱和温度与排气压力对应的饱和温度差、外机盘管进口空气温度与冷凝温度差、内机盘管温度与蒸发温度差、压缩机功率与转数三次方之比、风扇功率与转数三次方之比等。
基于生成的仿真数据,可得出所有基本特征和新增特征对空调系统运行异常的敏感度,进而可根据各特征对空调异常度的敏感性,优选特征集,得到更精确的预测模型。通过数据分析,所有基本特征和新增特征对空调系统运行异常的贡献度敏感度可计算得出。根据以上敏感度分析可知,室外机环境温度、压缩机排气温度、吸气温度、压缩机功率、冷凝器管壁传热温差、内机风扇功率系数和蒸发器管壁传热温差对系统运行异常都相对敏感。
常用的异常检测算法包括:孤立森林、基于角的离群点检测、基于聚类的局部离群因子检测、基于直方图的离群点检测和K近邻。将正常和异常的仿真数据用于训练和测试各算法,测试结果如表1所示。检测效果的评价指标为异常点检出率和检出异常点的准确率。异常点检出率指模型正确检测出的异常点数占总实际异常点数的百分比;检出异常点的准确率指正确检测出的异常点数占总检测出异常点的百分比。两个指标越高,说明检测效果越好。各算法测试结果显示,孤立森林在异常点检出率和检出异常点的准确率均有绝对优势。
表1 异常检测算法检测效果比较
为了评估不同特征组合对训练效果的影响,本文选取4 种特征集。特征集a 仅包括原有的设备可采集到的特征参数,不做任何处理;特征集b 仅包括处理过的特征参数;特征集c 包括处理过的特征参数以及部分敏感度较高的原特征参数;特征集d仅包括敏感度比较高的处理过的特征参数。
为了评估不同特征集的检测效果,本文分别采用不同的特征集训练模型,得出的各特征集检测效果如表2所示。可知特征集b 综合指标最好,特征集d 综合指标最差,主要因为此特征集特征数最少,但其综合指标与最好的特征集b 也相差不多,说明在测量特征少的情况下,也可以采用特征集b。
表2 不同特征集的检测效果比较
从云平台选取广东某办公楼空调运行数据验证本文提出的异常检测算法,在设备运行12,000 h后将制冷剂释放25%。采用本文方法进行异常检测,采用特征集b 训练模型,可成功检测12,000 h后的异常状况,进而证实此方法有效性。
本文提出了一种基于孤立森林方法的单元式空调器在线异常检测方法,得到如下结论:
1)在数据方面,针对带有标签异常数据难于获取问题,提出通过修正的仿真模型生成数据的方法,可生成大量的正常和异常数据用于检测模型训练和评估;
2)在算法方面,通过对孤立森林、基于角的离群点检测、基于聚类的局部离群因子检测、基于直方图的离群点检测和K近邻等现有异常检测模型评估,发现孤立森林方法在异常点检出率和检出异常点的准确率都占有突出优势,检出率在25%以上,检出正确率在67%以上;
3)在特征选择方面,为了提高模型的泛化能力,提出了基于工程经验和物理意义的新特征;应用新特征可在保证模型精度的前提下简化特征变量数,同时提高模型的可移植性;
4)采用现有云平台数据训练孤立森林模型,可成功检测出制冷剂泄漏的异常情况,证实了方法的有效性;
5)本文开发的方法在单元式空调器上得到验证,此方法还可推广到多联机等其他空调设备上;文中仅采用了一种孤立森林模型用于异常检测,后续将考虑采用模型融合方法进一步提高检测精度。