姜智堯,黄巍,薛扬帆,杜志敏,晋欣桥
(上海交通大学制冷与低温工程研究院,上海 200240)
建筑行业主流方向面向智能建筑发展,在当今获得全面应用。暖通空调作为智能建筑核心组件[1],高使用频率导致大量能耗。居住建筑能源消耗结构主要由户内环境、居住行为和公用设施构成,根据相关研究,中国夏季普遍地区空调制冷能耗大,部分达到30%以上[2]。而高能耗的原因除了建筑结构设计不合理(如大量玻璃窗的使用)、机组日常运行偏离高效运行点外[3],还有常规控制器功能与模式单一,无法根据场景及时调整机组的调节与控制。对于企业,暖通空调在长期运行中,积累大量历史数据,数据利用也成为各大空调企业亟待发展的项目。采用开放通讯协议,结合嵌入式软硬件,对智能建筑发展有正面作用[4]。从设备侧到用户侧的完整系统[5],能解决现行企业控制器局限性。
本文基于智能软硬件以及实际机组探索制冷剂故障的重要影响因素,包括下面几个部分:1)在原始庞大数据样本上应用预处理与特征工程方法[6],消除相关性较低的特征变量减少计算量,加快计算速度;2)用不同的回归机器学习方法进行预测,筛选出最优的预测方法建立最终预测模型[7];3)基于单片机,开发面向冷水机组实时数据采集系统;4)结合云端数据库及可视化界面,建立通用数据库;5)设备应用于屋顶机空调进行诊断。
本文实验对象为Quantum单冷屋顶机,系统原理如图1所示。该系列产品包括3个平台,仅在压缩机型号与机组吨位有所差异,研究选用40~55 t(双系统)的最大一台机器进行测试,此型号机组采用电子膨胀阀,控制器可以计算压缩机质量流量,采用双压缩机双回路设计,选用VZH170型压缩机和CSHD142型压缩机组成,采用R410A制冷剂,额定冷量为20.0 kW和34.7 kW。
图1 屋顶机空调系统原理
传感器测点:室内送回风干湿球温度、室外送回风干湿球温度、吸排气温度、压缩机频率、电子膨胀阀开度和吸排气压力等共12个变量。
现今工业级空调系统基本具备运行监控,但普遍仅有数据可视化和简易故障检测(部分参数的阈值判断),许多故障诊断是基于规则以及简易数据驱动的神经网络算法,结合物联网,远程监控系统可串连用户、厂家和设备三方,节约能源外,当有故障风险或出现故障,可生成报告文件,经由用户授权传递到厂家,维修人员可根据监控系统反馈的运行状况及早判断故障可能原因。
引入不同故障数据和正常运行数据建立故障诊断模型[8],会产生大量计算量[9],核主元分析法(Kernel Principal Component Analysis,KPCA),用核函数替代原数据,提高非线性映像,对未训练样本缺乏感知性,故引入KPCA结合多层感知器(Multilayer Perceptron,MLP)神经网络感知器算法[10],其带有非线性激活函数,对线性不可分数据进行识别,解决分类问题,增强辨识率。
多数情况下,变量间存在相关性,用神经网络算法处理,对分析带来不便,盲目减少指标会损失很多信息,容易产生错误的结论,对参数进行降维是常用手段,减少分析参数时,保留原信息损失[11]。
KPCA主要由主成分分析(Principal Component Analysis,PCA)衍伸而来,PCA的降维原理为考虑n个样本观测点[12],x1、y1两个变量间存在较高相关性。如果分别计算两变量在n个样本方差,按特征选择方法,任意舍去变量都将会丢失大量信息。将坐标轴旋转角度为θ,使新坐标轴位于长边,构成新坐标系x2、y2,此时x2方向包含绝大多数信息,此时删去y2变量信息损失可降到非常低[13]。
PCA定义为:
式中,Wi为变换矩阵;λ为变换矩阵对应的特征值。
但直接进行线性映像可能导致效果不够理想,PCA只对原始数据进行了旋转操作,这是由于其寻找的是数据“主要分布方向”,因此引入核方法进行升维生成非线性映射[14],以此KPCA可将原始数据投影至线性可分情况,非线性映射函数代入PCA后形成高维空间中PCA,用核矩阵K(为对称矩阵)替代,构成高维空间的子空间,核矩阵使用高斯径向基函数,而KPCA降维后的向量具体如下:
式中,xnew为高维空间的样本;φ(x)为非线性映射函数(隐性);α为核矩阵K(x,xnew)的特征向量;K(x,xnew)为核矩阵(为对称矩阵)。
在进行KPCA处理前,选用预处理方法中标准化方法对原始数据中的每个特征列进行处理。并由皮尔逊相关系数计算,得到特征之间相关系数[15],皮尔逊相关系数定义为:
可得知目标特征与其他特征的相关系数,先选取与目标特征较高相关性的几个参数,并进行参数间的比较,参数间相关系数越接近于0,表示两者线性相关性较弱,因此可皆保留,以维持数据的丰富性,参数间相关系数越接近于1,表示两者高度线性相关,可考虑舍去其一,藉此降低计算量[16]。
例1:南京金陵饭店,明慧敦厚、婉约热忱、细意浓情的服务在国际酒店业倍受赞誉。尊贵宾客、高端商务、精英会议已然将金陵饭店视为首选。
多层感知器是一种前向传递类神经网络,使用非线性近似将数据分类或进行回归运算,实现非线性判别式训练,在对经由KPCA简化的特征属性进行训练,加强监督式规则提取,可提高识别率。
MLP包含3层结构,每个神经元在隐藏层根据前一层输出的结果进行偏置,随后将总和使用非线性活化函数做Sigmoid function转换,然后输出到输出层,最后隐藏层输出再进行转换形成输出值。
式中,G(X)为softmax逻辑回归模型;S(X)为隐藏层的输出,sigmoid函数;B1和B2为隐藏层/输出层偏置;W1和W2为隐藏层权重(连接系数)。
其中标准softmax逻辑回归模型为:
其中sigmoid函数:
对于建立具体问题,参数确定使用了lbfgs:quasi-Newton方法优化器[17],随机初始化所有参数(输入层权重和隐藏层偏置),进行迭代训练,不断计算梯度和更新参数,隐藏层到输出层是多类别标签离散值预测,即softmax回归,输出层权重通过最小化由训练误差项和输出层权重范数正则项构成损失函数,依据广义逆矩阵理论计算解析求出,直到满足设定条件[18]。
图2 基于KPCA-MLP的故障检测方法流程
暖通空调系统作为楼宇自控的子系统,不同厂家有各自独立的系统,导致不同设备间难以通信,空调系统除了厂家自身系统,还提供部分权限,藉由主流通信协议,例如BACnet、LonWorks和Modbus,建立通用远程控制系统,以兼容这些设备。
机组系统的控制器设置在设备侧,选用轻量单片机,有独立的操作系统,其中设备具备数个模块。数据读取/存储模块,通过Modbus协议从设备读取到数据,利用JSON值格式传递方式,将数据转为矩阵形式;故障诊断模块,基于Python程序,从数据读取模快,读取程序需要的特征,使用机器学习预测制冷剂泄漏量,以机组运行状态作为输出;多线程模块能分离数据处理系统和交互系统的程序执行,避免单边系统长时间停滞,避免冲突。
图3所示为基于KPCA-MLP的远程监控系统。由图中4个模块共同建立远程监控系统,左上角为机组现场侧,由集成化的单片机硬件构成的数据采集设备经由预先编入硬件的故障诊断算法,数据将在本地保存纪录文件后,进由TCP/IP数据传输至云端服务器进行保存,藉助于云端服务器较佳算力,引入更多数据训练集进行故障诊断,将用户需要的数据进行可视化,建立基于用户的客户端,用户在验证后即可有权限获取其可访问的机组内容和其运行数据,网页主要设计以冷水机组远程监测平台,能直观监测机组运行状况,经过基于机器学习算法的“故障检测程序”将结果通过用户界面传递给用户。
图3 基于KPCA-MLP的远程监控系统
本节将验证本文所提出的方法,针对取得数据的实验和为了测试硬件所进行的实验进行介绍,以及本文所需而制作的智能诊断盒的软硬件介绍,在不同工况的实验下,获得数据进行训练与验证。
所有模型的评估指标均采用均方根误差得到每组KPCA降维数均方根误差值(图4),最终采用4维;3维时由于降维过度过多信息量丢失,导致后续欠拟合情况,5维和6维虽整体效果较好,但高维会加大计算量,因此在不发生数据欠拟合的情况下,选择最低维数为原则,在隐含层神经元数为17时最佳,均方根误差为0.721%,虽神经元数为35时得到更低误差,但是计算量增加,对预测无法有显着提高,最终选择隐含层神经元数为17。
图6 测试模型的均方根误差值
表1所示为5种工况下的系统数据。考虑不同压缩机频率下系统状态,表2所示为压缩机在每种工况下的状态和转速设定值。对测试数据判定和选择,去掉不合理数据。
表1 5种工况下的系统数据
表2 压缩机转速设定
由部分实验数据训练而得的模型,再引入机组实际运行数据,在经过验证的模型中进行测试,实际运行故障检测的正确率结果如图7所示。
图7 不同KPCA降维数下实际运行充注量检测的正确率
本文实验来自江苏一处工厂的实际运行数据,在与工厂机组完成通讯后,读取机组的运行数据进行验证,根据测试可进行秒级通讯,但对现场应用意义不大,诊断前先进行稳态数据判别,当前若是暂无稳态工况则跳过此轮诊断,以节省运算效能。
在实验平台中建立的初始故障模型与正常运行工况模型,在模型初期有较大误差,经由设备运行数据引入,误差最后下降到5%以内,体现模型优势和在线自学习效果。图8所示为数据采集装置。
图8 数据采集装置
为了避免受到机组运行环境影响,在现场能及时使用,设计了封装用的外盒,集成线路组件、接口、显示屏以及网络模块(图8),可实时显示采集数据并生成图表形式提供现场工程师使用,于后板设计槽板,并预留一定空间作为扩展。
本文研究了基于KPCA-MLP的算法应用于制冷剂泄漏诊断,并分析了基于附加软硬件的智能诊断可行性,得出如下结论:
1)使用KPCA-MLP的算法,并使用于实验室进行的四种制冷剂故障等级、64种不同运行工况,约27 000组的制冷剂故障数据进行训练,引入实际运行数据进行诊断,得到95.83%的正确率;
2)建立具备数据实时传输以及在线自学习故障检测的远程管理系统,能提前警告用户设备可能出现故障风险,提前干预及检测设备,硬件经集成化设计,减少机组改装成本,可适配大多数机组;
3)由于运行设备的限制,无法引入其他真实故障,但对于正常的运行数据预测已具备一定能力,之后工作将引入更多故障类型的诊断、多设备联合数据分析、信息保护以及人机交互。