基于大数据的我国公共建筑空调负荷预测的研究进展

2019-03-14 16:09:38彭献永王波波张骞
安徽建筑 2019年4期
关键词:能耗空调负荷

彭献永,王波波,张骞

(1.艾默生过程控制有限公司,上海 201206;2.华电内蒙古能源有限公司土默特发电分公司,内蒙古 包头 014100;3.江森自控日立空调科技(无锡)有限公司,江苏 无锡 214000)

1 概述

2008年修订的我国《节约能源法》新增对公共机构节能管理要求。随着《公共机构节能条例》2008年10月1日施行,公共机构节能需要在政府机关的积极推动下走在全社会前列,从大量的基础性、示范性的能耗统计、审计工作和约束性的节能管理[1-3],转轨到法制化的刚性管理上来。国家机关办公建筑及大型公共建筑节能工作进入了快速发展的新阶段,各省市机关办公建筑和大型公共建筑相继安装分项计量系统,搭建公共建筑能耗监测平台。从2010年起,深圳市、上海市、江苏省等开始逐步建立城市级公共建筑能耗监测平台。这些公共建筑能耗监管平台在运营过程中积累了大量数据,既便于公共建筑节能管理工作的开展,也为公共机构节能的科学研究和政府制定政策提供数据支持。同时,公共建筑能耗监测平台中的分项计量不仅提供了建筑设备详尽的用能数据,而且建筑自控系统记录的运行数据可以真实反映建筑的运行状况。目前已有较多应用分项计量数据与系统运行数据都已表明,建筑暖通空调的能耗占建筑物总能耗的50%~60%以上,而建筑空调能耗中的55%又是冷热源系统能耗。因此,从微观层面看,建筑空调系统节能运行优化以及控制策略及时有效实现,都需要对空调负荷进行提前预测;从宏观层面看,加强建筑负荷预测对于推进公共建筑能源管理和参与到电力需求侧的需求响应管理,优化电网对公共建筑电力资源配置,具有重要意义。

基于大数据的建筑冷(热)负荷预测,从研究方向上可以归纳为2个方面,即数据预处理、负荷预测算法的应用。本文围绕这2个方面,对现有的大数据技术在建筑冷(热)负荷预测的研究进展进行考察和总结,对已有的不同预测技术进行分析,同时也对大数据技术在大型公共建筑冷(热)负荷预测领域未来发展做出展望。

2 建筑能源大数据的预处理

针对建筑能源数据的特点,如建筑数据量大、数据质量不高,需要有针对性的数据预处理方法。数据质量主要体现在部分数据缺失、异常值等方面。在其他方面,对于缺失数据、异常数据经常采用删除整条数据(所有数据属性),或者以均值、中位值和众值等简单统计量填充替换的方法。显然,从保持数据多样性、充分利用数据中的其它可用属性角度考虑,直接删除和简单填充数据的方法大多时候都不能适用于建筑能耗监测大数据的数据预处理。

文献[4-6]应用小波分析算法对数据进行筛选。小波分析方法在处理大数据中的噪声数据具有很好的适用性和很高的效率。文献[7-8]应用数据挖掘的算法对建筑能耗监测数据中的异常值进行识别与修复,采用基于KNN算法的缺失数据填充、K-Means聚类的数据异常值和噪声值识别(数据质量判断)与基于PCA算法的多维度数据降维。

值得指出,上述研究多是具体场景下某些数据集合下的数据预处理,缺少对数据预处理方法的普遍适用性等问题的深入研究。例如对于常见的异常数据的识别与清洗算法:(K-Means算法)在数据预处理过程中易受异常值的影响;KNN算法对计算性能要求较高;而小波算法的耗时较长、效率较低。以上算法都有自身的适用性和局限性,如何改进这些算法在处理大数据的性能和适用性是将来进一步的研究内容。

3 建筑冷(热)负荷预测技术

建筑运行阶段空调负荷是指制冷(或采暖)设备为满足空调系统运行所提供的冷(热)量,它比理论的空调房间冷(热)负荷更为复杂,不仅受室外气象、围护结构、建筑使用状况的影响,还受到空调系统的容量、控制调节等因素影响。建筑运行阶段空调负荷预测的主要目的是为了预测建筑物的冷(热)负荷求及用电量,是空调系统节能优化控制的基础,是随着空调系统复杂化和节能减排的需求发展起来的,将会给空调系统节能运行带来明显效益。由于建筑空调系统运行负荷的复杂性,空调负荷数据序列始终表现出非线性和动态特征,因此负荷预测一直是国内研究的难题和热点。

目前国内建筑负荷预测研究主要集中在模型输入变量和建模方法两方面。以建筑冷负荷为例,在影响冷负荷预测的输入变量上,对气象参数、时间特征数、建筑使用状况、冷冻水温度等影响因素的选择进行定量研究。在建模方法方面,主要归纳为三大类:①统计多元回归模型,代表性的有ARMA,GARCH等,它们主要应用于线性回归场合;②浅层网络模型,代表性的有人工神经网络(ANN)、支持向量机(SVM)、高斯过程(GP)模型等,它们既可用于线性回归,也可用于非线性回归,而且基于核技术的支持向量机和高斯过程在回归领域得到了广泛应用;③深度多层网络模型,代表性的有深度自编码网络(DAEN)、深度信念网络(DBN)等,它们对回归影响因素进行学习,得到稀疏化的影响因子集,这样可提高在线回归速度。

3.1 统计多元回归线性模型

考虑多维多变量影响的统计方法试图通过回归分析建立历史数据样本与未来建筑冷负荷之间的关系。迄今为止,多元线性回归(MLR),自回归积分移动平均(ARIMA)模型[9]都常用于建筑冷负荷预测。MLR通过模拟冷负荷和天气条件之间的相关性来预测建筑冷负荷。文献[10]应用层次分析法对最佳调整各个预报员的权重进行调整,从而改善冷负荷预测。文献[11]开发了一个启发多元线性回归的主成分分析,以实现冷负荷预测任务。然而,尽管统计回归模型通常需要更少的计算资源,但发现它们在非线性建模中的应用非常有限。

3.2 浅层网络模型

3.2.1 人工神经网络

基于人工神经网络的建筑冷(热)负荷预测,通常由影响负荷的因素构成输入单元,以能耗或负荷作为输出单元。文献[12]介绍了利用神经网络方法进行负荷预测的基本理论和方法。文献[13]应用径向基函数(RBF)神经网络和BP神经网络模型对建筑物冷负荷仿真软件的夏季不同月份的逐时冷负荷数据进行训练和预测,仿真表明RBF神经网络具有更高的预测精度及更好的泛化能力。文献[14]以某地源热泵空调系统为实测对象,根据实测的逐时负荷数据建立了人工神经网络负荷预测模型,并预测了一个未来24小时逐时负荷。

3.2.2 支持向量机

支持向量机(SVM)算法的预测方法具有强大的非线性映射特性,近年来在空调负荷预测领域应用较广泛。文献[15-16]应用支持向量机算法对建筑能耗和空调系统负荷预测,得到相应的建筑能耗模型和负荷预测模型;研究显示在特定的场景,支持向量机的预测效果要优于人工神经网络。

支持向量机可以避免神经网络结构选择和局部极小点问题,有较高的泛化能力和学习能力,对小样本预测效果明显;但是对缺失数据较为敏感,对大规模样本的学习速度慢。

3.2.3 高斯过程

短期负荷预测具有不确定性、随机性等特点。概率式预测法中,基于贝叶斯概率论的预测方法,高斯过程回归(Gaussian Process Regression,GPR)参数少,自适应确定超参数,非参数推断灵活。与预测误差分布特性的统计法相比,高斯过程提供一种置信度较高的解空间范围解释,预测结果有概率意义,而不需要统计历史预测误差。与基于分位数回归的概率密度预测法相比,高斯过程不需要对每个分位点进行建模,模型结构更简单。文献[17]提出高斯回归过程的两种变体:紧凑回归高斯过程、逐步高斯过程,对未来的预期能源需求进行建模研究,并与决策树、人工神经网络进行对比研究,高斯过程显示出一定的优势。基本高斯过程对大的样本集的处理会造成较大的运行时间与运算空间。针对大量数据样本处理效果不明显,出现稀疏高斯过程回归算法。

3.2.4 算法改进与融合

从算法的本身角度看,每个算法都有其自身的特点及适用性,单一的算法通用性较弱,预测精度也有限。多种预测算法融合是今后的一大发展方向,目的是充分发挥各个算法的优点,形成混合模型来提升算法性能。

文献[18]以空调运行负荷实测数据为基础,利用广义回归神经网络(GRNN)建立混沌预测模型,对提前1小时和提前24小时的短期预测效果进行验证。研究结果表明空调运行负荷可以利用混沌方法对负荷进行预测的模型简单、鲁棒性好的优点。文献[19]提出了一种集成算法对建筑能耗和空调负荷进行预测,该集成算法融合了8种基本数据挖掘算法,其预测精度明显优于单个基本算法模型。文献[20]提出了一种iPSO-ANN的建筑用电量小时预测模型。应用改进的粒子群优化算法(iPSO)来调整ANN结构的权重和阈值,而主成分分析(PCA)用于选择重要的建模输入并简化模型结构。比较结果表明,iPSO-ANN和GA-ANN模型的精度均高于ANN模型。从耗时的角度看,iPSO-ANN模型比GA-ANN方法具有更短的建模时间。文献[21]建立了模糊C均值算法优化BP神经网络复合模型。该模型先采用FCM算法对输入参数进行聚类,针对不同类建立BP神经网络预测模型,将待测样本分类后进行预测,最后使用决策树算法筛选预测结果中聚类不佳的部分进行加权优化。结果表明,神经网络复合模型的性能明显优于不聚类神经网络。文献[22]提出了一种基于混沌分析和支持向量回归机的短期空调负荷预测建模方法。通过研究实际空调负荷序列的混沌特性,确定其混沌特征参数并选取支持向量回归机进行预测;支持向量机建模过程使用粒子群算法进行参数寻优。仿真结果表明,空调负荷序列具有一定的混沌特性,使用混沌支持向量机方法的预测精度比单一支持向量机法预测结果的精度有了明显提升。文献[23]提出了一种基于人工智能和回归分析的办公建筑负荷预测方法,包括小波变换、支持向量机(SVM)和偏最小二乘回归(PLS)。比较结果表明,该方法能够在不同的时间范围内实现高精度的动态负荷预测。以上的国内研究结果都表明,多种算法改进和融合有利于提高预测精度。

3.3 深度多层网络模型

深度学习是指一系列机器学习算法,它们能在大数据中显示非线性和复杂模式,且可以对状态因素的潜在特征进一步学习。深度多层网络代表性的模型有深度自编码网络、深度信念网络等。深度学习既可以以监督方式建立具有给定输入和输出(即冷负荷)的预测模型,也可以用无监督方式从原始数据中提取有意义的特征作为模型输入。

文献[24]采用深度学习预测24小时建筑冷负荷曲线。分别以半监督和无监督两种方式利用深度学习将其在冷负荷预测中的表现与典型的特征提取方法和建筑领域的流行预测技术进行比较。结果表明,深度学习可以增强建立冷负荷预测的性能,特别是当以无人监督的方式用于构建高级特征作为模型输入时。使用由无监督深度学习提取的特征作为冷负荷预测的输入可以明显增强预测性能。这些发现具有启发意义,可为建筑能源预测带来更灵活有效的解决方案。文献[25]提出了一种新的基于深度学习的预测模型,用于高精度的确定性冷负荷预测。该模型结合了经验模式分解、深度信念网络和集成技术。经验模式分解用于将原始冷负荷数据序列分解为若干个具有更好的离群点和特性的数据子集。通过基于深度信念网络的分层预训练,有效地提取数据中隐藏的非线性特征和高水平的不变结构。此外,引入了集成技术并进行了适当设计,以减轻不确定性(即模型不确定性和数据噪声)对预测精度的影响。仿真结果表明,与BP神经网络、SVM预测算法相比,所提出的基于深度信念网络的预测方法表现出很强的性能。深度学习方法应用于建筑物空调负荷预测,具有提高公共建筑能源系统运行性能的巨大潜力。文献[26]提出了基于递归神经网络的建筑能量预测策略。在模型中,每种策略都有两个层面的独特特征:①在高级别层,三种推理方法用于生成短期预测,包括递归方法、直接方法和多输入多输出(MIMO)方法;②在较低级别,最先进的技术被用于循环模型开发,例如使用一维卷积操作,双向操作和不同类型的循环单元。研究结果用于短期建筑能量预测的深度递归模型,有助于弥合建筑专业人员与先进大数据分析之间的知识差距。

4 研究展望

在公共机构监管平台和大型公共建筑分项计量监测系统出现之前,建筑负荷预测的研究手段主要为基于理论、模拟、实验等方法,存在着一定的局限性。近年来,在公共机构建筑能源监测平台、大型公共建筑监测系统积累了大量的运行数据,为大数据技术的应用提供了很好的应用场景;另一方面,大数据技术的发展为建筑能源监测管理提供了优良的数据处理手段。建筑能源数据预处理有助于提高预测结果准确性,因此,建筑能耗数据针对性的预处理将会是今后一个重要的研究方向。

从目前研究来看,虽然基于大数据的建筑负荷预测的方法较多,在相关的研究中也取得了较好的效果,但是在实际工程应用中缺乏很好地验证。目前的预测方法是否适合于实际工程,需要后续深入工程实践。深度学习在建筑空调负荷预测的研究表现出巨大的潜力,有望为建筑能源预测带来更加灵活有效的解决方案。

5 结语

①建筑能源大数据的预处理需要从缺失数据的填充、异常数据的识别清洗以及数据的降维三个方面进行处理,为后续基于数据的建筑空调负荷预测奠定基础。

②多种算法融合的混合模型是建筑空调负荷预测的主要研究方向;深度多层网络及其改进,有望成为在建筑空调负荷预测领域里的一个很有发展前景的新兴建模方法。

建筑空调负荷数据序列始终表现出非线性和动态特征,难以准确预测。充分发挥各算法的优点,多种算法融合建模是解决建筑空调负荷预测的主要手段。人工智能、大数据技术的发展为建筑空调负荷预测技术提供助力,深度多层网络是一种具有巨大潜力的建筑空调负荷预测解决方法。

猜你喜欢
能耗空调负荷
120t转炉降低工序能耗生产实践
昆钢科技(2022年2期)2022-07-08 06:36:14
能耗双控下,涨价潮再度来袭!
当代水产(2021年10期)2022-01-12 06:20:28
探讨如何设计零能耗住宅
日本先进的“零能耗住宅”
华人时刊(2018年15期)2018-11-10 03:25:26
空调病是怎么回事
奔驰E260车空调不正常
防止过负荷时距离保护误动新判据
主动降负荷才是正经事
负荷跟踪运行下反应堆一回路控制系统仿真与验证
迈腾车空调不制冷