李军, 梁宵, 梁嘉城, 李鑫
(南京工程学院 电力工程学院,江苏 南京 211167)
我国正处于“碳达峰”“碳中和”目标实现的关键阶段,如何降低大用户中主要耗能设备的碳排放,尤为重要。本文为降低空调能耗实现节能减排提出了先决条件。为了保证节能,寻优系统能够做出最佳的决策,准确的负荷预测必不可少。对建筑负荷的准确预测有助于系统主动调整运行策略,从而降低空调系统能耗,同时减少能源消耗对环境的影响。
随着对负荷预测要求的不断提高,建筑负荷预测的方法与理论也层出不穷。已有的这些算法仍具有局限性,现有的负荷预测理论方法无法很好地对具有非平稳特性和固有非线性的实时负荷做出预测,建筑负荷预测具有复杂性和挑战性[1]。线性与非线性组成的时间序列是建筑负荷的本质,同时建筑负荷与人员活动、设备启停状态和环境温湿度有关,因此建筑负荷的识别模式十分困难。
任何优化技术都需要未来情景的信息,因此用于能耗优化策略和构建能耗模型的时间序列预测不可或缺。目前,国内外对于建筑负荷预测的研究十分广泛。
文献[2]采用混合线性和非线性模型预测时间序列数据,开发了一个ARIMAX(具有外部输入的自回归整合移动平均)模型对建筑物的电力需求进行预测,大幅提高了预测精度。
文献[3]把ARIMA算法、小波加BP神经网络算法和Elman算法进行对比,分析出目标的最优算法。文献[4]将ARIMA模型与门限自回归条件异方差模型相联立,建立社会经济新形势下的中长期负荷预测模型,获得了更高的精确度。文献[5-7]基于改进的灰色预测(grey model,GM)模型提高了负荷数据灰度较大时中长期电力需求预测精度。
为控制空调能耗,实现2035年双碳目标,实现建筑负荷的准确预测。本文提出了一种包含残差修正的ARIMA-GM组合模型的地源热泵中央空调负荷预测方法,对南京市某大型公共建筑负荷进行预测。
本文使用ARIMA模型对具有周期性的时间序列进行线性的特征信息提取,采用一种新陈代谢GM(1,1)改进模型对其残差子序列进行逐期修正,并进行线性特征信息提取,联系二者构建出含残差修正的ARIMA-GM组合预测模型。
时序数据主要有平稳模型和非平稳模型两类。对于非平稳建筑负荷数据的随机过程,必须先对其进行平稳化处理,使用赤池信息准则(akaike information criterion,AIC)和贝叶斯准则(bayesian information criterion,BIC)对模型阶次进行判定。ARIMA结构如图1所示。
图1 ARIMA结构图
AIC是衡量统计模型优良性的一种标准,AIC公式如下:
AIC=2k-2ln(L)
(1)
式中:k为参数数量;L为似然函数。
BIC与AIC相似,用于模型选取。模型训练时,随着模型复杂性的提升,似然函数也会增大,同时过拟合(overfitting)的现象也会发生。对于此问题,AIC与BIC均引入了与模型个数相关的惩罚项,且BIC的惩罚项大于AIC。
BIC=kln(n)-2ln(L)
(2)
式中:k为模型参数个数;n为样本个数;L为似然函数。kln(n)惩罚项可以在维数过大且训练样本数据较少时有效避免维度灾难现象。AIC与BIC的原理并不相同,AIC从预测角度,选择好的模型进行预测;BIC则从拟合的角度,选择一个对现有数据拟合最佳的模型即边际似然最大的模型。通过信息准则函数进行定阶,即比较不同阶次模型的AIC与BIC数值,从中选择AIC、BIC值最小的模型确定p、q值。
由最小二乘估计法确定模型的系数,使非平稳的负荷时序数列变为均值为零的平稳数列。线性差分方程是目前主要的平稳化处理方式,利用ARIMA形式对序列差分后进行回归。ARIMA(p,d,q)模型可表示为[8]:
Δdy(t)=Φ1Δdy(t-1)+…+ΦpΔdy(t-p)+u(t)-θ1Δdu(t-1)-…-θqu(t-q)
(3)
式中:Δ为差分算子;d为达到平稳序列的差分阶次;Φ1、…、Φp为自回归(auto regressive,AR)系数;Q1、…、Qq为滑动平均(moving average,MA)系数。
ARIMA模型的优势在于它可以结合自动回归、差异和不同顺序的移动平均来获取模型,在拟合时间序列时表达各类时间序列信息。
传统的GM(1,1)预测方法是拟合全部的样本数据建立灰色变化模型,从而描述样本的整体变化情况,并且利用变化趋势对后续位移变化进行预测。但对于非指数性的建筑负荷,传统GM(1,1)模型在进行预测时,无法动态更新预测期数前的实际值,所有预测结果均使用同一段旧信息位移,因此对预测期数中产生局部变化的地方描述能力较弱,不能很好地拟合真实变化曲线[8]。
对于建筑负荷而言,随着新数据的引入,及时淘汰老的、过时的数据,不仅可以减少运算量,也可以增加运算精度。针对这个问题,使用一种新陈代谢的 GM(1,1)模型,以滑动窗口作为样本区间,通过建模样本序列首尾不断更替的方式完成新陈代谢,以新陈代谢区间进行建模预测的结果,不仅能更好地反映建筑负荷的局部变化,也能与整体变化曲线有很高的拟合优度。
采取新陈代谢的方法将样本区间首部的旧数据舍去并且在尾部增加新数据,动态地更新数据,直到预测停止。
预测算法流程如图2所示。设原始数据集为H=[h1,h2,h3,…,hn],利用ARIMA模型得到H的历史数据拟合数列A=[A1,A2,A3,…,An]和预测数量PA=[P1,P2,P3,…,Pn],将拟合值与实际负荷值相比较,得到拟合误差序列ΔA=[ΔA1,ΔA2,ΔA3,…,ΔAn],计算公式为:
图2 预测算法流程图
ΔAi=hi-Ai,i=1,2,3,…,n
(4)
拟合误差序列ΔA在一定程度上减少了线性分量的影响,使得负荷的非线性特性较强。GM模型对残差进行累加,得到规律性更强的序列,再用指数曲线对预测值进行拟合。
本文基于改进的ARIMA-GM的建筑负荷预测方法对南京地区某实际大型公共建筑进行负荷预测。采用一款建筑能耗动态模拟软件Designbuilder对在南京某公共建筑典型气象年下的负荷进行仿真。软件使用简便,可以载入非特殊性建筑结构,可对建筑物进行详细设定,广泛应用于建筑负荷预测。
使用办公楼实际建筑参数和南京典型气象年数据,输入到Designbuilder中,获取建筑的全年实时负荷。当模型各参数越详尽,系统运行出的数据相较于某具体年数据更具典型性。
建筑中央空调系统由两台地源热泵和两台水冷机组构成,夏季的系统运行情况远比冬季复杂的多,因此着重对夏季负荷较大的情况进行研究。
对南京典型气象年下的输出数据进行负荷预测。对于建筑的空调负荷而言,一些特殊的影响因素(如气温、双休日等)都会不可避免地造成负荷数据异常。使用建筑负荷取夏季连续的280 h的负荷数据,对最后14 h的负荷进行预测,同时利用最后两日的负荷残差值预测日残差值中明显偏移的残差值,采用该点的前后时刻的平均值与前一日的对应时间点和相邻时间点的平均值进行加权,对原始数据进行替代。采取本文提出的预测模型对输出数据进行预测。同时与ARIMA算法和真实值进行对比,得出结果如图3所示。
图3 冷负荷折线图
从图3可以看出,含残差修正的ARIMA-GM改进算法预测模型结果处在真实值附近,上下波动较小,预测精度相较于传统ARIMA算法有显著提升。
为了进一步评估模型的预测性能,采用平均绝对误差(mean absolute error,MAE)、均方根误差(root mean square error,RMSE)和平均绝对百分比误差(mean absolute percentage error,MAPE)指标对模型的预测结果进行评价。计算公式如下:
(5)
(6)
(7)
分别对传统ARIMA算法、ARIMA-GM算法和误差修正的ARIMA-GM算法的误差指标进行比较,以便对预测效果进行进一步分析。表1列出各模型对8月5日预测的平均绝对值结果,可以看出,ARIMA模型的平均绝对值误差为7.56%,而本文改进的模型平均绝对值误差为1.32%,预测效果改进显著。
表1 8月5日预测结果对比
为了优化建筑负荷的控制策略,实现在线寻优,更为精准的建筑负荷预测模型不可或缺。对于由线性和非线性时间序列数据组成的建筑负荷,首先利用ARIMA模型对其线性特征信息进行提取;进而使用新陈代谢GM(1,1)的改进模型对ARIMA的残差提取非线性信息;二者结合提出一种含误差修正的改进ARIMA-GM复合预测模型。本文利用该模型对建筑进行短期负荷预测。结果表明该模型的预测精度和适用性满足建筑负荷的预测要求,给地源热泵中央空调系统的在线调节提供了一个可行的全新负荷预测方法。