王愈轩,刘尔佳,黄永章
(华北电力大学 电气与电子工程学院,北京 102206)
综合能源系统(integrated energy system,IES)通过能源协调管理,在满足系统多元化用能需求的同时提升了能源利用效率[1,2]。随着IES深入发展,系统在源、网、荷各环节的能量耦合关系加深,加之新型负荷的不确定性因素影响系统稳定运行[3,4]。因此,在考虑能量耦合及多元负荷的背景下,如何实时、准确、可靠地实现多元负荷预测成为当前重要的研究课题。
针对上述问题,目前已有不少国内外学者开展了相关研究。文献[5,6]针对区域级IES负荷预测问题,分别基于深度结构多任务学习和改进的熵值法,构建了短期电、气、冷、热负荷预测模型。文献[7]利用灰色关联理论对环境因素输入属性进行主控因素关联度分析,建立了多元负荷的特征聚类预测模型。文献[8,9]基于小波包分解与循环神经网络算法,建立电冷热综合能源系统短期负荷预测模型。上述文献均为IES单一负荷预测模型,为进一步提高预测精度,组合预测被广泛应用于负荷预测问题当中。文献[10]采用BiLSTM神经网络和MLR方法组合构建了超短期电力负荷预测模型。文献[11]基于长短时记忆网络(long short-term memory,LSTM)、极端梯度提升(extreme gradient boosting,XGboost)模型组合构建了短期电力负荷预测模型。组合预测常见的权重分配方法有算术平均法、误差倒数法、均方差导数法、Shapley值法等[12]。
综上所述,现有研究未考虑IES多元负荷之间耦合相关性问题,难以满足实际园区综合能源系统多元负荷预测需求[13,14]。为解决上述问题,本文提出了数据驱动下的综合能源系统短期多元负荷预测方法。
近年来,随着综合能源的不断发展,园区综合能源示范工程在全国范围逐步加大推广,其典型能源结构如图1所示。园区内开展多能互补、源网荷协同的用能方式、应用综合能源智慧化服务管理体系[15],能有效保障安全供能的前提下园区的综合能源利用效率。
图1 园区综合能源系统
从图1可以看出,一方面,园区用能系统结构复杂,耦合环节较多,如冷热电联供(CCHP)机组既能发电也能同时供冷、热,储能装置既能在发电高峰存储部分电能,又能在用电高峰释放电能,冷热电气负荷供能方式多元,这为园区开展多能互补提供可能。另外一方面,园区能源供应侧电源能量特性不一样,电力网传输速度接近于光速,显然在供应速度上电能要快于供冷、供热、供气网,这是由冷、热、气因其固有的能源传输特性决定,具有较大的延时性。
园区能源互补特性明显,大大增加了用户用能的灵活性,同时也增加了负荷预测的难度,多元负荷预测除了和用户需求有关,还受天气温度、季节的影响。能源耦合使得负荷之间存在着复杂的非线性关系,本文采用最大信息系数(maximal information coefficient,MIC)[16]来判断冷、热、电、气负荷、温度之间的非线性关系,该方法能有效得出特征之间的非线性关系,详细计算过程见3.2小节。
组合预测方法被广泛应用于各类预测问题当中,本文基于LSTM、XGboost构建组合预测模型,该模型主要包括LSTM预测模型、XGboost预测模型、组合模型方法。
LSTM被广泛应用于时序预测问题当中,LSTM的预测模型有3个门,分别是遗忘门、输出门和输入门[17],其原理结构图如图2所示。遗忘门控制信息保留,输入门控制信息输入,输出门控制信息输出。LSTM深度学习网络训练过程如下
ft=σ(Wf·[ht-1,xt]+bf)
(1)
it=σ(Wi·[ht-1,xt]+bi)
(2)
ot=σ(Wo·[ht-1,xt]+bf)
(3)
ct=ftct-1+ittanh(Wo·[ht-1,xt]+bc)
(4)
ht=ottanh(ct)
(5)
式中:σ为激活函数;ft为遗忘门输出,it为输入门的输出,ot为输出门输出,ct为当前时刻神经单元状态,ht为t时间步下的LSTM记忆单元的输出;Wf为遗忘门权重矩阵,Wi为隐藏输入门权重矩阵,Wo为单元到输出门权重矩阵,bi为输入门参数矩阵;xt为当前t时间步的输入,bf为当前隐藏层遗忘门的偏差值,bi为当前隐藏层输入门的偏差值,bc为当前隐藏层记忆单元的偏差值。
图2 LSTM模型原理
总的来说,LSTM模型通过控制3个门,从而在每一个时间步下对记忆单元进行修改,即在每个时间步下决定保留多少上个时间步的状态信息,以及将多少的状态信息继续往下一时间步传输,从而得到较为准确的预测结果。
XGboost是经过优化的分布式集成模型,其内部决策树使用的是梯度提升树。模型通过不断添加树,不断地进行特征分裂添加新的树,去拟合上次预测的残差。预测结果是每棵树的预测结果的累加和[18]。假设存在M棵决策树,其模型输出的预测结果为
(6)
定义XGboost的目标函数
(7)
(8)
树模型的复杂度Ω(ft) 计算公式如下
(9)
其中,T表示叶子节点数,ωj表示第j个叶子节点的权重。
将式(8)代入式(9),目标函数转化为
(10)
由式(10)可知,目标函数为一元二次函数,对ωj求导等于0,可以得到ωj最优值
(11)
将其代入目标函数得到最优目标函数值
(12)
由式(11)、式(12)可以看出,预测模型在迭代过程中,通过不断计算节点损失值,得到ωj和目标函数的最佳值,选择增益损失最大的叶子节点,进而得到最优预测模型。
采用误差倒数法对LSTM、XGboost模型预测结果进行加权组合,δt为组合预测误差。其中,λ1t、λ2t分别为LSTM和XGBoost预测值,ε1,ε2分别为的LSTM和SXGBoost的预测误差
(13)
由式可知,组合方法是将较大权值赋予给预测误差小的模型,从而使得整体预测误差趋于变小,进而提升模型的预测精度。
本文主要基于LSTM-XGboost构建多元负荷短期预测模型,其预测流程如图3所示。其中LSTM、XGboost及组合模型构建过程已在上节说明,在此不再赘述,本节重点介绍其它步骤的研究内容。
图3 多元负荷预测流程
数据预处理通常是指对多元负荷数据进行坏数据剔除和数据归一化处理。园区负荷数据采集设备可能因外在不良因素在采集过程中出现一些坏数据。需在模型训练测试前进行剔除,否则影响负荷预测精度。多元负荷数据特征在由于单位量纲不一,需进行标准化处理将特征数据值映射到0~1之间。
(1)坏数据主要包括数据缺失、数据极值、数据毛刺。数据缺失:某时刻的数据由于故障未能记录下来。
(2)数据极值:数据值超过了设定的最大最小阈值,或者数据的波峰波谷值超过了相邻几日对应的波峰波谷值。
(3)数据毛刺:数据值得突增突降超过了一定的阈值。
本文采用分别从横向与纵向对坏数据进行自动识别。
横向识别:假设样本某一时刻的数据与相邻时刻的数据相似,若两者的数据差值过大则认为是坏数据