基于EMD-CNN-LSTM混合模型的短期电力负荷预测

2022-04-08 02:04向益锋马天祥
关键词:分量负荷预测

徐 岩, 向益锋, 马天祥

(1.华北电力大学 电气与电子工程学院, 河北 保定 071003;2.新能源电力系统国家重点实验室(华北电力大学), 河北 保定 071003;3.国网河北省电力有限公司电力科学研究院, 河北 石家庄 050021)

0 引 言

电力负荷预测在现代电力系统安全稳定经济运行中发挥愈来愈重要的作用,精确的电力负荷预测可为一个地区电力系统发展策划做出有效指导,保证电网可靠运行、减小成本和安全稳定。负荷预测精度紧密联系电网供需平衡,也为现行市场下电网编制调度计划、营销计划和供电计划提供信赖依据[1,2]。在另一方面,随着电网的不断扩建,电气设备接入增多,信息化程度不断增高,智能电网对负荷采集数据愈来愈精准,为负荷预测提供可靠、海量数据集,也为深度学习的应用创立基础。

电力负荷预测的准确性受到多个影响因素制约,得到绝对预测方法相对困难,因此提升模型的预测准确性显得尤为重要。电力负荷一般时序性和非线性特点较为突出,针对以上特点,国内外学者在短期负荷预测开展大量深入研究,模型由简到繁,由单一方法到多种方式组合,其大体上分为传统预测方法和现代预测方法。传统预测方法主要是回归预测、时间预测法及指数平滑法。回归预测主要依据自、因变量间的相关性,确定回归方程,此方法拟合速度较快,对数据准确性要求极高,对于非线性序列拟合效果较差[3]。时间序列法主要通过构建与时间相关的模型,较为传统的时间序列法有:自回归(AR)模型、滑动-平均模型(MA)、积分自回归型滑动(ARIMA)模型[4,5],这些模型对于样本数据的需求较少,同样要求数据序列较为平稳。指数平滑法对序列出现的随机波动值消除效果较好,但若波动过大,会影响拟合精度[6]。第二大类是现代预测方法,文献[7]提出基于专家预测和模糊贝叶斯的预测方法,但对于非线性负荷序列自我修正较困难,预测精度较低。文献[8-10]运用反向BP网络进行预测,文献[11]运用随机森林算法,文献[12]构建关于BP-ANN预测模型,文献[13]将混合内核概念引入经典学习机模型,此外还有优化支持向量机(SVM)[14]、小波分析预测法[15]等。这些预测方法均能有效提升预测精度,但共同存在缺乏对负荷序列时序关联的考虑的问题,随着深度学习技术逐渐被人们熟知,长短期记忆网络(LSTM)作为一种非线性循环网络,因其在时序关联性、长期记忆力方面的优势及对非线性数据较强自适应学习能力在近期越来越多运用到预测领域,LSTM虽可反应数据中长期历史过程[16],但其较难提取对非线性数据间潜在联系与隐藏信息。

为进一步提高短期负荷预测精度,本文提出一种基于经验模态分解(EMD)和卷积神经网络(CNN)及长短期记忆网络(LSTM)的混合模型短期负荷预测方法,简称EMD-CNN-LSTM混合模型。此模型结合EMD和CNN以及LSTM各自的优点长处,先将负荷序列视作一种非线性、非平稳的带有“噪声”信号序列,运用EMD将原始信号进行分解并重构,更能反应原始信号序列有用信息,再运用CNN有效提取海量负荷连续数据与非连续数据之间潜在特征,挖掘特征向量并结合时序作为输入,利用LSTM进行短期负荷预测,与BP神经网络、SVM、LSTM和EMD-LSTM相比,由于EMD分解后消除较多噪声信息,基于EMD-CNN-LSTM的组合短期负荷预测误差最小,此组合模型有效提高了负荷预测精准度。

1 基于EMD-CNN-LSTM的混合预测模型

1.1 EMD模型

EMD[17]不用事先设立任何基函数,可直接按照数据自身时间尺度分解信号,方法能将非平稳非线性数据转为平稳线性数据,可为负荷预测模型有效挖掘蕴藏序列中的时序关系,提供较好辅助作用,EMD基本步骤如下:

首先根据时序数据x(t)局部极大极小值确定上下包络线Us(t)和Vs(t),据此求出均值包络线m1,如下式(1)。然后运用x(t)减去m1得到c1,c1为固有模态数(Inherent Modal Function,IMF),如式(2)。式(3)所示残差为时序数据与均值包络线的差值,最后一系列满足要求的IMF分量和一个残差m1由残差r1(t)重复上述流程所得,如式(4)。

(1)

c1=x(t)-m1(t)

(2)

r1(t)=x(t)-c1(t)

(3)

(4)

1.2 CNN模型

CNN模型为近年来深度学习领域最受欢迎、应用最广泛模型之一。主要由卷积层与池化层和全连接层等构成,通过局部连接和共享权值的模式,交替运用卷积层和池化层和全连接层获得原始序列数据中的表征,提数据中局部特征[18],从而建立特征向量,此结构减少权重数量,降低模型复杂度。本文根据序列长度和特征所在位置,采用一维卷积(1 D-CNN),此种结构模型较为简单,权值输入较少,数据重构与特征提取复杂程度会降低,据此模型提取时序序列特征,深度挖掘输入数据之间联系,最后将特征处理后传入LSTM网络。

1.3 LSTM神经网络

长短期记忆神经网络是一种基于RNN(循环神经网络)的改进模型[19],对出现的长距离依赖问题可有效解决,LSTM神经网络主要将门(Gate)与状态单元(Cell State)概念引入其中,其在数据分析当中的适应性比RNN网络更好,LSTM单元结构如图2所示。

图1 CNN结构示意图Fig. 1 Structure diagram

图2 LSTM单元结构图Fig. 2 LSTM unit structure diagram

图3为LSTM状态单元结构原理图,长短期记忆神经网络较RNN网络增加了新的单元:状态单元Ct,这些单元由LSTM进行连接,LSTM完整不变地传递储存在记忆单元中的信息。

图3 LSTM神经元基本状态Fig. 3 LSTM basic neuron state

LSTM网络由遗忘门、输入门和输出门这三个基本结构组成(如图4)。遗忘门中记忆单元遗忘部分是由输入xt与记忆状态单元St、中间输出ht-1一起决定。状态记忆单元中的保留向量是由输入门中的xt相继经过tanh和sigmoid函数变化后决定,更新过后的状态记忆单元St和输出ot决定,相关的计算公式如式(5)~(10)所示。

图4 LSTM网络基本单元Fig. 4 LSTM basic unit

ft=σ(Wfxxt+Wfhht-1+bf)

(5)

it=σ(Wixxt+Wihht-1+bi)

(6)

gt=φ(Wgxxt+Wghht-1+bg)

(7)

ot=φ(Woxxt+Wohht-1+bo)

(8)

St=gt⊙it+St-1⊙ft

(9)

ht=φ(St)⊙ot

(10)

1.4 基于EMD-CNN-LSTM混合模型电力负荷预测

为提升短期电力负荷预测的准确性,提出一种基于EMD-CNN-LSTM混合短期电力负荷预测模型,减弱了电力负荷序列的非线性,减小负荷预测难度,同时显著提高预测模型求解的有效性与精准性。本文所建立的混合负荷预测模型流程如下:第一阶段将具有时序特征的数据集作为此混合模型的输入。历史气温、过往电价及历史负荷数据均为彼此互不影响时间序列,为关联影响负荷历史信息,运用词向量的表示方式将某一时刻的负荷值与电价和温度串联成向量,构成全新时间序列,每一时刻历史负荷均由与其相关的特征信息一起构成。运用滑动窗口方式将数据进行输入,据后续预测需要,使用宽度为29的滑动窗口依次将负荷数据传入网络,并将步长设置成1,模型输入数据结构如图5所示。

图5 混合模型数据输入结构Fig. 5 Mixed model data input structure

图6 基于EMD-CNN-LSTM的短期电力负荷预测模型流程Fig. 6 Process of short-term power load forecasting model based on EMD-CNN-LSTM

其次对原始电力负荷数据进行归一化处理,并修补异常值,划分出训练集和测试集,对所选数据集进行EMD,分解为有限个内涵模态分量和1个残差分量,再将高频、中频和低频分量各自叠加组合,运用CNN进一步提取中高频分量中的潜藏特征并挖掘特征向量,进一步提升预测效果,减少预测时间,最后将各分量分别输入LSTM网络预测,将各预测结果进行线性叠加最终得到期望电力负荷预测值。

2 实例分析与结果展示

2.1 数据集及数据预处理

数据集为澳大利亚2006年(2006年4月1日至2006年5月31日)的负荷、电价和温度数据,采样间隔为30分钟1个点,每天取48个点,每类各2 928条数据。为便于模型训练,本文对所选数据进行归一化处理,方式如式(11)所示:

(11)

式中:x为原始值;xmax为极大值xmin为极小值。

归一化后对电力负荷数据进行展示,图7可看出电力负荷波动频繁,峰值和谷值也无具体范围,可以发现该负荷数据不但周期性较差,同时其中包含大量高频分量、噪声等。

图7 电力负荷数据Fig. 7 Power load data

选取该数据集中前2 928个点54天内的数据作为训练集,后336个点7天内的数据进行测试,在训练集中取前n个点对应n+1的点,即[x1,x2,x3…xn]对应xn+1,[x2,x3,x4…xn+1]对应xn+2,依次对训练集进行分割,测试集也做同样处理。

输入数据采用历史负荷、电价和温度构成的多维向量,历史负荷、电价和温度都是相互独立的时间序列,为了表示这些影响负荷的特征信息,历史负荷、电价和温度在时间t1,t2……tn时串联成向量,根据所取序列长度n,将其组合成n×3的向量矩阵,形成一组全新的数据结构,具体组合方式如图8所示。

图8 数据输入形式Fig. 8 Data input form

2.2 误差评估指标

预测结果误差评估指标[20,21]采用平均绝对百分误差(Mean Absolute Percent Error, MAPE)和均方根误差(Root Mean Square Error, RMSE),公式如式(12)~(13)。

(12)

(13)

式中:yl为预测值;yi为实际值,n为样本数量。

2.3 EMD-CNN电力负荷重构

对所选数据集进行EMD,从高频到低频,负荷序列被分解成8个IMF和1个Res,如图9所示,8个IMF反映负荷数据在不同影响因素和不同尺度下的分布,逐渐由非平稳到平稳,残差分量则可看出负荷序列长期的变化规律,且整体变化趋势较为一致。

图9 EMD分解结果Fig. 9 EMD decomposition result

此时通过EMD将负荷数据平稳化处理,分解出来的各IMF分量包含了原信号的不同时间尺度的局部特征信号,使用LSTM预测模型对各局部特征单独预测,可达到互不干扰的效果,降低预测难度,但预测模型从1个增加到9个,模型整体的训练时间显著提升,从而影响了模型性能。

同时由公式分别计算各分量的过零率,如表1所示IMF1和Res的过零率大于0.4,为高频分量,IMF2到IMF5的过零率在0.1~0.4之间为中频分量,其余分量均看作低频分量,由图可看出中、高频分量频率极其不稳定,出现了明显的模态混叠现象,可能会为下一步的模型的训练和预测增添难度。

表1 各分量的过零率Tab.1 Zero crossing rate of each component (%)

针对EMD-LSTM模型训练时间过长和中、高频预测效果相对较差的问题,一方面将高频、中频和低频分量各自叠加组合,使得构建的模型由9个降低到3个,模型训练时间由此大为降低;另一方面使用CNN来进一步提取中、高频分量中的潜藏特征,减少权值数量,在提升LSTM模型拟合效果的同时也降低了模型的训练时间,最终构建出EMD-CNN-LSTM预测模型。

2.4 LSTM和CNN网络参数选取

根据本文提出的EMD-CNN-LSTM混合模型,利用2006年澳大利亚4~5月的用电负荷、电价和温度数据进行仿真。分别固定CNN和LSTM参数,对CNN和LSTM网络层数的选取做出调整,通过MAPE和RMSE的大小来判断预测精度,仿真结果如表2、表3所示。从表中可以看出,适当增加CNN和LSTM层数可提高预测精度,发现CNN层数和LSTM层数超过2层时,均出现了过拟合的情况。因此,本文将CNN层数和LSTM层数定为2层。

表2 LSTM层数调整结果Tab.2 LSTM layer adjustment result

表3 CNN层数调整结果Tab.3 CNN layer adjustment result

2.5 仿真结果对比

分别利用BP、SVR、LSTM、EMD-LSTM进行仿真实验,对各网络模型参数进行调优,以相同训练集训练。确定各个模型参数后,以相同测试集预测2006年中一个星期(5月25日至5月31日)的电力负荷,计算其MAPE、RMSE和训练时间,结果如表4所示。仿真结果表明,EMD-LSTM模型在一个星期的MAPE及RMSE为1.16%和134.6 MW均低于其他3种模型,但训练时间为294.3 s,比LSTM的训练时间增加263.8 s,可知EMD-LSTM模型虽能取得较高的预测效果,但影响了模型运行性能,需针对其不足进行改进。

表4 不同模型预测结果对比Tab.4 Comparison of prediction results of different models

图10为BP、SVR、LSTM和EMD-LSTM在2006年5日30日的负荷预测结果曲线,可明显看出BP、SVR在波峰和波谷区域出现很大幅度的偏差,而LSTM、EMD-LSTM相对于这两种模型都能较好地与真实曲线拟合。分析LSTM和EMD-LSTM模型的负荷预测曲线,从整体来看基于EMD-LSTM模型的预测曲线不仅在波峰波谷区域与实际变化曲线更贴近,在其他区域也与实际的变化趋势更吻合,其原因是序列的非平稳性导致LSTM不能很好地预测出序列的变化趋势,而EMD重构序列改善了这一问题,使得预测精度更好。

图10 不同模型的预测曲线图Fig. 10 Forecast curves of different models

因EMD-LSTM模型训练时间过长,为降低模型训练时间,对模型进行改进,将EMD后划分的高频、中频和低频各自叠加后分别使用LSTM预测,由表5可看出经改进后EMD-LSTM预测模型的MAPE、RMSE和训练时间分别降低0.18%,11.8 MW和209.8 s,均优于改进前EMD-LSTM预测模型,验证了该改进方法的可行性。

表5 一次改进后模型性能对比Tab.5 Model performance comparison after improvement

同时为解决高、中频组合分量中模态混叠影响预测效果的问题,使用CNN进一步抽取高、中频组合分量的潜藏特征,使得LSTM提取高、中频组合分量时更为便宜。如表6所示为高频组合分量分别使用LSTM和CNN-LSTM后的预测结果,可看出高频组合分量在使用CNN进行处理后,MAPE、RMSE和训练时间分别降低0.35%、28.3 MW和21.7 s,模型整体的预测性能得到提升。

表6 高频组合分量使用CNN后的预测结果

对上述思路汇总,经二次改进后,最终确立EMD-CNN-LSTM短期电力负荷预测模型,并按照以上相同方式进行仿真,实验结果如表7所示,EMD-CNN-LSTM预测模型的MAPE和RMSE在一天或一个星期都比EMD-LSTM更低,一天中分别降低0.16%、12.3 MW,一个星期内分别降低0.34%和100.7 MW,证明了EMD-CNN-LSTM的优越性。

表7 EMD-LSTM使用CNN后的预测结果Tab.7 EMD-LSTM prediction results after using CNN

为进一步分析模型的预测结果,统计并计算了不同模型2006年5月29日前12 h内的负荷实际值、预测值、 MAPE 和RMSE指标,如表8所示。由表可知,LSTM在使用EMD后和EMD-LSTM使用CNN后,发现在12 h内均有15个负荷点的MAPE、RMSE下降和9个负荷点的MAPE、RMSE上升,表明模型组合后,总体拟合效果进一步提高。同时,LSTM、EMD-LSTM 和 EMD-CNN-LSTM 模型的12 h平均MAPE和RMSE分别为1.75%、1.29%和0.62%,180.7 MW、133.4 MW和68.1 MW,EMD-CNN-LSTM 的12 h平均MAPE和RMSE相较于LSTM模型、EMD-LSTM 模型分别降低了1.13%、0.67%和112.7 MW、65.3 MW,进一步表明所提模型具有更高的预测精度。

表8 12 h内不同模型负荷预测结果Tab.8 Load forecast results of different models within 12 h

图11为基于EMD-LSTM与EMD-CNN-LSTM模型的负荷预测结果对比图,可以看出在大多数波峰和波谷区域,基于EMD-CNN-LSTM模型的预精度更高,这体现了CNN提取潜藏特征的能力使得预测结果更能拟合真实曲线。

图11 基于EMD-LSTM和EMD-CNN-LSTM模型负荷预测结果对比Fig. 11 Comparison of load prediction results based on EMD-LSTM and EMD-CNN-LSTM models

3 结 论

面对日益提高的电力系统负荷预测精度的要求,本文提出一种基于EMD-CNN-LSTM的短期电力负荷预测混合模型。将预处理之后的负荷相关的特征数据运用EMD进行重构,分解后的高、中频分量进行叠加组合,运用CNN充分提取各分量的潜在特征并作为LSTM网络输入对各分量进行预测,最后叠加各分量预测值得到最终预测结果。基于EMD-CNN-LSTM混合模型的短期电力负荷预测优势如下:

(1)非平稳非线性的负荷序列经EMD分解后复杂度及非线性程度明显降低,有利于模型的精确预测。

(2)将经过EMD分解后的高、中频分量作为CNN网络的输入,利用CNN提取潜藏特征,降低数据复杂程度,更有利于分析负荷时序性。

(3)此混合模型结合EMD、CNN和LSTM各自特点,实验结果表明此模型能有效提升短期负荷精度,缩短预测时间,具有一定的优越性。基于EMD-CNN-LSTM 混合模型预测负荷的MAPE为0.61%,较EMD-LSTM模型降低0.16%,较BP神经网络模型、SVR模型及LSTM模型分别降低3.47%、2%和0.8%。预测时间为61.1 s,较EMD-LSTM模型降低233.2 s。

猜你喜欢
分量负荷预测
无可预测
人造革合成革拉伸负荷测量不确定度评定
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
3项标准中维持热负荷要求对比分析
选修2—2期中考试预测卷(A卷)
MIV-PSO-BP神经网络用户热负荷预测
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤