万磊 余飞 鲁统伟 姚婧
摘 要:负荷数据的高度随机性和不确定性,导致短期负荷预测的精度很难提升。为了提高短期负荷预测的准确度,提出了一种基于完全自适应噪声集合经验模态分解(CEEMDAN)与卷积神经网络(CNN)和门控循环单元(GRU)组合模型的短期负荷预测方法。首先,利用CEEMDAN模型将复杂的原始负荷序列分解为几个相对简单的子序列;其次,利用卷积神经网络(CNN)和门控循环单元(GRU)建立各分量预测模型,将归一化后的分量输入训练模型,得到预测子序列;最后,将所有分量的结果汇总,得到最终预测结果。结果表明,与LSTM模型、GRU模型、CNN-GRU及CEEMDAN-GRU组合模型相比,CEEMDAN-CNN-GRU组合模型所测精度有了明显提升,平均提升了25.08%,23.59%,20.41%和13.53%。CEEMDAN-CNN-GRU组合模型能够提取历史负荷数据中的非线性特征,有效提升短期负荷预测精度,可为电力系统建设提供有力支撑。
关键词:数据处理;卷积神经网络;互补集合模态分解;门控循环单元;负荷预测;电力系统
中图分类号:TP399 文献标识码:A
Abstract: The high randomness and uncertainty of load data make it difficult to improve the accuracy of short-term load forecasting.In order to improve the accuracy of short-term load forecasting,a short-term load forecasting method based on a combined model of fully adaptive noise ensemble empirical mode decomposition (CEEMDAN),convolutional neural network (CNN) and gated recurrent unit (GRU) was proposed.First,the CEEMDAN model was used to decompose the complex original load sequence into several relatively simple sub-sequences;secondly,CNN and GRU were used to establish a prediction model for each component,and the normalized components were input into the training model to obtain the predictive subsequence.Finally,the results of all components were summarized to get the final prediction results.Experimental results show that the CEEMDAN-CNN-GRU combined model has a significant improvement in accuracy compared with the LSTM model,GRU model,CNN-GRU and CEEMDAN-GRU combined model,with an average increase of 25.08%,23.59%,20.41% and 13.53%.The CEEMDAN-CNN-GRU combined model can extract nonlinear features from historical load data,effectively improve the accuracy of short-term load forecasting,and provide strong support for power system construction.
Keywords:data processing;convolutional neural network;complementary ensemble empirical mode decomposition;gated recurrent unit;load forecasting;electric power system
負荷预测是现代电力系统中的一个重要研究内容,特别是对长期规划、日常运行和控制而言,是电力高效运输和分配的一个先决条件。近年来,随着智能电网、能源互联网的快速发展,准确的负荷预测对电网的发电控制和经济调度具有重要意义[1],负荷预测正成为一个重要的研究领域。
根据所涉及的时间长短,负荷预测一般分为3类:长期负荷预测、中期负荷预测和短期负荷预测[2-4]。短期负荷预测(STLF)不仅可以提高调度效率[5-6],还可以降低运营成本,成为负荷预测中最热门的研究课题。在过去的几十年里,众多专家学者致力于提出行之有效的方法和模型[7]。随着机器学习的发展,基于机器学习方法(如人工神经网络(artificial neural network,ANN)[8]、支持向量机(support vector machine,SVM)[9-11]等)由于其优异的拟合性能而被广泛应用于负荷预测领域。考虑到深度学习模型在处理复杂非线性序列的优越性能,人们将深度学习方法引入电力负荷预测领域[12]。文献[13]针对电力系统短期负荷预测的动态非线性特点,提出了一种基于Wiener模型的短期负荷预测模型,并采用Elman递归神经网络对其非线性部分进行拟合,在一定程度上提高了学习效率和预测精度。
然而,传统递归神经网络时间深度过大,隐藏层简单,在进行误差反向传播时,会出现梯度爆炸或梯度消失的问题[14-15]。文献[16]和文献[17]提出一种基于长短期记忆神经网络(LSTM)的电力负荷预测方法,并对某地电力负荷值进行了预测。门控循环单元(gated recurrent unit,GRU)[18]作为一种基于优化LSTM的特殊类型的循环神经网络,在相同情况下更容易收敛,也被应用到负荷预测领域。文献[19]提出了一种基于GRU-NN模型的短期电力负荷预测方法,基于深度学习的思想处理不同类型的负荷影响因素,引入GRU对具有时间序列特征的历史负荷序列进行处理。然而,电力系统中不仅有时序数据,还有其他种类的高维数据,如电力系统中的时空矩阵、图像信息等,GRU模型不能很好地处理所有这些类型的高维数据。卷积神经网络(convolutional neural networks,CNN)是处理高维数据的理想选择,已被广泛应用于图像识别和预测领域。文献[20]提出了一种结合门控循环单元(GRU)和卷积神经网络(CNN)的GRU-CNN混合神经网络模型,由GRU模块提取时间序列数据的特征向量,其他高维数据的特征向量由CNN模块提取。由于温度、气候等不确定因素,导致电力负荷数据具有高度随机性和不确定性,因此直接利用深度学习方法在原始序列上进行预测,很难达到预期精度。
为了解决上述问题,笔者提出一种基于完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)的卷积神经网络(CNN)和门控循环单元(GRU)组合模型的短期负荷预测方法(CEEMDAN-CNN-GRU)。考虑到负荷序列可能会因随机因素波动较大,因此该模型首先利用CEEMDAN对非平稳原始序列进行处理,将原始负荷时间序列信号分解为多个固有模式函数(IMF),与EEMD相比,CEEMDAN在保证小剩余噪声干扰的情况下能够节省计算时间;然后利用卷积神经网络(CNN)和门控循环单元(GRU)建立各分量预测模型,以CNN特征进行序列表示,多层GRU进行有效学习;最后将归一化后的分量输入训练模型,得到预测负荷序列。
1 模型原理
1.1 CEEMDAN
近年来,数据分解技术被广泛运用于预测领域[21]。2011年,TORRES等[22]提出CEEMD方法,用于解决经验模态分解(EMD)和集合经验模态分解(EEMD)方法中模式混叠和白噪声残差大等问题。EMD可以通过一个筛选过程将原始时间序列分解为多个IMF,筛选过程需要多次迭代,直到符合某个停止标准,然后生成有限数量的固有模态函数。但是,EMD筛选过程中会产生模式混合的问题,为此,WU等[23]引入EEMD方法,通过在数据中加入白噪声,从根本上解决模式混合问题。EEMD方法通过加入高斯白噪声对序列进行分解,将高斯白噪声添加到原始信号中,找到原始时间序列的所有极大值和极小值点,对于所有找到的极值点,使用3次样条插值函数拟合绘制曲线,其中极大值点对应曲线的上包络,极小值点对应下包络,计算上下包络线的平均值,得到等于平均值的真实结果。
与EMD相比,EEMD虽然在提高稳定性方面有了很大改进,但不能完全消除附加噪声。TORRES等[22]基于EEMD模型进行优化,提出CEEMDAN方法,在拥有EEMD分解效果的同时,还能通过在原始信号中加入自适应白噪声,消除模式混叠和白噪声残差大等问题。具体步骤如下。
2 基于CEEMDAN和神经网络预测模型
2.1 预测模型的建立
负荷数据具有高度复杂性、随机性和非平稳性,使用传统预测方法会受到很大的影响和限制。电网中的负荷变化具有高度随机性和周期性,直接对原始序列进行预测很难获得精确的结果。作为EEMD的改进算法,CEEMDAN解决了分解信号存在的模态混叠和白噪声问题,能够对时间序列进行高效分解。通过CEEMDAN可将原始负荷数据分解为若干个固有模态分量(IMF)和一个残差分量(RES),分解后的IMF分量代表不同频率的特征信号,能够分离出原始负荷序列中的高频随机特征和低频周期特征,从而大幅提升负荷预测的精度。
CNN 作为一种处理高维数据的人工神经网络,能进一步学习负荷序列中固有的高维隐藏特征,CNN的运用有助于过滤输入数据的噪声,从而提取负荷序列中有价值的特征。GRU通过优化LSTM算法,在捕获长期依赖关系的同时,只需更少次数的训练就能解决梯度消失和梯度爆炸的问题。可见,GRU在负荷预测领域有着不可忽视的优异表现。本文提出一种基于CEEMDAN的卷积神经网络和门控循环单元相组合的神经网络模型进行电力负荷预测。模型主要分为負荷数据预处理、CEEMDAN分解、CNN-GRU组合模型预测和预测结果融合4个主要步骤,基本流程如图1所示。具体步骤如下。
1)对原始数据的缺省值和异常值进行预处理,剔除异常数据,将缺省数据用前后数据的均值代替,得到完整负荷数据。
2)利用CEEMDAN对原始信号数据加入成对正负高斯白噪声来减轻模态混叠问题,从而分解成若干个本征模函数和最终残差分量,得到分解子序列并进行归一化处理。
3)使用CNN-GRU模型预测每个分量,依次得到分量的预测结果。其中,CNN网络负责提取每个负荷子序列分量的内在特征,再将得到的特征向量依次输入GRU模型,预测负荷子序列结果。
4)将每个分量的预测结果进行融合,得到最终预测结果。
CEEMDAN-CNN-GRU预测模型更关注负荷预测的精确度,模型最耗时的CEEMDAN分解部分及CNN-GRU模型训练部分通常在离线状态完成。大多数情况下,对于离线训练部分算法着重关注其预测精度,而非算法复杂度;对于线上预测部分,由于模型参数已在离线状态训练完成,剩余工作只需利用神经网络中的权重矩阵进行简单的矩阵乘积运算,因而时间复杂度将大大降低。另一方面,也可在离线状态下完成所有训练和预测工作,将预测结果存储到数据库,线上只需访问数据库,读取数据库中的预测值。
2.2 负荷预测评价指标
为了评估预测模型的性能,引入平均绝对百分比误差(MAPE)和均方根误差(RMSE)进行结果评价,MAPE和RMSE的公式如下所示:
式中:N是训练样本和测试样本的大小;yi和y︿i 分别为实际值和预测值;MAPE表示所有测试集中预测点的误差和实际值之间比率的平均值;RMSE是预测值和实际值之间差异的样本标准偏差。MAPE和RMSE值越小,模型的预测性能越好。
3 模型性能评估与算例分析
本文使用马来西亚柔佛市供电公司的负荷数据和湖北电网某台区的实际负荷数据进行实验预测。第1个测试用例是在马来西亚柔佛市供电公司数据集中预测一整年的连续负荷数据。该数据集中的数据每间隔1 h采样一次,总共8 760条数据。将原始负荷数据按照8∶2的比例分成训练集和测试集,其中前7 008条负荷数据作为训练集,剩下1 752条数据作为测试集进行模型评估。第2个测试用例是在湖北电网实际数据中进行负荷预测,利用湖北某台区232 d的实测负荷数据,选择前218 d作为训练集,最后14 d作为测试集,用MAPE和RMSE评价模型的预测效果,并与GRU和LSTM进行比较,验证该模型的有效性。
由于原始数据的随机性、不确定性和非平稳性,在进行CEEMDAN分解之前,要对电网的负荷序列进行预处理。由于影响电网负荷的高波动性因素较多,因而负荷数据存在一些异常点。通过剔除一些异常数据点,可以提高预测的准确性,同时利用前后数据的平均值填充缺省数据。
处理完异常数据,采用CEEMDAN方法对电力负荷曲线进行分解,在EMD基础上加入成对的高斯白噪声,将原始信号分解为9个IMF分量和1个残差分量。原始加载顺序如图2所示,CEEMDAN分解的IMF分量和剩余残差分量如图3所示。
其中,IMF1—IMF4是序列频率分解后的较高部分,对应电网中较快的切换负载行为; IMF5—IMF9分量是序列频率分解后的较低部分,对应电网中较慢的开关负载行为;残差表示从原始信号中减去 IMF1—IMF9 分量后的剩余分量。上述所有分解出的负荷子序列累加上残差的最终值,便是原始负荷序列。
测试用例2选取湖北某台区进行实验,将数据按上述方法进行预处理,得到原始负荷曲线,如图4所示,CEEMDAN分解的IMF分量和剩余残差分量如图5所示。由图4和图5可知,湖北某台区原负荷数据波动大、随机性高、平稳性差,在原始负荷序列中使用CNN-GRU进行预测的难度较大。而分解后的各个子序列拥有更高的平稳性,数据波动更小,使得神经网络算法更容易拟合,预测精度得以提升。
对原负荷数据的各个子序列通过CEEMDAN分解算法,使用CNN-GRU模型进行结果预测。
首先,对原始分量数据进行最大、最小归一化处理,设置卷积层过滤器大小为64,并以3个时间步长的内核大小读取输入数据。采用最大池化层,降采样成原始特征图大小的1/4,其中激活函数为线性整流函数(rectified linear unit,ReLU)。设置GRU模型的参数时间步长为1,即从之前的1个负荷数据中预测下一个时间的数据。在 GRU 神经网络中使用均方误差 (MSE) 作为损失函数,并在训练过程中通过自适应矩估计 (Adam) 算法优化 GRU 神经网络。通过对每个分量IMFt,it=1,2,…,k;i=1,2,…,n的预测结果和残差项rt的预测值进行线性累加,得到最终预测结果,其中k为IMF分量的个数。
经过上述预测模型,训练200轮后马来西亚柔佛市供电公司负荷数据中分量1和分量2的结果如图6、图7所示,其中蓝色代表原始负荷子序列数据,红色代表子序列的预测结果。
由图6和图7可知,CEEMDAN-CNN-GRU对于电网中较快的切换负载行为有很好的拟合效果。对于总体负荷数据,通过对各个子序列的预测结果进行累加,能够得到负荷数据的最终预测结果。本方法在负荷预测方面有着优异的表现,以MAPE和RMSE作为评价指标,对该模型与LSTM,GRU模型进行比较,结果如表1和表2所示,具体预测效果如图8所示。
从表1和表2中可以看出,与LSTM[16]模型、GRU[18]模型、CNN-GRU[20]模型、EEMD-GRU及CEEMDAN-GRU组合模型相比,基于完全自适应噪声集合经验模态分解的CNN-GRU预测模型拥有更好的性能。表1显示了基于CEEMDAN-CNN-GRU的负荷预测模型在马来西亚柔佛市供电公司负荷数据集中与另外5种模型的精度对比,MAPE分别降低了8.00%,11.54%,7.75%,4.03%和2.13%,RMSE分别下降了5.14%,6.23%,1.69%,0.87%和0.36%。表2顯示了基于CEEMDAN-CNN-GRU的负荷预测模型在湖北某台区数据中与另外5种模型的精度对比,MAPE分别降低了25.08%,23.59%,20.41%,16.21%和13.53%,RMSE分别下降了22.95%,22.00%,18.37%,19.07%和13.53%。
通过对GRU与CEEMDAN-GRU,CNN-GRU与CEEMDAN-CNN-GRU这2组方法的比较可知,对负荷进行CEEMDAN分解,可以减少负荷的非线性、随机性和波动性,提高预测精度。对2组不同的测试数据集的比较可知,CEEMDAN对波动更大、样本规模更小的数据集具有更加明显的改进作用。同时, 在2组不同的数据集上,CEEMDAN-CNN-GRU模型都比CEEMDAN-GRU模型取得了更好的效果,利用CNN对负荷序列提取隐藏特征,能有效提升预测精度,尤其对于波动较大的小样本数据集。
4 结 论
1)提出了一种基于完全自适应噪声集合经验模态分解的CNN-GRU模型,该模型在原始负荷序列中加入正负成对高斯白噪声,将负载数据分解成为若干个IMF分量和残差分量,有效避免了EMD可能存在的模态混叠问题,进一步降低了原始负荷序列的非平稳性。[HJ1.6mm]
2)使用CNN提取子序列中的關键特征,利用GRU对各个子序列进行结果预测,不仅具有远距离历史信息记忆能力,还具有超过LSTM的收敛速度。
3)通过对公开数据集的大量实验,验证了模型优异的非线性序列拟合能力,可满足电力系统对负荷预测精度的要求,为电网调度和规划提供理论支持。
[JP3]在实际应用中,由于负荷序列受气温、季节等多种因素的影响会呈现随机性变化,因而使用单一负荷序列数据进行负荷预测会存在一定的局限性。下一步工作还需考虑外部数据的影响,在多源数据下探索进一步的研究。
参考文献/References:
[1] 陈剑强,杨俊杰,楼志斌.基于XGBoost算法的新型短期负荷预测模型研究[J].电测与仪表,2019,56(21):23-29.
CHEN Jianqiang,YANG Junjie,LOU Zhibin.A new short-term load forecasting model based on XGBoost algorithm[J].Electrical Measurement & Instrumentation,2019,56(21):23-29.
[2] RAZA M Q,KHOSRAVI A.A review on artificial intelligence based load demand forecasting techniques for smart grid and buildings[J].Renewable and Sustainable Energy Reviews,2015,50:1352-1372.
[3] SUPAPO K,SANTIAGO R,PACIS M C.Electric load demand forecasting for Aborlan-Narra-Quezon distribution grid in Palawan using multiple linear regression[C]//2017 IEEE 9th International Conference on Humanoid,Nanotechnology,Information Technology,Communication and Control,Environment and Management (HNICEM).Philippines:IEEE,2017:1-6.
[4] HERMIAS J P,TEKNOMO K,MONJE J C.Short-term stochastic load forecasting using autoregressive integrated moving average models and Hidden Markov Model[C]//2017 International Conference on Information and Communication Technologies (ICICT),Pakistan:IEEE,2017:131-137.
[5] [JP2]TAKEDA H,TAMURA Y,SATO S.Using the ensemble Kalman filter forelectricity load forecasting and analysis[J].Energy,2016,104:184-198.
[6] AL-HAMADI H M,SOLIMAN S A.Short-term electric load forecasting based on Kalman filtering algorithm with moving window weather and load model[J].Electric Power Systems Research,2004,68(1):47-59.
[7] LYU Pin,LIU Song,YU Wengbing,et al.EGA-STLF:A hybrid short-termload forecasting model[J].IEEE Access,2020,8:31742-31752.
[8] SHEHU G S,ETINKAYA N.Flower pollination-feedforward neural network for load flow forecasting in smart distribution grid[J].Neural Computing and Applications,2019,31(10):6001-6012.
[9] BARMAN M,dev CHOUDHURY N B.Season specific approach for short-term load forecasting based on hybrid FA-SVM and similarity concept[J].Energy,2019,174:886-896.
[10]HONG W C.Electric load forecasting by support vector model[J].Applied Mathematical Modelling,2009,33(5):2444-2454.
[11]HU Zhongyi,BAO Yukun,XIONG Tao.Electricity load forecasting using support vector regression with memetic algorithms[J].The Scientific World Journal,2013,2013:292575.
[12]MERKEL G,POVINELLI R,BROWN R H.Deep Neural Network Regression for Short-Term Load Forecasting of Natural Gas[M].[S.l.]:International Institute of Forecasters,2017.
[13]ZHAO Feng,SU Hongsheng.Short-term load forecasting using kalman filter and elman neural network[C]//2007 2nd IEEE Conference on Industrial Electronics and Applications.Harbin:IEEE,2007:1043-1047.
[14]HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.
[15]张冬雯,赵琪,许云峰,等.基于长短期记忆神经网络模型的空气质量预测[J].河北科技大学学报,2020,41(1):66-75.
ZHANG Dongwen,ZHAO Qi,XU Yunfeng,et al.Air quality prediction based on neural network model of long short-term memory[J].Journal of Hebei University of Science and Technology,2020,41(1):66-75.
[16]陈卓,孙龙祥.基于深度学习LSTM网络的短期电力负荷预测方法[J].电子技术,2018,47(1):39-41.
CHEN Zhuo,SUN Longxiang.Short-term electrical load forecasting based on deep learning LSTM networks[J].Electronic Technology,2018,47(1):39-41.
[17]葛磊蛟,赵康,孙永辉,等.基于孪生网络和长短时记忆网络结合的配电网短期负荷预测[J].电力系统自动化,2021,45(23):41-50.
GE Leijiao,ZHAO Kang,SUN Yonghui,et al.Short-term load forecasting of distribution network based on combination of siamese network and long short-term memory network[J].Automation of Electric Power Systems,2021,45(23):41-50.
[18]CHUNG J,GULCEHRE C,CHO K,et al.Empirical Evaluation of Gated Recurrent Neural Networks on Sequence Modeling[DB/OL].[2021-11-30].https://arxiv.org/abs/1412.3555.
[19]王增平,赵兵,纪维佳,等.基于GRU-NN模型的短期负荷预测方法[J].电力系统自动化,2019,42(5):53-58.
WANG Zengping,ZHAO Bing,JI Weijia,et al.Short-term load forecasting method based on GRU-NN model[J].Automation of Electric Power Systems,2019,43(5):53-58.
[20]SAJJAD M,KHAN Z A,ULLAH A,et al.A novel CNN-GRU-Based hybrid approach for short-term residential load forecasting[J].IEEE Access,2020,8:143759-143768.
[21]沈富鑫,邴其春,張伟健,等.基于CEEMD-GRU组合模型的快速路短时交通流预测[J].河北科技大学学报,2021,42(5):454-461.
SHEN Fuxin,BING Qichun,ZHANG Weijian,et al.Short-term traffic flow prediction of expressway based on CEEMD-GRU combination model[J].Journal of Hebei University of Science and Technology,2021,42(5):454-461.
[22][JP2]TORRES M E,COLOMINAS M A,SCHLOTTHAUER G,et al.A complete ensemble empirical mode decomposition with adaptive noise[C]//2011 IEEE International Conference on Acoustics,Speech and Signal Processing (ICASSP).Prague Czech Republic:IEEE,2011:4144-4147.
[23]WU Z H,HUANG N E.Ensemble empirical mode decomposition:A noise-assisted data analysis method[J].Advances in Adaptive Data Analysis,2009,1(1):1-41.