聂雄 洪炎
摘 要:为提高电力负荷的预测精度提出了一种基于鲸鱼优化算法(WOA)改进的变分模态分解(VMD)与梯度提升树(GBDT)结合的长期电力负荷预测方法。首先,利用VMD将长期负荷分解为简单的子序列,并引入WOA解决VMD分解时需人为调参的问题;影响长期负荷预测的经济因素和气象因素同样进行分解并降维,以获得有用特征,降低噪声影响;最后,将IMF分量及特征分量带入GBDT模型,得到多个IMF分量预测值,叠加重构后得到最终的电力负荷预测值。对中国某地区实际电力负荷及经济数据与气象数据分析,实验结果表明,本文模型相比于单一模型其预测精度更高,RMSE、MAE、MAPE三个方面误差更小,R2也提升到了0.979。
关键词:鲸鱼优化算法;变分模态分解;梯度提升树;长期电力负荷预测
Abstract:A longterm power load forecasting method based on Whale Optimization Algorithm(WOA)improved Variational Mode Decomposition(VMD)and Gradient Boosting Tree(GBDT)is proposed to improve the accuracy of power load forecasting.Firstly,using VMD to decompose longterm loads into simple subsequences,and introducing WOA to solve the problem of manual parameter tuning during VMD decomposition;The economic and meteorological factors that affect longterm load forecasting are also decomposed and dimensionally reduced to obtain useful features and reduce the impact of noise;Finally,the IMF components and feature components are introduced into the GBDT model to obtain multiple IMF component predictions.After superposition and reconstruction,the final power load prediction value is obtained.Based on the analysis of the actual power load,economic data and meteorological data of a region in China,the experimental results show that the prediction accuracy of the model in this paper is higher than that of the single model,and the errors of RMSE,MAE and MAPE are smaller,and R2 is also increased to 0.979.
Keywords:Whale optimization algorithm;Variational Mode Decomposition;Gradient boosting tree;Long term electricity load forecasting
在现代社会中,电能是人类科技发展和經济增长的巨大推动力,但在全球能源开采不断减少而电能消耗却日益增多的情况下,如何减少电能浪费,规划好电能的生产与调度将是十分重要的[1]。
在过去的几十年中,许多研究人员为提高电力负荷预测精度做出了许多努力。文献[2]详细阐述了几种长期电力负荷预测方法,并综合考虑了趋势性特征在长期负荷中的影响。文献[3]利用粒子群算法(particle swarm optimization,PSO)对VMD进行优化,并与门控循环单元(gated recurrent unit,GRU)结合对短期电力系统负荷进行预测,其结果证明了该方法的有效性与准确性。
综上所述,现有的研究大多仅考虑了环境和经济单方面对长期负荷的影响,且在优化负荷序列的分解过程中未充分考虑所选适应度函数对优化过程的影响。因此,本文在充分考虑经济因素和环境因素对长期负荷的影响,提出了一种基于WOAVMDGBDT的长期电力负荷预测模型。并以中国某地区实际负荷数据进行验证,实验结果表明,本文模型与常规预测模型相比,其整体性能和预测精度均有所提升。
1 模型理论方法
1.1 变分模态分解
变分模态分解是一种可以实现同时提取分解模态的时频分析方法[4],该方法的目的是寻找负荷信号的若干个有中心频率、带宽一定的信号,并利用交替方向乘子法(altemating direction method of multipliers,ADMM)有效优化变分模型,从而减少噪声对负荷的影响,且其每个解调后的模型相对平滑。在针对非线性、非平稳性的长期电力负荷信号中,VMD可以将负荷数据分解为K个本征模态函数(intrinsic mode function,IMF)分量及对应的K个中心频率。其分解过程表达式为:
min{uk},{ωk}∑k(t)δ(t)+jπt*uk(t)e-jωkt22
s.t.∑uk=f(t)(1)
式中{
k}为信号VMD分解后的IMF分量集合;{ωk}为各IMF的中心频率集合;(t)为t时刻的负荷信号;
(t)为狄拉克分布。
1.2 WOA优化VMD
鲸鱼优化算法(whale optimization algorithm,WOA)是一种通过模拟鲸鱼特殊的觅食方式所提出的优化算法,这个捕猎方式称为泡泡网觅食法。其基本思想是利用鲸鱼个体自身的运动感受信息,寻找局部最优解,并与群体之间相互协作实现信息共享,进而求得全局最优解。
VMD可有效分解长期电力负荷,降低其序列本身的非平稳性。但VMD分解前需要对IMF的个数(取K)及惩罚因子α进行取值,人为的取值可能会使信号分解效果变得很差,当IMF个数设置过大时,可能会导致出现不必要的信息和噪声,且增加模型计算时间;K值过小又会导致分解不充分,造成数据丢失。因此本文使用WOA实现对VMD的改进,避免人工取值的失误,最大程度增强负荷信号分解效果。
1.3 GBDT基本原理
梯度提升树(gradient boosting decision tree,GBDT)是一种使用Classification And Regression Tree(CART)的迭代算法,其模型的基本思想是利用弱学习器得到强学习器的回归预测模型。其开始训练一组子树,并对所有子树的预测结果进行累加求和,由此得到一个强学习器,具有较强的非线性建模能力和鲁棒性。因此在面对非线性和非平稳的长期负荷序列时,可以很好地捕捉序列和影响因素中的非线性关系,有效提高模型对长期负荷的预测精度。其基本流程图如图1所示。
1.4 WOAVMDGBDT完整模型
本文预测模型首先利用VMD分解电力负荷数据,并采用鲸鱼算法优化VMD,再用GBDT进行预测。其WOAVMDGBDT完整模型具体流程步骤如图2所示。
(1)首先对VMD对原始电力负荷数据进行分解。
(2)对影响因素数据采用相同的WOAVMD方法,并对分解后的特征数据进行降维,以提取经济因素与环境因素中的有用特征,降低冗余,从而更好地学习电力负荷与特征因素之间的相关性,提高GBDT的学习与泛化能力。
(3)将分解后的IMF分量以及归一化后的影响因素分量输入已训练好的GBDT模型,得到各IMF分量预测值。
(4)对各IMF预测值进行累加求和,得到最終预测结果。
1.5 模型评估指标
为验证本文模型性能,采用4种评价指标作为模型预测效果的评估方法。分别为决定系数(R2)、平均绝对误(MAE)、平均绝对百分比误差(MAPE)及均方根误差(RMSE)。其计算公式如下:
R2=1-∑Mt=1Lt-L^t2∑Mt=1Lt-Lt2(2)
MAE=∑Mt=1Lt-L^t2M(3)
MAPE=∑Mt=1Lt-L^tLtM×100%(4)
RMSE=∑Mi=1Lt-L^t2M(5)
式中:Lt和L^t实际值与预测值;L-为样本平均值;M为样本个数。
2 数据来源
本模型中所采用的数据集来源于中国某地区实际的电力负荷数据集、气象数据集和经济数据集。其中电力负荷数据包括该地区2000年至2022年每月的实际用电负荷,共计276个采样点。气象数据和经济数据包括平均温度、降水量、生产总值、一季度建筑工程总值和劳动人口数等。
3 实验结果分析
在长期电力负荷的预测中,影响电力负荷波动的因素一般分为经济因素和环境因素。长期电力负荷的变化趋势受这些因素的影响虽呈周期性螺旋变化,但易受极端变化的影响,如高温、台风、政策变化等。因此鉴于其的复杂波动情况,采用VMD分解可有效降低电力负荷数据的波动性,减少数据中噪声的影响。但在VMD的优化过程中,IMF个数和惩罚系数需人为取值,因此本文采用WOA对VMD进行改进。
在长期电力负荷模型中,环境因素与经济因素是影响其趋势变化的主要因素,且这些因素也都是非平稳、非线性的时间序列,充满复杂性。例如,在极端天气下,电力负荷可能产生剧烈波动。因此本文利用和电力负荷相同的方法针对這些序列进行分解,可有效降低因素噪声,提高特征质量,进而提高预测精度。
为了验证WOA算法对VMD的分解效果,分别与Genetic Algorithm(GA)、Sparrow Search Algorithm(SSA)算法进行比较。其中GAVMD与SSAVMD所采用的适应度函数与WOA算法相同都是排列熵值,其中IMF个数K取值范围为[2,10],惩罚系数α的取值范围为[0,2000],优化算法种群数量设置为20,迭代次数均设置为50次。
如下表所示,GA优化VMD得到的优化结果为:IMF个数K取7,惩罚参数α的取值为1860,适应度函数收敛值为2.4127。SSA优化VMD得到的优化结果为:IMF个数K值取6,惩罚参数的取值为1560,适应度函数收敛值为2.5236。WOA优化VMD得到的优化结果为:IMF个数K值取8,惩罚参数的取值为1952,适应度函数收敛值为2.2192。
为了有效验证本文所提出的WOAVMDGBDT预测模型的有效性,分别与BP、LSTM、GBDT等单一模型进行比较。其中电力负荷数据被负荷预测时间为2016年2月至2022年12月,共计83个采样点。
本文所采用的GBDT算法设置如下:学习率为0.1;损失函数采用最小二乘法;基学习器数量为100;节点分裂评价准则采用改进分数的均方误差,训练集与测试集比例划分为7∶3。本文模型所用训练时间共计983s。
图3为本文预测模型与其他单一预测模型预测效果对比,从图中可以发现各个模型在上升和下降的变化趋势中拟合效果都较好,但在波峰及波谷处单一模型均未能较好地预测出实际的电力负荷,而本文预测模型在趋势、波峰和波谷处均能较好地预测,更加接近真实值。
结语
针对长期电力负荷数据的波动性及非平稳性所引起预测精度较低的问题,本文提出一种基WOAVMDGBDT的长期电力负荷预测模型,并通过中国某地区长期电力负荷进行实验验证,得出如下结论:
(1)利用VMD分解可以有效地分离出电力负荷数据中的负荷趋势和波动,降低负荷数据的复杂性和数据中的噪声。并利用WOA优化VMD,优化了VMD参数人工输入造成随机性较大的问题,这有效地提高了模型的自适应能力及智能性。
(2)WOAVMDGBDT与经典的BP、LSTM、GRU单一预测方法进行了比较,实验结果表明:本文提出的算法性能远优于经典的单一预测算法,具体来说,与GBDT算法相比,MAPE降低到了1.10%,MAE降低到7.23,RMSE降低到11.29,R2提高到0.979。实验结果验证了WOAVMDGBDT模型预测效果的有效性。
参考文献:
[1]孙新程,孔建寿,刘钊.基于核主成分分析与改进神经网络的电力负荷中期预测模型[J].南京理工大学学报,2018,42(03):259265.
[2]姜山,周秋鹏,董弘川,等.考虑数据周期性及趋势性特征的长期电力负荷组合预测方法[J].电测与仪表,2022,59(06):98104.
[3]徐岩,向益锋,马天祥.基于粒子群算法优化参数的VMDGRU短期电力负荷预测模型[J].华北电力大学学报(自然科学版),2023,50(01):3847.
[4]方娜,陈浩,邓心,等.基于VMDARIMADBN的短期电力负荷预测[J].电力系统及其自动化学报,2023,35(06):5965.
作者简介:聂雄(1999— ),男,汉族,安徽合肥人,硕士研究生,研究方向:电力系统负荷预测研究;洪炎(1979— ),男,汉族,教授,硕士生导师,研究方向:大数据分析和数据挖掘研究。