蒲 维,杨毅强*,宋 弘,吴 浩,费 剑
(1.四川轻化工大学 自动化与信息工程学院,四川 宜宾 644000;2.人工智能四川省重点实验室, 四川,宜宾 644000;3.阿坝师范学院,四川 阿坝 623002)
作为一种二次能源的电能,是各行各业稳定发展的前提,是国家健康发展的基石,是推动整个社会的前进的重要保障。国务院于2015年发布的《关于积极推进“互联网+”行动的指导意见》中明确指出了未来“互联网+”智慧能源的发展方向[1]。但发展的过程中,伴随着分布式电源、电动汽车以及储能装置大规模并入电网,导致电力负荷预测的难度加大[2]。只有明确不同地域和区间的电力负荷,才能根据已有负荷数据进行合理的供电规划,做到电力供需的平衡,充分保障每一位终端用户的实际用电需求,以此为电力能源需求的规划打下理论基础。
在以往的电力负荷预测研究中,国内外的研究人员利用了各式各样的方法来进一步提高负荷预测的精度,已有的方法总的可以归为传统预测法和人工智能预测法两大类。其中,传统预测法包括回归分析法、时间序列法以及灰色预测法等[3-5];人工智能算法包括神经网络算法和组合预测法[6]。梁毅[7]使用了BP神经网络模型对电力负荷进行预测,但BP神经网络存在泛化能力弱,同时极易陷入局部最优的问题[8]。杨宇晴等[9]使用了VMD-LSTM预测模型进行风功率预测,但单一的LSTM模型预测不能充分地提取特征,导致预测精度不够高。张睿等[10]人采用了EMD-ELM的预测模型,但学者在研究过程中发现EMD分解会出现端点效应与模态混叠的情况[11]。
基于已有的研究内容,本文提出了一种新型的预测模型——基于优化的VMD-LSTNet组合预测模型,并进行了可行性的验证。
1.1.1 变分模态分解
Zosso等[12]在2014年提出了一种新型信号处理手段并将其命名为变分模态分解(Variational Mode Decomposition, VMD)。在针对非平稳信号的处理方面,VMD分解是一种很好的自适应分解手段[13]。VMD分解是通过特定的手段将原始信号分解成数个带宽以及中心频率各不相同的本征模态函数(Intrinsic Mode Function, IMF)。与经验模态分解与集合经验模态分解相比较,VMD分解的计算量较小并且可以有效地克服端点效应以及分解过程出现模态混叠的情况,同时原始信号分解成IMF分量的个数还可以通过人为设置,因此VMD分解的自适应性明显更强[14]。
VMD分解在将原始信号f分解成k个不同带宽和中心频率的IMF分量uk的同时需要满足所有IMF分量的带宽之和取得的值为最小值。
(1)
式(1)中,f为原始信号;uk为原始信号分解后的第k个IMF分量;ωk为原始信号分解后的第k个IMF分量的中心频率;∂t为对式子进行求偏导运算;*为卷积运算;δ(t)为狄拉克分布。
式(1)中的约束变分问题在经过引入的拉格朗日乘数λ和二次惩罚因子α相结合的方法处理后约束变分问题就得以解决的。引入的增广拉格朗日函数如下:
(2)
最后采用交替方向乘子算法迭代更新,同时求取拉格朗日方程的“鞍点”。
(3)
1.1.2 鲸鱼优化算法
2016年,Mirjalili等[15]提出了鲸鱼优化算法(Whale Optimization Algorithm, WOA),WOA优化算法的灵感源自于座头鲸特殊的捕猎方式——泡泡网觅食法,由此可见,WOA优化算法是一种模拟座头鲸捕猎的群体智能优化算法。研究人员将座头鲸的捕猎行为抽象为以下3个阶段。
(1)包围猎物。
目标猎物在搜索空间范围内的位置是不确定的,所以WOA算法是把当前的最优候选解看作为目标猎物或者靠近目标猎物的位置,并且把当前最优候选解的位置作为依据来更新目标猎物的搜索位置。式子如下:
(4)
式(4)中,A=2ar-a,C=2r皆表示向量,a为收敛因子,r为[0,1]范围内的随机数;X*为当前获得的最优解的位置向量。
(2)气泡网攻击方法。
在气泡网攻击方法中包括两种。第一:可以通过减小a值的方式来实现收缩包围机制,由于A的值域为[-a,a],且a的值会从2递减至0,则A的值域会逐渐缩小至空集。第二:先计算位于(X,Y)个体位置与位于(X*,Y*)猎物之间的距离,在个体位置和目标猎物之间建立一个螺旋方程式,再模仿座头鲸螺旋上升运动状态。螺旋方程式如下:
X(t+1)=D′eblcos(2πl)+X*(t)
(5)
式(5)中,D’为个体位置到目标猎物的距离;b为对数螺旋形状常数;l为[-1,1]内的随机数。
(3)搜寻猎物。
当∣A∣>1时,表明目标猎物在座头鲸攻击范围之外,此时WOA算法执行随机搜索策略;当∣A∣≤1时,表明目标猎物在座头鲸攻击范围之内,种群转而执行攻击策略,集中收缩攻击目标猎物。
(6)
式(6)中,Xrand为当前种群中选择的随机位置向量。
1.1.3 基于WOA算法优化的VMD分解
采用VMD分解对信号进行分解的过程中,需要人为地设置IMF分解个数、惩罚因子、保真系数以及收敛条件等参数[16]。学者在以往的研究过程中发现,k以及α两个参数在VMD分解的精度中起着决定性作用[17]。k值设置偏小,会导致原始信号欠分解,造成信息获取不完整;k值设置偏大,会导致分解过度。α会对IMF分量的带宽大小产生直接的影响进而间接影响对原始信息的提取。人为设置k和α工作量大并且很难找到最优的数值,极有可能造成对原始信号的欠分解或过分解的局面。目前大多数研究学者一般采用中心频率观测法对VMD参数进行优化,但该方法工作量大、过程烦琐并且只能对k进行寻优[16]。为此,本文提出采用WOA算法优化VMD分解的k和α。
原始信号的稀疏特性可由包络熵来表示,因此本文的适应度函数选取为包络熵局部极小值,使用WOA算法对VMD分解的k和α进行寻优。当IMF分量噪声较少,特征信息较多,则包络熵值较大,反之,则包络熵值较小。式子如下:
(7)
式(7)中,N为采样点数个数;Ep为包络熵;a(i)为k个IMF分量经过Hilbert解调后的包络信号。
优化的VMD分解最佳参数[k,α]组合的求解步骤如下:
(1)设置WOA算法的初始种群以及[k,α]组合的取值范围等基本参数,同时选取包络熵局部最小值作为WOA算法适应度函数;
(2)利用VMD对原始信号进行分解,并通过式(7)可得到不同参数组合[k,α]的适应度值;
(3)利用WOA算法的优化机制,不断更新出个体的位置,同时对各个个体位置对应的Ep进行比较,不断更新出最小适应度的值;
(4)循环迭代(2)—(4)的步骤,当确定了全局最小适应度或者达到了初始设置的最大迭代次数,就直接输出得到最佳参数组合[k,α];
(5)将得到的最优参数组合[k,α]对VMD分解进行参数设置,并对原始信号进行VMD分解。
采用WOA算法对VMD分解最佳参数[k,α]寻优的环节中,设置种群大小20,迭代次数为20,k和α的寻优范围分别为[2,30]和[0,2000]。在WOA算法对VMD分解寻优后,最终确定出最优参数组合[k,α]的值为[9,5],最小局部包络熵为7.141。最佳适应度值曲线如图1所示。
图1 最佳适应度值曲线
IMF分量的个数波动范围较大,最终稳定在k=9,K值优化曲线如图2所示。α大体呈现下降趋势,随着迭代的进行最终在α=5上下微小波动,惩罚因子α的优化曲线如图3所示。
图2 IMF分量个数优化曲线
图3 惩罚因子的优化曲线
LSTNet网络主要是由线性和非线性两个部分共同构成,其中非线性部分主要包括卷积层、循环层以及循环跳跃层3个阶段[18]。LSTNet网络的结构如图4所示。
图4 LSTNet网络结构
1.2.1 卷积层
LSTNet的第一层是一个卷积神经网络(Convolutional Neural Networks, CNN),但该CNN网络不包含池化层,LSTNet网络使用由CNN组成的卷积层来捕获负载的短期特征和变量的短期依赖性,能够很好地捕获到电力负荷数据中的时序信息。
hk=RELU(Wk*X+bk)
(8)
式(8)中,*表示卷积运算,输出hk为向量,RELU函数为RELU(X)=max(0,X)。笔者通过输入矩阵X的左侧填充零来生成长度为T的每个向量hk。卷积层的输出矩阵的大小为dc×T,其中dc表示滤波器的个数。
1.2.2 循环层
循环层和循环跳跃层的输入就是卷积层的输出。循环部分是带有门控循环神经网络的循环层,并使用RELU函数作为隐藏的更新激活函数。式子如下:
rt=σ(Wxrxt+Whrht-1+br)
ut=σ(Wxuxt+Whuht-1+bu)
ct=RELU(Wxcxt+rt·(Whcht-1)+bc)
ht=ht-1·(1-ut)+ut·ct
(9)
式(9)中,σ为sigmoid函数,xt为该层在时间t的输入,W为相应的权重矩阵,h为相应时刻的输入。这个层的输出是每个时间戳的隐藏状态。尽管研究人员习惯于使用隐藏的更新激活函数,RELU具有更可靠的性能,通过这种方式,梯度更容易反向传播。
1.2.3 循环跳跃层
带有GRU和LSTM单元的循环层经过精心设计,用于记忆历史信息,因此记忆到相对长期的依赖关系。然而,由于梯度消失,GRU和LSTM在实际应用中通常不能捕获很长时间的相关性,循环跳跃层能够很好地缓解这个问题。
rt=σ(Wxrxt+Whrht-p+br)
ut=σ(Wxuxt+Whuht-p+bu)
ct=RELU(Wxcxt+rt·(Whcht-p)+bc)
ht=ht-1·(1-up)+ut·ct
(10)
式(10)中,p为跳过的隐藏单元个数。
1.2.4 AR层
由于卷积层和循环层的非线性性质造成对输入的规模不敏感,自适应回归部分组成的自回归模型解决了神经网络模型的尺度不敏感问题,同时还提高了模型的鲁棒性。
(11)
最终的预测结果由线性和非线性两个部分加权共同构成。结果如下式所示:
(12)
经过WOA算法优化的VMD-LSTNet的电力负荷预测模型步骤分为以下4步,模型预测流程如图5所示。
图5 模型预测流程
(1)结合原始数据,采用WOA算法对VMD分解的k以及α寻优,寻找出最优的IMF分量k值以及α。
(2)将在WOA算法中确定的最优参数组合k值和α值代到VMD分解。
(3)对分解得到IMF分量分别构建LSTNet模型,初始化LSTNet模型参数,采用Adam优化策略,对该模型进行优化以提高对各IMF分量预测的精度。
(4)运用训练好的模型对各IMF分量单独进行负荷预测,得到各IMF分量的预测值,最后对各IMF预测值叠加重构得到最终对的预测值。
本文选用了均值绝对误差(MAE)、平均绝对百分比误差(MAPE)及均方根误差(RMSE)作为评价实验预测结果的指标[19]。这些性能评价指标的数值越低,表明该模型的预测精度越精准。性能评价指标的公式如下:
(13)
式(13)中,hp,hi分别表示在时间t=i的预测值和实际值。
本文选取某地公开数据集2006—2010年电力负荷预测数据,每隔30 min提取一次负荷数据信息,共计87 648组数据,如图6所示。选取原始数据的前87 311组数据作为训练集,选取原始数据的后337组数据作为测试集。
图6 电力负荷原始数据时序
在对使用VMD分解对原始数据进行分解时,采用经过WOA算法寻优确定出的最优参数组合[k,α]设置VMD分解参数,IMF分量k=9,惩罚因子α=5,其余的参数均设置为默认值。具体分解效果如图7所示,由图可知,IMF1在这些分量中占比最大。
图7 VMD分解结果
3.3.1 实验结果分析
在LSTNet网络中将Adam作为优化器、MSE作为损失函数进行仿真预测,并且设置lstm-batch-size=64,epochs=30。在确定优化后的VMD-LSTNet预测模型的各个参数之后,首先使用该预测模型对VMD分解得到的各个IMF分量进行单独预测,就可以得到每个IMF分量的预测值,然后将各个IMF分量的预测值叠加作为该预测模型的最终预测结果。
本文将每个IMF分量单独预测得到的预测值进行叠加重构获得最终的预测值,然后将预测值与原始数据通过性能评价指标公式得出性能指标的大小。显而易见,经过优化的VMD-LSTNet预测模型的预测精度有很大的提高,能够更为准确地进行负荷预测,是进行电力负荷预测的一个不错的模型选择。重构后的预测值与原始数据对比曲线如图8所示。
图8 优化的VMD-LSTNet模型预测
3.3.2 对比实验
为了验证本文选用的方法可行性,将本文经过WOA算法优化的VMD-LSTNet方法与基于LSTNet以及VMD-LSTM,VMD-CNN-LSTM多种模型进行对比实验。选用RMSE,MAE和MAPE对这些模型进行评价,各个预测模型预测结果对比如图9所示。
图9 各模型预测结果
相较于VMD-LSTM和VMD-CNN-LSTM两种模型,经过WOA算法优化的VMD-LSTNet预测模型在MAE,MAPE和RMSE3个性能指标上都有很大程度上的降低;相较于LSTNet模型,经过WOA算法优化的VMD-LSTNet模型在MAE降低了30.788 3,MAPE降低了0.457 6%,RMSE降低了45.969 1。性能评价指标如表1所示。
表1 不同模型性能评价标准对比
为了解决电力负荷预测精度低的问题,本文提出了使用WOA来优化VMD的分解模态数及惩罚因子两个参数,采用LSTNet神经网络预测模型对电力负荷数据进行预测,同时将本文所提模型与其他模型进行了对比实验。得出如下结论。
(1)通过WOA来优化VMD的参数,相对于人为设置参数,可以更好地得到高度相关的时序子序列,提高了负荷数据的质量,在一定程度上避免了由数据问题导致的预测精度低的问题。
(2)本文所提出的预测模型由线性、非线性两部分共同构成,能够有效地捕获电力负荷数据短、中期的信息,以此保证了电力负荷预测的精准度,预测结果显示该模型的MAE为18.013 4,MAPE为0.243 1%,RMSE为21.524 3。
(3)本文所提出的预测模型为电厂等的日常工作安排及中、长期规划提供了科学理论依据,符合国家可持续发展战略,具有深远的意义。
但本文所提方法未考虑到多特征变量输入,可将这些因素负荷的影响考虑到未来的电力负荷预测模型研究中,进一步提高电力负荷预测的准确率。