基于VMD-ISSA-LSTM的短期光伏发电功率预测

2024-03-05 09:14彭宇文杨之乐李冰张豪周邦昱
广东电力 2024年1期
关键词:麻雀模态发电

彭宇文,杨之乐,李冰,张豪,周邦昱

(1.广东碳中和研究院,广东 韶关 512000;2.中国科学院 深圳先进技术研究院,广东 深圳 518000)

随着传统化石能源的急剧消耗,可再生能源的重要性在全球范围内日益凸显,尤其光伏发电以其低运行成本和环境污染小的特点,迅速成为新能源领域的研究重点[1-2]。然而,光伏发电具有严重的随机不确定性,容易受环境因素的影响,尤其在光伏机组大规模接入电网后,会对电力系统的稳定运行造成严重破坏,此时需要大量弃光以保证电力系统机组的安全稳定运行,间接造成了大规模的能源就地浪费[3]。因此,需要对光伏发电功率进行准确的短期预测,以确保光伏机组在并网后依然能保持电力系统运行的经济性和稳定性。

为了提高光伏发电功率的预测精度,国内外学者进行了大量的智能方法研究,主要集中在两大预测模型:机器学习模型和深度学习模型。机器学习模型作为人工智能领域研究的重要分支,可以根据给定的训练数据自适应做出决策,并预测短期未来的数据,常见模型包括随机森林[4]、贝叶斯回归树[5]、支持向量机[6]等。这种预测方法的模型训练简单,但对于非线性较强的高维时间序列数据的拟合效果并不理想,且缺乏对数据的深度挖掘,导致模型预测精度较差。因此,学者们转向深度学习模型的研究。深度学习模型主要依赖于数据模态特征处理和神经网络序列的深层映射,实现逻辑的深度挖掘,以达到更高的预测精度。文献[7]将传统经验模态分解算法与长短期记忆(long short term memory,LSTM)神经网络相结合,开发出组合预测模型;文献[8]利用变分模态分解(variational mode decomposition,VMD)算法对光伏序列数据进行多层模态分解,不仅消除了序列分解过程中的模态混淆,还提高了模型拟合精度;文献[9]针对LSTM神经网络存在超参数难以确定的问题,采用智能启发式算法对LSTM神经网络的超参数全局寻优,以确定初始超参数的选取。文献[10]通过模拟退火算法优化LSTM神经网络的超参数,从而避免了人为选择的经验性,以此提高组合模型的预测精度。然而,上述文献要么注重于特征工程方法的模态处理,要么关注模型超参数的选取,将两者相结合的组合模型却较为少见。

因此,在考虑光伏发电功率受到环境特征因素影响的前提下,本文提出基于VMD和改进麻雀搜索算法(improved sparrow search algorithm,ISSA)优化LSTM神经网络的短期光伏发电功率预测方法。首先,通过VMD算法将原始多维光伏时间序列特征分解成若干模态分量和残差项,以降低光伏时间序列数据的波动性和非平稳性;然后,采用ISSA对LSTM神经网络的超参数进行寻优,得到了各层模型的模态特征分量预测集合后,将它们序列组合成最终的输出结果;最后,将不同类型的组合模型和VMD-ISSA-LSTM组合模型进行误差指标对比,以验证本文提出的组合模型具有更精确的鲁棒拟合性。

1 光伏发电功率影响因素分析

光伏发电功率通常会表现出强烈的非线性时序变化特征,主要的环境特征影响因素包括光照辐射度、空气温度、环境湿度、机组材料和大气压强等,这些环境特征的时空变化会在不同程度上影响光伏机组的发电效率[11]。因此,选择合适的环境特征是提高组合模型预测精度的关键,通过计算采集特征样本与光伏发电功率的皮尔逊相关系数,可以综合评价出所选择环境特征对光伏发电功率的潜在影响。环境特征的皮尔逊相关系数

(1)

表1 环境因素的相关系数与主成分占比Tab.1 Determination and correlation coefficients of major environmental factors

从表1可以看出:光伏发电功率与光照辐照度的正相关性最强,这成为了决定光伏发电功率的重要环境表现特征;环境湿度和大气压强与光伏发电功率呈现出负相关性,这间接说明了该环境特征可能对光伏发电功率产生消极影响;同时,空气温度和机组材料对光伏发电功率的影响相对较小,这与传统物理常识也是相符合的。因此,本文选择光照辐照度、空气温度、环境湿度、机组材料和大气压强这5种环境特征作为VMD-ISSA-LSTM组合模型的主成分输入特征数据集。

2 VMD算法原理

VMD算法属于完全非递归的时频信号特征处理方法,该方法假设任何时间序列都由特定中心频率和有限带宽的本征模态所构成[12]。在多维序列特征的模态分解过程中,首先要对每个分解出来的子序列模态分量进行希尔伯特变换,计算出相关的解析频率信号;然后通过估计指数来调整序列的中心频率,实现对各频谱的基带区域转移;最后利用解调信号的带宽平滑度生成约束变分式,以提高多模态的解列度。构建的约束变分模型[13]为:

(2)

式中:t为时间;μk为各层模态分量的函数;ωk为各层模态对应的中心频率;δ(t)为单位脉冲信号;∂t为偏导的运算符;*表示卷积运算;K为模态分解层的数量;f为原始序列信号的函数。

为了能够快速求解上述含条件极值的多元函数优化问题,采用二阶惩罚项因子α和拉格朗日乘子λ来消除变分模型的条件约束性,进而可以将约束变分问题转化为非约束变分的问题。其模型转换扩展的拉格朗日表达式为:

(3)

通过使用交替方向乘子法结合傅里叶变换,可以计算出各层的泛函分量和容限频率,接着可以得出优化后的模态分量μk和中心频率ωk。其交替迭代更新方向的泛函计算公式如下:

(4)

综上所述,VMD算法是强大的非线性自适应模态特征处理方法,它的核心思想是:最小化带有约束条件的数学规划问题,这个规划问题的目标是找到一组固有模态函数,使得这些函数的带宽之和达到最小值。该特征工程算法在处理复杂非线性光伏时间序列信号采样和降噪等方面均表现出强大的鲁棒性,具有重要的现实工程意义。

3 基于ISSA-LSTM的光伏功率预测模型

3.1 SSA及其改进

SSA是元启发式智能优化算法,其设计灵感源自于麻雀的搜索觅食行为。该智能算法将麻雀寻找到的食物位置和躲避危险的行为作为全局优化变量,以解决麻雀群的位置更新问题。在迭代移动过程中,麻雀最终找到的食物位置象征着全局搜索到的最优解。下面将简单描述SSA的全局搜索位置更新[14]过程。

a)在搜索阶段,麻雀会在集合区域内尽可能地寻找已存在的食物源,具有高适应度的麻雀被称为发现者,它们的主要任务是探寻食物位置,并共享其位置为整个种群指明寻找的方向。发现者麻雀位置更新的公式为:

(5)

式中:Di,j为第i个麻雀在第j维度的位置;T为最大迭代次数;α为[0,1]之间的随机数;Q为服从正态分布的随机数;R2为预警值;ST为安全阀值;E为元素均为1的1×d维矩阵,d为全局优化变量的数目。

b)在跟踪阶段,被称为跟随者的麻雀会根据上一阶段被称为发现者麻雀的提示,缩小其区域搜索范围,并深入邻域进行探索。他们会根据发现者麻雀提供的位置来同步更新自身位置,逐步靠近目标食物位置,这种寻优方式有助于提升全局解的质量。跟随者麻雀位置更新的公式为:

(6)

式中:Dpbest为个体搜索的最佳位置;Dworst为麻雀搜索的最差位置;A+=AT(AAT)-1,A为随机赋值±1的1×d阶矩阵;N为种群数量。

c)在攻击阶段,被称为攻击者的麻雀会对已确定食物源的位置进行精确定位,并在该食物源邻域范围进行搜寻,它同时会根据已知的食物源位置迅速调整自身的移动方向,尽可能地靠近已搜寻到的食物源。攻击者麻雀位置更新的公式为:

(7)

式中:Dgbest为全局搜索的最佳位置;β为步长控制的随机数;q为服从正态分布的随机数;ε为避免分母为0的最小常数;Fi为麻雀的个体最优适应度;Fg为麻雀的全局最优适应度;Fw为麻雀的全局最差适应度。

通过观察得出:发现者麻雀和跟随者麻雀的角色是动态变化的,任何可以找到更近食物源位置的麻雀都有可能成为新的发现者麻雀。尽管麻雀的角色是可以变动的,但发现者和跟随者在麻雀种群中的数量比例始终保持恒定[15]。当麻雀感知到外部环境存在威胁时,外围的麻雀会快速向安全区域转移,而中心的麻雀则会随机移动方向。SSA程序设计步骤如下:

步骤1:初始化麻雀种群和迭代次数。

步骤2:计算出个体适应度,从大到小排序。

步骤3:更新发现者和跟随者的位置。

步骤4:更新攻击者位置的麻雀。

步骤5:计算新适应度,并更新麻雀位置。

步骤6:若满足要求,输出结果;否则,重复步骤2—6。

在利用SSA对目标函数进行优化时,初始的种群位置是完全随机分布的,这会导致算法的收敛速度很慢,且容易陷入局部最优解。为了改善算法在性能上的问题,本文利用混沌映射策略来初始化麻雀的位置。其混沌映射策略具有随机性、规律性和遍历性的特点,可以使种群在初始化过程中的分布变得更加均匀,提高了全局搜索的能力。通过将搜索区域范围内的序列混沌投影,可以生成一系列初始的位置,使得麻雀种群可以更好地探索整个搜索空间,加快了算法的收敛速度,也避免了陷入局部最优解。因此,将混沌映射策略应用于SSA的种群位置初始化是一种有效的改进方法。

在ISSA中,可以选择不同类型的线性混沌映射策略,例如Logistic映射和Tent映射等,不同混沌映射策略对种群位置初始化分布有着很大的区别。Logistic映射分布不均匀,这会严重影响全局搜索最优解的精度。相比之下,Tent映射能够均匀地将位置参数分布到各个维度上,具有更好的遍历性。因此,本文选择Tent映射来初始化种群的分布位置。其Tent映射表达式如下:

(8)

式中:pn为第n次迭代时的映射函数值;u为麻雀种群位置的混沌分布系数。

3.2 LSTM神经网络

LSTM神经网络是由多层网络所构建的深度学习模型,它是由循环神经网络改进结构后的特殊组成形式[16]。与循环神经网络不同的是,LSTM神经网络在其内部结构中增设了遗忘门、输入门和输出门。这种门控设计使得该模型具有选择性地保留或遗忘信息的能力,从而能够有效地处理时间序列数据,成功地解决了循环神经网络在训练过程中出现的梯度消失或梯度爆炸的问题[17]。因此,通过引入多级控制门机制,可以使得LSTM神经网络更加稳定地预测多特征时间序列。其网络内部结构如图1所示。其中:f(t)、i(t)、o(t)分别为遗忘门、输入门、输出门的状态信息;a(t)为输入门的候选状态信息;c(t)、h(t)分别为记忆状态、隐藏状态的信息。

图1 长短期记忆神经网络结构Fig.1 LSTM neural network structure

由图1可以看出,本文的LSTM神经网络是由多层链式门结构所构建的,遗忘门负责决定时间序列信息的筛选,输入门负责确定新选择信息的存储量,输出门负责控制传输信息的强度[18]。通过多结构门的协同耦合工作,深度神经网络就能够进行高维特征时间序列的过滤和保存。

a)遗忘门是LSTM神经网络状态传递的重要组成部分,其主要功能是处理来自上一时刻单元的时间序列状态信息,进而决定输入特征的时间序列状态信息应是被保留还是应该被遗忘。遗忘门输出信息状态更新公式如下:

f(t)=σ(Wfh(t-1)+Wfx(t)+bf).

(9)

式中:σ为Sigmid激活函数;h(t-1)为上时刻的隐藏状态;x(t)为当前的输入序列;bf为遗忘门的偏置矢量;Wf为遗忘门的权重矩阵。

b)输入门主要负责控制时间序列信息进入细胞单元状态的变化程度,以此决定需要更新的时间序列状态信息,这有利于将新候选信息添加到原始状态中。输入门输出信息状态更新公式如下:

i(t)=σ(Wih(t-1)+Wix(t)+bi),

(10)

a(t)=tanh(Wah(t-1)+Wax(t)+ba).

(11)

式中:i(t)为输入门的当前状态;Wi、bi分别为输入门σ的权重矩阵和偏置矢量;Wa、ba分别为输入门tanh的权重矩阵和偏置矢量。

c)细胞状态更新是通过叠加过去信息和现在信息所获得的状态来实现的。它将遗忘门决定的初始序列状态信息保留,同时利用输入门来筛选新候选的时间序列信息,最后将输入状态信息添加到原始细胞状态中,这样就实现了初始细胞状态的序列信息更新。细胞状态更新的公式如下:

C(t)=f(t)*C(t-1)+i(t)*a(t).

(12)

式中:C(t)为当前的细胞单元状态;C(t-1)为上时刻的细胞单元状态。

d)输出门是通过结合短期信息与当前输入信息生成的状态,加上长期信息叠加步长信息后得到的长短期记忆结构。这种混合结构可以决定每个时间状态的更新,进而记住新的时间序列特征,其生成的信息序列用于更新细胞的记忆状态[19]。输出门状态更新的公式如下:

o(t)=σ(Woh(t-1)+Wox(t)+bo).

(13)

h(t)=o(t)tanh(C(t)).

(14)

式中:Wo为输出门的权重矩阵;bo为输出门的偏置矢量;h(t)为隐含层的输出向量。

e)经过上述步骤,共同更新了当前时刻的输出状态序列,其计算公式为:

(15)

3.3 ISSA-LSTM组合模型的构建

本文构建的ISSA-LSTM组合模型同时结合了ISSA和LSTM神经网络。大量研究表明,尽管LSTM神经网络对于单特征时间序列具有较好的拟合性能,但其收敛速度和泛化能力仍受到最大迭代次数、隐藏层神经元个数和学习率等网络超参数的影响[20]。因此,通过利用ISSA对LSTM神经网络中的最大迭代次数、隐藏层神经元个数和学习率等网络超参数进行全局迭代寻优,可以使得组合模型的拟合精度变得更高。ISSA-LSTM组合模型构建流程如图2所示,主要步骤[21]包括:

图2 ISSA-LSTM组合模型构建流程Fig.2 Building procedure of ISSA-LSTM combined model

a)数据预处理:包括数据清洗、行列式标准化和格式归一化等步骤,以确保数据完备性。

b)初始化ISSA的运行参数:包括麻雀种群的规模、最大迭代次数和可控变量的位置等。

c)设置LSTM神经网络初始超参数:包括最大迭代次数、隐含层神经元个数和学习率。

d)开始优化LSTM神经网络超参数:使用ISSA对LSTM神经网络超参数进行全局寻优,利用随机梯度下降法来最小化均方根误差。

e)预测与评估:使用训练好的LSTM神经网络进行高维特征序列的预测,比较预测结果和实际值的均方根误差来评估其组合模型性能。

4 基于VMD-ISSA-LSTM组合模型的光伏功率预测

传统VMD算法在分解复杂非线性时间序列方面表现出色,可以应用于处理多特征的光伏时间序列数据[22]。在光伏时间序列预测过程中,首先需要对光伏时间序列信号进行预处理,进一步消除环境噪声和非线性干扰因素;然后使用VMD算法对处理过的多维光伏时间序列进行模态特征分解,以提取更有价值的模态序列分量;最后利用已经训练好的VMD-ISSA-LSTM组合模型进行多维模态光伏时间序列的特征分量预测,并将其模态预测序列分量组合成最终输出结果[23]。组合模型的短期光伏发电功率预测流程如图3所示。

图3 基于VMD-ISSA-LSTM模型的光伏功率预测流程Fig.3 PV prediction procedure based on VMD-ISSA-LSTM model

5 实验结果分析

本文以广东省某工业园区的实际光伏发电数据作为基础,构建了VMD-ISSA-LSTM组合模型进行光伏功率预测。由于实际光伏发电功率存在严重的瞬时不确定性,选用单步计量的方式进行多维度的数据采集,采样时间跨度从2023年3月1日至2023年6月15日,平均每天采集96个点,确保每15 min计量装置后台记录一次,以实现高质量的特征数据采集和信息传输。通过传感器获得的数据,分别使用LSTM神经网络模型和VMD-ISSA-LSTM组合模型对光伏发电功率进行短期预测,并将模型预测结果与实际历史光伏发电功率进行比对,从而验证所提出组合模型的拟合稳定性和预测精确性。

5.1 变分模态分解仿真

在处理光伏时间序列数据的过程中,分解层数的选择是特征算法的核心环节,这个参数的设置直接影响序列信号分解效果的优劣:如果该层值设定过小,可能导致高维模态而产生混叠现象;若该层值设定过大,则可能引发模态重复或噪声干扰等问题。考虑到光伏时间序列数据会因环境变化而呈现出明显的非线性特征,于是本文选择7层模态分量作为光伏序列数据分解的层数。同时,为满足特征算法的分解机制,还应该设定相应的运行参数:惩罚因子设置为2 000;中心频率设置为0;收敛因子设置为10-7。通过特征参数的选择,光伏时间序列数据可以成功地被分解为7层本征模态分量的集合。模态分解结果如图4所示。

图4 VMD算法的模态分解结果Fig.4 Modal decomposition results of VMD

从图4可以观察到:经过VMD算法处理的光伏时间序列数据,各层模态特征分量均呈现出明显的规律性和周期性,其频率相对稳定,没有出现频谱混叠的现象,表明光伏数据预处理步骤已成功完成。这不仅验证了所选择VMD算法作为特征工程处理的正确性,也证实了本文经验设定其内部运行参数的合理性,这都为接下来的组合模型的训练和预测工作提供了坚实的基础。

5.2 组合模型的超参数优化结果

本文采用VMD-ISSA-LSTM组合模型对光伏发电功率序列进行短期预测,通过优化最大迭代次数、隐藏层神经元个数和学习率,提升了组合模型的拟合精度。在应用ISSA优化LSTM神经网络超参数的过程中,设定的种群规模为100组,控制变量维度设定为3个;其中,最大迭代次数变量的范围设置在100~500之间,隐藏层神经元的数量范围设置在50~300之间,学习率更新的搜索范围设置在0.001~0.01之间。经过多组仿真试验,可以发现LSTM神经网络在最大迭代次数设为228、隐藏层神经元个数设为93、学习率设为0.01时,其组合模型的拟合效果最佳。SSA、ISSA在寻优过程中的误差变化曲线如图5所示。

图5 误差变化曲线Fig.5 Error variation curve chart

由图5可知:ISSA在迭代到341次后找到了最小均方根误差,使得LSTM神经网络能够更准确地预测光伏发电功率。通过与SSA优化LSTM神经网络误差曲线对比,验证了ISSA在迭代速度和收敛精度方面的优越性。

5.3 组合模型预测结果分析

为了说明本文所提出的VMD-ISSA-LSTM组合模型的鲁棒拟合性,分别使用LSTM神经网络模型、VMD-LSTM组合模型、VMD-SSA-LSTM组合模型和VMD-ISSA-LSTM组合模型对光伏特征序列数据进行短期日前预测的比较。在模型对比实验过程中,这些组合模型的周期均设置为24 h,共采集48个数据预测点。光伏发电功率预测结果对比如图6所示。

图6 光伏发电功率组合模型预测对比Fig.6 Comparison of PV power combined model prediction

从图6可以观察到:VMD-ISSA-LSTM组合模型预测曲线的拟合程度明显优于其他模型的预测拟合曲线,这表明本文所提出的组合模型在预测性能效果上有着更好的表现。为了验证该组合模型的鲁棒预测精度,通过比较多组模型预测结果与实际值之间的指标差异,进行组合模型的误差检验分析。其计算误差结果见表2。

表2 不同模型预测误差比较Tab.2 Prediction Results of Different Models

由表2可以看出:使用ISSA优化后的LSTM神经网络在拟合效果上有着明显提升。这说明这种网络超参数优化策略不仅可以减少人为经验设定参数导致的理论误差,还能很好地增强组合模型的拟合鲁棒性。因此,这种组合优化方法对于短期光伏发电功率的预测具有重要实践意义。

6 结论

针对光伏发电功率存在的随机波动性,本文提出了基于VMD-ISSA-LSTM组合模型的光伏发电功率预测方法。在构建组合模型时,充分考虑了模型设置的运行超参数,包括最大迭代次数、隐藏层神经元个数和学习率。通过将ISSA找到的最优超参数配置到LSTM神经网络的训练中,可以构建出更为精确的组合预测模型,从而更好地管理光伏发电系统,这对于光伏机组大量并网工业园区的优化调度有重要意义。主要研究成果如下:

a)利用VMD算法对5种采集的光伏时间序列特征进行多层模态分解,得到各层不同的高维本征模态分量以及残差项。

b)通过ISSA优化LSTM神经网络超参数,可以获得调参后的组合优化模型,从而避免了人为经验选择参数的系统误差性。

c)使用VMD-ISSA-LSTM组合模型对多维光伏特征序列数据进行预测,通过仿真对比,验证了该组合模型具有更强的拟合鲁棒性。

猜你喜欢
麻雀模态发电
“发电”
柠檬亦能发电?
拯救受伤的小麻雀
1958年的麻雀
麻雀
摇晃发电小圆球
摩擦发电
紧盯着窗外的麻雀
国内多模态教学研究回顾与展望
基于HHT和Prony算法的电力系统低频振荡模态识别