刘志超,袁三男,唐万成
(1.上海电力大学电子与信息工程学院,上海 200120;2.宁夏广播电视监测中心,宁夏银川 750003)
随着化石燃料的过度使用,化石能源的短缺以及环境污染问题愈发严重,大力开发推广清洁的可再生能源是实现可持续发展的重要方式[1]。光伏发电在我国一系列政策扶持下稳步发展,其装机容量不断上升,截至2018 年底,我国的光伏装机容量达到了1.74 亿千瓦,比上一年同比增长34%。精确的光伏发电输出功率预测可以有效减少不稳定的光伏发电并网对电网电压造成的波动,是保障电网经济平稳运行的重要措施[2]。
目前光伏输出功率预测方法主要包括时间序列法,随机森林模型,支持向量机模型以及神经网络模型等[3-5]。文献[6]针对不同气象条件分别构建基于差分整合移动平均自回归模型(ARIMA)时序序列的分布式光伏发电功率预测模型,取得较好的预测效果,但缺点是气象条件分类不明确以及对各气象因素缺乏相关性分析。文献[7]利用遗传算法优化神经网络参数并使用平滑控制策略减少预测的光伏功率波动,提高预测的稳定性。文献[8]利用深度学习算法中的深度置信网络以及长短期记忆网络构建组合预测模型,比经典的预测模型精度有了较大的提升,然而搭建的神经层过多导致训练难度提高,容易使预测模型陷入过拟合。因此有必要对光伏输出功率预测模型进行神经网络和其他模型的组合研究。
在此基础上,本文采用软阈值的小波降噪算法平滑曲线,降低噪声数据在训练模型时对模型预测精度的影响。使用灰色关联分析讨论各气象因素与输出功率的相关性,并设置阈值筛选出强相关气象因素。考虑到输出功率为非稳定时序序列,搭建双向长短期记忆网络(BLSTM)-随机森林的组合模型,将处理好的气象因素及历史功率构建训练集训练组合模型,最后输入待预测日的相关数据,得到当日的光伏发电功率预测值。
光伏发电的输出功率曲线在时域范围呈现不稳定性和波动性,外界的干扰极易造成输出功率的突变。以江苏省高邮振兴光伏发电站的实际数据为研究对象,该电站某3 日(共计146 个采样点)的输出功率曲线如图1 所示。发电站的输出功率具有间歇性,结合实际电站的地理位置设置观测的时间段为6:00 至17:45。由图1 可知光伏功率存在周期性,每日的输出功率变化趋势都是先升高再降低,并在中午前后达到当天输出功率的峰值。另外光伏输出功率曲线具有明显的波动性,功率的变化并不是平滑稳定的,信号存在噪声干扰,不利于预测模型对于输出功率曲线的拟合。为了消除输出功率中的噪声和干扰成分,本文采用小波降噪处理历史输出功率。
图1 光伏发电站3日的输出功率曲线
小波降噪是利用小波分解算法将带有噪声的信号分解为低频和高频的分量,通过阈值函数处理小波系数,再将小波系数重构为去噪后的信号。常见的小波阈值函数有软阈值和硬阈值,其中软阈值函数可以在保留大部分的有效信息的前提下,使数据曲线相对平滑,有效地消除噪声和信号突变。软阈值函数的公式如式(1)所示。
利用小波降噪处理输出功率的步骤为:(1)输入含噪声的输出功率数据,选取小波基和分解层数,将功率数据分解为高频和低频的小波系数,考虑到光伏数据的特性和维度,本文选取平滑性高的db4 小波基进行2 层的小波分解;(2)选取合适的阈值和阈值函数处理小波系数,消除高频的噪声信息;(3)利用阈值处理后的小波系数重构输出功率曲线,达到数据平滑的目的。
考虑到光伏输出功率变化受多种复杂因素同时影响,本文首次提出使用灰色关联分析对各影响因素与功率的相关性进行分析研究,筛选强相关特征构建训练集。灰色关联分析具体步骤包括四步。
(1)分别使用m点的输出功率和n个影响因素的数据构建参考数列和比较数列:
式中:a0m为第m点的输出功率;aim为第m点的第i个影响因素,i=1,2,…,n。
(2)由于影响因素与输出功率之间的量纲不同,利用式(3)进行去量纲处理。
式中:A0(j)为第j点的功率;Ai(j)为第j点的第i个影响因素的数据;ρ 为分辨系数,取值范围一般在[0,1],本文中ρ 取0.5。
(4)计算第i个影响因素的灰色关联度:
BLSTM 模型作为深度学习模型具有很强的非线性曲线拟合能力,且独有的结构使得模型处理时序序列数据能力大幅提升,但该模型的训练成本较高,且容易陷入过拟合。随机森林模型利用多个分类回归树(CART)对结果进行投票输出,具有收敛快、调参少、不易陷入过拟合等优势,然而在处理时序序列时无法充分学习训练数据与预测值的复杂关系。本文搭建BLSTM 与随机森林构建组合模型,有效地利用了BLSTM 对于时序序列的双向处理能力以及随机森林的高精度预测能力,提高短期光伏输出功率的预测精度。
图2 基于BLSTM-随机森林的短期光伏功率预测流程
BLSTM-随机森林短期光伏功率预测模型流程图如图2所示。首先对历史光伏发电功率进行小波降噪,选取db4 小波作为小波基,将输出功率分解为高频和低频的小波系数,采用固定阈值和软阈值函数的方式处理小波系数,剔除高频部分的噪声信号,再将小波系数重构为平滑的功率曲线。利用灰色关联分析求得影响因素与输出功率之间的灰色关联度,设立阈值筛选强相关特性。小波降噪后的历史输出功率与灰色关联分析处理的影响因素构建训练集。再对训练数据进行预处理操作,连续型变量归一化处理。
建立BLSTM-随机森林模型,考虑到过多的深度学习网络层会导致训练时间长,模型难以收敛,搭建浅层的BLSTM神经层,该层由前向LSTM 层、后向LSTM 层以及两层全连接层组成。上述的模型收敛后将经过BLSTM 层处理生成的序列以及全连接层处理得到的结果作为训练数据输入随机森林模型进行最终的输出功率预测。
算例数据来自江苏省高邮振兴光伏发电站2017 年真实输出功率数据,时间为5 月1 日至6 月30 日,每日的数据采样时间为6:00 至17:45,间隔为15 min,共计48 个采样点。用上述时间的历史功率及影响因素构建训练数据,预测7 月1日至7 月3 日光伏输出功率。
使用平均绝对百分比误差(MAPE)以及均方根误差(RMSE)作为评判模型光伏功率预测精度的标准。MAPE与RMSE的公式如下:
式中:yireal为第i个采样点输出功率的真实值;yipre为第i个采样点输出功率的预测值;n为采样点个数,本文为48。
首先使用小波降噪处理历史输出功率数据,消除数据中的高频噪声。发电站某日(48 个采样点)小波降噪前后的输出功率曲线对比如图3 所示,降噪前曲线波动较大且存在多处突变的尖峰点,经过小波降噪处理后,功率曲线既保留了有效信息,又去除了噪声点,使得曲线更加平滑。
图3 小波降噪效果对比图
因光伏发电受多种气象因素影响,本文采用灰色关联度筛选强相关因素。选取2 个月的光照辐射、组件温度、环境温度、海拔、湿度作为候选气象因素,并选取不同跨度的历史输出功率计算训练样本的灰色关联度结果如表1 所示。由表1 可知,光照辐射与环境温度的相关度较高;组件温度随环境温度的变化有一定的延迟导致其相关度较低;海拔和相对湿度受当地地理环境影响变化相对稳定,故两者相关性最低。此外历史输出功率的相关性随着时间间隔的增加而不断减小。灰色相关度高于0.5 的影响因素为强相关影响因素,选取光照幅射,环境温度以及预测点前3 小时内的历史数据作为模型的输入。
表1 各影响因素的灰色关联度
在数据输入模型训练之前需要对数据进行归一化,加快模型训练速度,如式(8)所示。
式中:P、P'分别为归一化前与归一化后的数据;Pmax、Pmin分别为当前数列中的最大值与最小值。
经过预处理后的训练数据以9∶1 的比例划分训练集和测试集。BLSTM 模型学习率取0.000 1,损失函数选用均方误差(MSE),训练中的梯度下降算法使用Adam 算法,提高误差函数梯度的收敛速度。BLSTM 层的神经元个数是影响模型的重要参数,适当增加神经元个数可以有效提升模型的非线性拟合能力,但过多的神经元不仅会影响训练模型速度,还容易陷入过拟合,降低预测精度。对BLSTM 层的神经个数进行对照实验,结果如表2 所示,BLSTM 层的神经元个数为128 时,模型的准确率最高。随机森林模型使用网格搜索确定树的个数为150。
表2 BLSTM 层神经元个数对预测精度的影响
为了验证本文所提方法的有效性,设置了以下两种方案进行对比。选取了BLSTM、随机森林两组单一模型进行输出功率预测,并与BLSTM-随机森林模型比较。BLSTM 模型包含两层神经元为128 的LSTM 层,随机森林模型树的个数为150。预测出的7 月1 日-7 月3 日(共计146 个采样点)的输出功率曲线与实际输出功率曲线如图4 所示,BLSTM 模型的预测值与真实值存在一定的延时,随机森林模型在功率变化较大的时段表现较差,BLSTM-随机森林模型对于不同发电情况下的输出功率都能准确预测。
针对不同的算法模型,本文也进行了比较实验。支持向量回归机模型(SVR)使用高斯径向基函数(RBF)作为核函数,惩罚系数c=1.0。同时为了验证本文搭建的BLSTM 层处理时序序列的能力,构建BLSTM-SVR 的组合模型预测光伏发电输出功率,模型参数与单一的模型相同。不同模型预测结果如表3 所示。
图4 不同模型预测的结果对比
表3 不同模型的测试结果
由表3 可知,BLSTM-随机森林模型相比于BLSTM 模型和随机森林模型预测精度有较大的提高,尤其与BLSTM 模型相比,预测误差下降了3.17%,组合模型在一定程度上弥补了各自的缺点,综合提升了预测模型的性能。此外,BLSTMSVR 模型预测误差也小于单一的SVR 模型,证实了BLSTM提取输入数据的深层特征可以有效提高模型的预测精度。BLSTM-随机森林模型具有最小的MAPE和RMSE,分别为3.42%和0.78 MW,体现了组合模型的优越性。
针对实际光伏发电站的光伏输出功率预测,本文利用小波降噪去除历史输出功率中的噪声,采用灰色关联分析筛选强相关影响因素并与降噪处理后的历史功率作为训练数据,建立BLSTM-随机森林模型预测光伏输出功率。仿真实验结果表明:该模型在短期光伏功率预测任务中具有较高的预测精度和泛化能力,实用性良好。