邱瑞东,何 山,2*,董 宁,王冉旭,董广凯
(1.新疆大学 电气工程学院,新疆 乌鲁木齐 830049;2.新疆大学 可再生能源发电与并网技术教育部工程研究中心,新疆 乌鲁木齐 830049)
受天气状况及光伏电站自身环境影响,光伏发电功率出现较大的随机性和波动性,对电网产生不良影响.及时准确预测光伏电站出力,有助于电网调度及电力系统安全稳定运行.
针对序列数据的光伏功率预测方法有:时间序列、支持向量机、决策树以及神经网络法.基于机器学习的方法能处理辐照强度与光伏出力、温度等因素间的非线性关系.文献[11]采用小波神经网络构建太阳辐射量预测模型,通过数据预处理及结构优化,有效提升了预测精度.文献[12]针对光伏电站出力预测模型结构复杂、泛化能力低的问题,提出了基于深度信念网络的预测模型,采用重构误差法确定隐含层数,该模型预测精度高、运算量低.文献[13]提出基于改进BP(back propagation)神经网络的光伏电站辐照强度预测模型,但因天气类型划分太复杂,该模型难以适应复杂天气下辐照强度的波动性.在光伏功率预测中,单一模型存在局限性,而组合模型能得到不同数据的特征,故组合模型具有较高的预测准确性.
长短时记忆网络(long short term memory network,简称LSTM)是一种改进的循环神经网络模型,由于具有特殊的门及记忆结构,能处理序列数据的预测问题.轻梯度提升机(light gradient boosting machine 简称LightGBM)模型在保证良好预测精度的同时极大提升了辐照强度的预测速度.该文在LSTM和LightGBM模型的基础上,提出二者的组合(LSTM-LGB)模型,对光伏电站辐照强度进行预测.首先,对辐照强度历史数据及光伏电站气象数据进行特征分析,找出关联度高的影响因素,再构造特征;然后,对辐照强度进行预测;最后,比较不同模型的预测精度.
LSTM利用单元状态、输入门、输出门及遗忘门间的关系,解决了循环神经网络中的梯度消失问题.LSTM按顺序处理数据,记忆单元通过门操作进行信息存储.LSTM模型结构如图1所示.
图1 LSTM模型结构
图1中,f
<>为遗忘门,i
<>为输入门,o
<>为输出门,c
<-1>为记忆单元状态,σ
为非线性sigmoid函数.LSTM接收当前时刻的输入x
<>及上一时刻隐藏状态的输入h
<-1>.LSTM中相关单元状态及信息流的表达式为f
<>=σ
(W
x
<>+W
h
<-1>+b
),(1)
i
<>=σ
(W
x
<>+W
h
<-1>+b
),(2)
o
<>=σ
(W
x
<>+W
h
<-1>+b
),(3)
(4)
(5)
h
<>=tanh(o
<>⊙c
<>),(6)
LightGBM是基于梯度提升决策树(gradient boosting decision tree,简称GBDT)的改进模型.尽管GBDT在很多机器学习任务上表现出好的学习效果,但是随着数据量的几何级增长,出现了过拟合、训练速度慢等问题.LightGBM模型包括直方图算法以及带深度限制的Leaf-wise决策树生长策略,在不降低预测准确性的同时,能加快预测速度并降低内存使用率,适应了辐照强度预测中的大数据特性.
LightGBM模型中的直方图算法,将连续特征值分为k
个间隔,在k
个间隔中选择划分点.因此,它的训练速度和空间效率均优于GBDT.直方图算法具有正则化效果,可有效防止过拟合.图2为带深度限制的Leaf-wise生长方式,与其他生长方式相比,这种方式生长相同叶子时,可减少更多误差.图2 带深度限制的Leaf-wise生长方式
LightGBM为树模型,LSTM为神经网络模型,该文将二者组合得到LSTM-LGB模型,以提高辐照强度预测的准确性.图3为该文提出的LSTM-LGB模型结构.
图3 LSTM-LGB模型结构
两种模型分别对辐照强度数据样本进行训练,由于LightGBM的训练速度快,故将LightGBM模型的预测结果作为LSTM的一个特征输入.得到LSTM及LightGBM的预测结果后,采用误差倒数法对以上两种模型数据进行加权组合,得到组合模型的预测值为
(7)
其中:w
,w
分别为LSTM和LightGBM对应的权重系数;u
,u
分别为LSTM和LightGBM的预测误差.通过对误差小的模型赋予较大的权重,能够取长补短,降低整个组合模型的预测误差,从而提升光伏电站辐照强度的整体预测效果.温度、风速及风向等因素对辐照强度有不同程度的影响,因而辐照强度表现出较强的随机性和波动性.对异常数据,需要预处理,将异常数据替换为其前后数据的平均值.通过合理的数据处理,可使辐照强度预测模型取得较好的预测效果.
实验硬件平台为Intel(R)Core i5-5200U CPU@2.20 GHz.使用Python3.7语言实现所提组合模型.该文使用的数据为某光伏电站现场收集的9 600个实测样本数据,前9 000个样本数据作为训练集,后600个为测试集.每个数据包括辐照强度历史数据、气象数据及光伏电站采集的数据.
选取MAPE及RMSE描述模型的相关预测效果,MAPE,RMSE的计算公式分别为
(8)
(9)
其中:K
为测试集的样本数;y
,y
分别为第i
个样本的实际辐照强度和预测结果.MAPE,RMSE越小,模型的预测精度越高.该文分析平稳天气以及突变天气下的预测结果,且将该文组合模型与其他模型的预测结果进行对比.
图4为平稳天气下3种模型的预测结果与实际数据的对比.由图4可知,该文LSTM-LGB模型的预测精度最高,LSTM模型误差最大,LightGBM模型的误差略小于LSTM.
图4 平稳天气下3种模型的预测结果与实际数据的对比
图5为突变天气下3种模型的预测结果与实际数据的对比.由图5可知,突变天气下,辐照强度波动性较大,该文LSTM-LGB模型仍能够很好地预测辐照强度,其预测误差最小,LSTM模型预测误差最大,明显高于LightGBM.
图5 突变天气下3种模型的预测结果与实际数据的对比
表1为两种天气下3种模型MAPE及RMSE的对比.由表1可看出: LSTM-LGB模型在两种天气下的MAPE及RMSE均最小;LSTM模型在突变天气下的MAPE及 RMSE,均明显大于LightGBM模型的,这是因为LSTM需要调节的参数较多,且突变天气下辐照强度波动较大.
表1 MAPE及RMSE的对比
图6为LSTM-LGB及XGB-LGB模型的预测结果对比.由图6可知,LSTM-LGB模型的预测结果好于XGB-LGB模型.
图6 LSTM-LGB及XGB-LGB模型的预测结果对比
LSTM-LGB模型的MAPE和RMSE,在平稳天气下分别为0.015,5.20,突变天气下分别为0.067,18.66;XGB-LGB模型的MAPE和RMSE,在平稳天气下分别为0.067,13.19,突变天气下分别为0.127,21.60.可见,相比于XGB-LGB模型,LSTM-LGB模型的预测精度更高.
笔者提出了一种基于LSTM和LightGBM的组合模型(LSTM-LGB),用于预测辐照强度.通过算例分析可知:辐照强度的数据特征直接影响模型的预测精度,辐照强度数据预处理对模型的预测精度有一定的提升;相对于LSTM,LightGBM,XGB-LGB模型,LSTM-LGB模型有最高的预测精度.预测光伏功率将为笔者后续的研究工作.