基于EOSSA-ELM的光伏短期输出功率预测

2022-07-18 03:05陈骏嚎刘广忱郭力萍李静宇
可再生能源 2022年7期
关键词:输出功率种群聚类

陈骏嚎,张 娜,刘广忱,郭力萍,李静宇

(内蒙古工业大学 内蒙古自治区电能变换传输与控制重点实验室,内蒙 古 呼和浩特 010000)

0 引言

光伏发电在电力行业的应用发展得愈加迅速[1]。光伏电站的大规模并网给电网带来了巨大冲击,对电网日前调度计划的合理性和经济性提出挑战。准确地预测光伏发电系统短期输出功率,有助于电网调度中心合理安排日前调度计划,减小并网光伏电站的经济损失,对电力系统的稳定运行具有重大意义[2]。

目前,国内外学者对光伏输出功率预测技术进行了大量研究。根据预测时间尺度的长短,可以把预测方法分为超短期(0~4 h)、短期(0~72 h)和中长期(30 d~1 a)[3]。根据预测方法的不同,光伏输出功率预测主要分为物理法、统计法和组合法。物理法是依据光伏电池的发电原理,通过气象数据信息与光伏电站的信息建立物理模型,经过计算得到光伏发电系统的输出功率值[4],[5]。物理建模方法比较依赖地理位置信息和气象数据的准确性,抗干扰能力差。统计法是通过输入气象因素和光伏发电系统输出功率等历史数据,建立输入与输出之间的映射模型,实现对光伏发电系统输出功率的预测[6]~[10]。文献[8]提出一种提升小波变换与BP神经网络相结合的预测方法。该方法可以有效地提高光伏超短期输出功率预测的精度,但BP神经网络存在收敛速度慢和易陷入局部极值的问题。文献[9]提出一种基于变分模态分解(VMD)和双重注意力机制LSTM的光伏短期输出功率预测方法。这种方法提升了单步、多步功率预测精度,但其计算成本较高,且分解序列预测再叠加的同时也产生了误差。组合预测法是综合考虑各模型的优缺点,取长补短,建立组合预测模型[11]~[16]。文献[12]将天气过程分类,继而建立CNNLSTM组合预测模型,实现了对不同天气类型的光伏输出功率预测。该方法的特异性不强,没能针对不同天气建立具有特异性的组合预测模型。

为了解决预测模型收敛速度慢、易陷入局部极值的问题,本文选择学习速率较快、学习参数简化的极限学习机(Extreme Learning Machine,ELM)作为基础预测模型。首先对数据进行分析、处理;然后介绍ELM的基本原理,接着对麻雀搜索算法(Sparrow Search Algorithm,SSA)进行改进;提出基于精英反向策略的麻雀搜索算法 (Elite Opposite Sparrow Search Algorithm,EOSSA); 最后建立EOSSA-ELM预测模型。通过算例的对比仿真分析表明,本文提出的EOSSA算法寻优能力更强,所建立的EOSSA-ELM光伏短期输出功率预测模型的预测精度更高。

1 输入样本数据处理

1.1 输入变量选择

根据光伏发电特性可知,光伏发电系统输出功率明显地受气象因素制约,主要有太阳辐照度、温度、湿度、风速和风向等。不同气象因素对输出功率的影响程度不同,选取相关性较强的气象因素可以有效地减小预测误差。本文采用皮尔森相关系数对所选地区光伏发电系统的输出功率与各个气象因素之间的相关性进行分析,结果如表1所示。

表1 气象因素的皮尔森系数Table 1 Pearson coefficient of meteorological factors

由表1可知,本文选择相关性较强的太阳辐照度、温度、湿度和风速作为模型的输入向量。

1.2 数据降维

根据皮尔森相关系数计算结果,确定聚类样本输入特征向量为日最大、最小和平均太阳辐照度,日最高、最低和平均温度,日平均风速,日平均湿度。特征向量A的表达式为

式中:Gmax,Gmin,Gavg分别为日最大太阳辐照度、最小太阳辐照度、平均太阳辐照度;Tmax,Tmin,Tavg分别为日最高温度、最低温度、平均温度;Vavg为日平均风速;Havg为日平均湿度。

特征向量A的维数较多,且相关性较大。主成分分析(PCA)是一种应用较为广泛的数据降维方法,可以很好地解决维数灾难、数据冗余问题[17]。

对特征向量A进行主成分分析,各个成分累计贡献率如图1所示。

图1 主成分分析累计贡献率Fig.1 Cumulative contribution rate of principal component analysis

由图1可知,当选取主成分数n=3时,成分累计贡献率为90.578 1%,可以代表原始数据的绝大部分信息。本文将所选的3个主成分作为选取相似日数据的输入向量。

1.3 数据聚类

选择与待预测日特征相似的历史数据训练模型可以大幅度提升预测精度。本文采用K均值聚类算法选择相似日[18]。通过对特征向量A的去冗余、降维处理,将所选的3个主成分作为样本数据聚类的输入向量,对样本进行聚类。K均值聚类的主要思想:首先,通过K-means人为给定聚类数目K,随机选取K个中心;再通过计算样本点与中心的距离,给每个中心点分配距离它较近的样本点;然后,更新聚类中心直到每个簇的均值向量,即聚类中心不再更新时迭代结束;最后产生K个特征不同的簇。然而,K均值算法的聚类数目通常须要人为给定,为了避免人为因素产生的误差,本文通过引入手肘法的误差平方和指标(SSE)来确定K值[19]。SSE表达式为

式中:Ci为第i个簇;x为Ci中的样本点;mi为Ci的质心(Ci中样本的均值向量);SSE为所有样本的聚类误差。

对原始数据进行聚类时,SSE随聚类数K的变化如图2所示。

图2 K-mean聚类SSE变化图Fig.2 K-means clustering SSE variation diagram

由图2可知,随着K值的增大,SSE逐渐减小;当K<5时,SSE下降幅度较大,当K>5时,SSE下降幅度较小。这是由于随着聚类数的增加,样本划分愈加精细,各簇内的相似程度也越高,因此SSE不断减小。当K值小于真实聚类数时,K的增加会大幅提高每个簇内的聚合程度,因此SSE会大幅下降。当K值大于真实聚类数后,随着K的增加,导致对聚合度的影响变小,SSE下降幅度也减小。因此,幅度变换的转折点就是真实的聚类数,所以选择聚类数为5。

2 预测模型

2.1 极限学习机

极限学习机(ELM)是由文献[20]提出的基于单隐层前馈神经网络(SLFNs)的算法,其网络结构如图3所示。

图3 ELM拓扑结构Fig.3 Topological structure of ELM

图3中,N为输入层和输出层节点个数;L为隐含层节点个数;j为隐含层中第j个节点;wj为第j个隐含层节点与输入层节点的权值(以下简称为输入权值);βj为第j个隐含层节点与输出层节点的权值(以下简称为输出权值)。

假设有N个样本点(xi,yi),输入变量为xi=[xi1,xi2,…,xiN]T∈Rn;期望输出为yi=[yi1,yi2,…,yiN]T∈Rm,则输出函数的表达式为

式中:H为隐含层输出矩阵;β为输出权值;T为网络计算输出。

H,β,T的表达式分别为

式中:H†为H的Moore-Penrose广义逆。

极限学习机的特点是输入层与隐含层间的权值及隐含层的阈值为随机给定。初始权值和阈值对预测精度影响很大,因此采用改进的麻雀搜索算法对极限学习机进行优化以提高预测的精度。

2.2 改进麻雀搜索算法

麻雀搜索算法是一种依据麻雀捕食与反捕食行为的新型群智能优化(SSA)算法[21]。SSA算法遵循以下准则:①种群分为3种类型,即发现者、追随者和预警者;②发现者为整个种群提供觅食方向和区域;③发现者和追随者按一定固定比例分配,发现者和追随者可以转换,但比例不变,预警者按一定比例随机产生;④一旦有捕食者出现,个体发出预警,预警值大于安全值,发现者带领追随者转移觅食;⑤追随者总是能搜索到发现者,并在周围觅食或争夺资源;⑥意识到危险,边缘麻雀会向安全区移动,以获得更好位置。

从以上规则可以看出,发现者对于整个种群寻优起着至关重要的作用,发现者位置更新的表达式为

式中:Xtn,d,Xt+1n,d分别为种群在第t次和t+1次迭代时,第n只麻雀在第d维变量的位置;α为(0,1]之间的随机数;iter max为最大迭代代数;Q为服从正态分布的随机数;L为元素全是1的1行d维矩阵;R2为预警值,通常是[0,1]内的随机数;ST为安全值,通常为[0.5,1]内的随机数,当R2<ST时,表示发现者处于安全位置,可以大范围觅食;当R2>ST时,表明有捕食者出现,种群须转移到安全的地方觅食。

(1)改进策略一:动态安全值

在SSA算法中,发现者负责寻找食物,并为整个种群提供觅食区域和方向,因此发现者的位置更新极为重要。发现者位置更新与安全值ST有关,在不同迭代时期选择不同的安全值可以帮助种群跳出局部最优解。本文ST选择非线性递减方式。ST的计算式为

式中:ST取值为[0.5,1];STmax为1;STmin为0.5;t为当前迭代数。

在迭代初期,ST取值较大,保证种群较大概率在安全位置大范围搜素最优解。在迭代后期,ST较小,种群可以较大概率跳出当前位置,跳出局部最优解。

(2)改进策略二:反向学习

SSA算法中,个体每次迭代后位置更新都与之前密切相关。如果淘汰较差个体,选出更加优秀的个体加入种群,就可以保证种群以更快的速度找到最优区域,寻找到最优解。

反向学习策略是针对一个问题的可行解生成它的反向解,通过比较其优劣,选出更优者作为下一代的个体[22]。反向学习策略基本定义如下。

定义1:反向点

计算生成的反向解若超出上边界,则取上边界;若低于下边界,则取下边界值。

SSA算法迭代过程中,每一代种群及精英个体的优劣对种群位置更新影响很大。因此,通过生成精英反向解有助于探索更多的优质空间,从而提高种群的多样性。

(3)EOSSA算法运行

EOSSA算法运行步骤如下:①初始化种群参数,计算初始种群的适应度并排序,选出最好适应度与最差适应度的个体;②随机产生预警值R,按公式生成安全值ST,并更新种群位置以及适应度值;③对麻雀种群进行精英反向学习,挑选较好的个体组成新种群进行下一次迭代;④判断是否达到精度或达到最大迭代次数,输出最好个体以及它的适应度值。

图4所示为EOSSA算法运行流程。

图4 EOSSA流程图Fig.4 Flow chart of EOSSA

2.3 EOSSA-ELM预测模型

EOSSA-ELM预测模型的预测步骤如下。

①收集所选光伏电站的历史输出功率与气象数据,为了消除量纲的影响,对数据进行归一化处理。②选择用于聚类的气象特征向量,并进行PCA降维处理。③采用K均值聚类选取相似日,将与待预测日处于一类的数据分为训练集和测试集。④采用EOSSA对ELM进行参数寻优,并建立EOSSA-ELM预测模型。

基于EOSSA-ELM的光伏短期输出功率预测流程如图5所示。

图5 EOSSA-ELM预测流程图Fig.5 Flow chart of EOSSA-ELM prediction

3 实际算例

3.1 算例介绍

本文选取澳大利亚沙漠太阳能研究中心(DKASC)某光伏电站作为研究对象。选取2014年1月1日-2015年12月31日光伏发电系统的输出功率与气象数据为原始数据。光伏发电系统输出功率与太阳辐照度有关,因此选取每天8:00-17:00,采样间隔1 h的数据进行研究。选取待预测日为2015年9月29日(晴天)和2015年12月17日(雨天)。

本文建立并训练Elman神经网络模型、ELM模型、SSA-ELM模型和EOSSA-ELM模型,各模型的输入向量为太阳辐照度、温度、湿度和风速,输出为光伏发电功率。

预测模型参数设定:ELM通过多次试验确定为4-11-1结构,Elman采取与ELM一样的结构。传统ELM输入权值及阈值为随机给定,优化后的ELM各参数经优化后给定。EOSSA算法种群规模为50,迭代100次,生产者占比20%,剩余为追随者,预警者随机产生,占比10%,ST最大为1,最小为0.5。

3.2 预测模型评估指标

本文采用均方根误差(RMSE)和平均绝对百分比误差(MAPE)作为模型的评价指标[23],[24]。

3.3 预测结果分析

2015年9月29日和12月17日,光伏发电系统输出功率的真实值,利用Elman神经网络模型、ELM模型、SSA-ELM模型和EOSSA-ELM模型得到的光伏发电系统输出功率预测值随时间的变化情况如图6所示。

图6 预测日光伏输出功率实际值和各个模型的预测值随时间的变化Fig.6 The change of the actual value of photovoltaic output power and the predicted value of each model with time on the forecast day

由图6可见,不论哪种天气条件,各模型预测值均能跟随真实值曲线趋势。在晴天条件下,随着时间推移,光伏发电系统输出功率先增大后减小,整体呈现平缓趋势;各个模型的拟合精度都比较高。这是由于晴天条件下,各气象因素较为稳定,光伏发电系统输出功率波动较小。在雨天条件下,随着时间推移,光伏发电系统输出功率波动较大。在11:00和15:00,4种模型的拟合精度都比较低;在其余时刻,EOSSA-ELM模型预测曲线比其他模型的预测曲线更加接近真实曲线。这证明了对ELM模型采用EOSSA算法优化后,预测性能更佳。

2015年9月29日和12月17日,Elman神经网络模型、ELM模型、SSA-ELM模型和EOSSA-ELM模型光伏发电系统输出功率预测值与真实值的相对误差随时间变化如图7所示。

图7 预测日各个模型的预测相对误差Fig.7 The prediction relative error of each model on the forecast day

由图7可知,在晴天条件下,ELM相关的3种模型的相对误差基本都保持在-5%~5%,唯有Elman模型误差相对较大。在雨天条件下,尤其在9:00,4种模型的相对误差均较高。这可能是由于气象变化剧烈或样本数据过少而导致。Elman和ELM模型在雨天比晴天误差高出很多,证明了其泛化能力不强,不能适应各种天气状况。对于预测的10个时间点,EOSSA-ELM模型相对误差有9个保持在-10%~10%,与其他模型相比,预测精度有很大提升。

2015年9月29日和12月17日,Elman神经网络模型、ELM模型、SSA-ELM模型和EOSSA-ELM模型的预测精度如表2所示。

表2 各模型评估结果Table 2 Evaluation results of each model

由表2可知,晴天天气下的各误差指标均优于雨天;与晴天天气相比,雨天天气时,Elman模型的RMSE和MAPE分别上升了0.433 6 kW和31.1%;ELM模型RMSE和MAPE分别上升了0.319 8 kW和22.89%。这是由于Elman神经网络采用梯度下降算法,存在训练速度慢和容易陷入局部极值的缺点,对神经网络的训练较难达到全局最优;ELM模型训练速度快,但初始权值、阈值对预测结果影响很大。因此,两者对不同天气状况下的光伏发电系统输出功率预测效果不佳,泛化能力不强。经过改进后的ELM,对比传统ELM精度都有所提升。在晴天条件下,EOSSA-ELM模型与Elman模型相比,RMSE和MAPE分别下降了0.095 4 kW和1.29%;与ELM模型和SSA-ELM模型相比,分别下降了0.075 2,0.046 9 kW和1.09%,0.58%。 在雨天条件下,EOSSA-ELM模型与Elman模型相比,RMSE和MAPE分别下降了0.348 1 kW和25.77%;与ELM模型和SSA-ELM模型相比,分别下降了0.2141,0.0749 kW和17.16%,3.51%。这表明EOSSA-ELM模型的预测误差较小,模型鲁棒性更好。

ELM和Elman神经网络模型的运行时间分别为1.37 s和7.02 s。由此可见,传统ELM明显快于Elman神经网络模型。采用改进算法后,SSAELM和EOSSA-ELM模型的运行时间分别为53.27 s和204.9 s,虽然运行时间变长,但预测精度得到了明显改善。

3.4 算法分析

图8为采取动态安全值策略后,EOSSA算法的安全值随进化代数的变化情况。

图8 动态安全值Fig.8 Dynamic safety value

由图8可知,安全值随进化代数呈现非线性递减趋势。本文设定:在迭代初期ST保持较大的值,而预警值R2为[0,1];R2大概率小于安全值ST,可保证种群在安全区域寻优;到后期以较小的安全值ST,就可保证种群有几率可以跳离当前位置,从而减小种群陷入局部最优解的概率。

图9为采取精英反向学习策略后,EOSSA算法新增种群占优个数随进化代数的变化情况。

图9 反向学习结果Fig.9 The result of opposition-based learning

由图9可知,随着种群不断进化,新增种群占优个数呈现先急剧下降后逐渐平缓下降的趋势。这证明每次迭代结束后,有比种群个体更好的反向解个体存在。刚开始迭代时,由精英反向学习策略产生反向解个体,在种群中适应度较好的个体占半数以上。随着迭代次数的不断增加,这些个体被不断添加到种群中,使种群更加快速接近最优解区域,因而后面新增种群占优个数下降趋势平缓,而标准SSA算法只能通过不断迭代更新位置来逼近最优解区域。相比之下,改进后的算法寻优速度会快很多。2015年9月29日和12月17日,SSA和EOSSA算法的收敛曲线如图10所示。

图10 SSA和EOSSA算法收敛曲线Fig.10 Convergence curves of SSA and EOSSA algorithms

由图10(a)可知,EOSSA算法的收敛速度略快于SSA,在最后的收敛精度上略强于SSA算法。这是由于在晴天光伏出力较为平缓,算法的寻优能力显示不出很大的差别。由图10(b)可知,与SSA算法相比,EOSSA算法在收敛速度以及跳出局部极值方面都有明显改善。正是由于动态安全值ST和精英反向学习两种策略相结合,EOSSA算法才表现出良好的的全局寻优能力。

从图10的收敛曲线也可以看出,改进后的算法跳出局部极值的能力得到了加强,改进后的EOSSA算法的收敛速度得到明显改善。

4 结语

为了提高光伏发电系统短期输出功率的预测精度,本文在SSA算法的基础上,提出了EOSSA算法,建立了Elman神经网络模型、ELM模型、SSA-ELM模型和EOSSA-ELM模型。利用这4种模型对光伏短期输出功率进行预测,分析了算法的寻优能力及各模型的预测性能。

①与标准SSA算法相比,EOSSA算法的收敛速度更快,寻优能力更强,证明了动态安全值和精英反向学习策略的有效性。

②气象因素对模型的预测性能有很大影响。晴天条件下,各模型均能取得较好的预测效果;在雨天条件下,未经优化的模型精度下降,泛化能力不强。

③在晴、雨两种天气条件下,与Elman,ELM,SSA-ELM模型相比,EOSSA-ELM模型的预测精度较高。这证明了本文提出的预测模型鲁棒性较好。

猜你喜欢
输出功率种群聚类
山西省发现刺五加种群分布
一种傅里叶域海量数据高速谱聚类方法
基于知识图谱的k-modes文本聚类研究
基于数据降维与聚类的车联网数据分析应用
基于模糊聚类和支持向量回归的成绩预测
由种群增长率反向分析种群数量的变化
感应加热电源的调频调功研究
磁耦合谐振串串式无线电能传输研究
种群增长率与增长速率的区别
种群连续增长模型的相关问题