收稿日期:2022-10-23
基金项目:国家自然科学基金(51877070);河北省重点研发计划(19214501D;20314501D);河北省自然科学基金(E2021208008)
通信作者:李 争(1980—),男,博士、教授,主要从事新型电机和可再生能源发电方面的研究。Lzhfgd@163.com
DOI:10.19912/j.0254-0096.tynxb.2022-1608 文章编号:0254-0096(2024)02-0460-09
摘 要:由于光伏发电的随机性和不稳定性会影响功率预测的精度,提出一种基于皮尔逊相关系数(PCC)、K-均值算法(K-means)、变分模态分解(VMD)、麻雀搜索算法(SSA)、核函数极限学习机( KELM)的光伏功率短期预测模型。首先,用PCC选取主要因素作为输入;K-均值算法进行相似日聚类,将历史数据聚类为晴天、多云和雨天;其次,VMD对原始信号进行分解,充分提取集合中的输入因素信息,提高数据质量;SSA优化KELM模型的核函数参数和正则化系数解决其参数选择敏感问题;最后,将不同序列预测值叠加得到最终预测结果。仿真结果表明,所提相似日聚类下PCC-VMD-SSA-KELM模型具有较小的预测误差。
关键词:光伏发电;功率预测;变分模态分解;K-均值;麻雀算法;核函数极限学习机
中图分类号:TM615 """""""""" """""" 文献标志码:A
0 引 言
随着传统化石能源的过度开采和广泛使用,能源短缺和环境污染问题日益严峻,开发和利用可再生能源成为世界各国能源发展战略的重大举措。太阳能由于储量大、清洁环保而被广泛利用[1-2],但光伏发电具有明显的波动性、随机性、不稳定性,大规模并网无法制定合理的调度方案,因此需对光伏发电功率进行准确预测,保障电网稳定运行[3-4]。
光伏功率预测方法可分为物理模型、传统统计模型、智能模型和混合模型[5]。物理模型侧重数值天气预报(numerical weather prediction,NWP)模型,通过分析环境数据进行预测。但光伏发电厂初始条件较复杂,最终计算结果受到限制。传统统计模型一般采用传统方法处理光伏发电历史数据,如卡尔曼滤波、贝叶斯回归等,由于传统模型具有线性性质,不能用于非线性非平稳数据。智能模型涉及到各种智能方法,如支持向量机、人工神经网络等,与统计模型相比,具有较强的非线性预测能力。近年来,混合模型越来越受到欢迎,单一方法可集成在混合模型中,以获得比任何单一方法效果更好的光伏功率预测。
混合模型一般由数据预处理和预测两部分组成。文献[6]利用皮尔逊相关系数(Pearson correlation coefficient,PCC)选择对光伏输出功率影响较大因素作为预测模型输入,获得较好的预测效果。文献[7]选用K-均值算法对天气类型进行聚类,分别预测不同天气类型,以此来减小预测误差。为降低光伏功率序列的不确定性和随机性,可采用原始信号分解,小波分解(wavelet decomposition,WD)、经验模态分解(empirical mode decomposition,EMD)、集合经验模态分解(ensemble empirical mode decomposition,EEMD)都是典型的信号分解算法,但其存在端点效应,变分模态分解(variational mode decomposition,VMD)无论在分解精度还是抗噪性上都有很好性能,且可以解决端点效应。文献[8]利用VMD对原始信号进行分解,经VMD分解信号预测精度更高。因此本文提出的混合模型采用K-均值算法、PCC以及VMD。
极限学习机是黄广斌等[9]提出的一类神经网络预测算法,具有很强的泛化性能。ELM通过固定连接权值计算神经网络中单个隐层的偏置,来提高学习效率,优化训练过程和终止条件,避免局部收敛。核函数极限学习机(kernel based extreme learning machine, KELM)在ELM基础上利用惩罚系数对模式进行优化,并应用核函数替换隐含层中的节点[10]。文献[11]利用KELM模型对短期光伏功率进行预测,取得较好预测结果。尽管KELM在某些应用中可处理非线性映射,但预测结果对参数设置非常敏感。利用优化算法可解决KELM对参数选择的敏感问题。不同优化算法可能影响光伏功率预测最终性能。文献[12]利用蝗虫算法,增加了种群的多样性;文献[13]采用一种蜻蜓算法,提高了收敛速度;文献[14]使用粒子群算法进行优化,利用其优势来避免过早收敛的问题。上述算法取得一定成效,但仍存在寻优精度不足,随着搜索空间维度增加收敛速度变慢等问题,麻雀搜索算法(sparrow search algorithm,SSA)作为一种新兴智能算法,在处理寻优问题具有求解精度高、收敛速度快和稳定性等优点,被广泛应用[15]。
基于上述分析,本文提出基于相似日聚类下PCC-VMD-SSA-KELM的短期光伏功率预测方法。首先用PCC选取主要因素作为输入,K-均值算法进行相似日聚类,得到的各类别数据分别训练模型;其次变分模态分解法(VMD)对原始信号进行分解,利用其非递归性的优点,充分提取集合中的输入因素信息,以此提高数据质量;利用SSA优化KELM模型超参数,来解决KELM对参数选取敏感问题。通过仿真分析,结合均方根误差(RMSE)、平均绝对误差(MAE)、决定系数(R2)评价指标,对比相似日聚类下PCC-VMD-SSA-KELM与其他模型的实验结果,验证所提短期光伏功率预测模型的有效性和预测精度。
本文的难点及创新性主要体现在:1)现有的研究方法大多直接对数据进行分解降维,未考虑原始数据的不准确性,本文对原始数据进行清洗重补处理后进行后续工作;2)相较于直接对原始数据预测,本文利用K-均值算法得到不同天气类型下的相似日样本,将预测日分为晴天、多云、雨天3类,更清晰地看出不同天气对光伏发电的影响;3)利用VMD对原始光伏发电功率序列进行平稳化处理,得到若干个规律性较强的子序列;然后,对不同子序列建立KELM模型,相较于其他模型KELM学习参数简单,利用SSA解决KELM参数选择敏感问题,避免了预测模型易陷入局部极值的问题;4)单一预测模型存在预测精度低、稳定性差的问题,本文提出的组合模型避免了这些问题。
1 数据预处理
1.1 数据清洗与重补
光伏电站在运行时,由于设备故障、操作失误等原因,往往会造成部分数据不准确,从而影响预测结果,为了保证数据的准确性,需对数据进行处理,本文以江西某光伏电站4月份数据为例,该电站采样间隔为15 min,考虑实际情况,光伏电站发电时间集中在白天,因此以每日07:00—18:00进行研究。
[P=ηSI1-0.005Tc+25]" (1)
式中:[P]——光伏发电功率,MW;[η]——转换效率;[S]——光伏电站受光面积,m2;[I]——辐照度,W/m2;[Tc]——组件温度,°C;
利用式(1)对数据进行处理,数据清洗前后结果见图1。
1.2 气象因素分析
光伏输出功率受环境因素影响,主要包括辐照度、组件温度、环境温度、相对湿度,本文利用皮尔逊相关系数逐一计算各影响因素与光伏输出功率的相关程度,选取主要影响因素作为预测模型的输入变量,PCC计算公式如式(2)所示。
[r=ni=1nxy-i=1nxi=1nyni=1nx2-i=1nx2∙ni=1ny2-i=1ny2]" (2)
式中:[n]——总个数,其中相关系数[r]范围在[-1,1]之间,大于0时,其值越大,相关性越强;[x]——气象因素数据;[y]——光伏功率数据。
由于4月份天气跨度大,该电站4月份各影响因素与光伏输出功率相关系数分析如表1和表2所示。
综上,确定辐照度和组件温度为最终输入。
2 理论基础
2.1 K-均值算法
用K-均值算法对光伏发电功率进行相似日聚类,算法步骤如下:
1)初始化[k]个聚类中心,[[C1, C2, C3,…,Ck],][1lt;k≤n;]
2)通过计算,得到[k]个类簇,如式(3)所示:
[disXi,Cj=t=1mXit-Cjt2]"""""" (3)
式中:[Xi]——第[i]个对象,[1≤i≤n];[Cj]——第[j]个聚类中心,[1≤j≤k];[Xit]——第[i]个对象的第[t]个属性,[1≤t≤m];[Cjt]——第[j]个聚类中心的第[t]个属性。
3)得到[k]类簇后,计算新聚类中心,即类簇内所有对象在各维度的均值,如式(4)所示:
[Ct=Xi∈SlXiSl]""" (4)
式中:[Ct]——第1个聚类中心的第t个属性;[Sl]——第l个类簇中对象的个数,[1≤l≤k]。
4)重复步骤2)和3),直到算法达到迭代次数或终止条件[|Cn-1-Cn|≤ε]算法结束。
2.2 变分模态分解
VMD算法通过迭代搜寻变分模型的最优解,每个模态都是中心频率的有限带宽,将原始时间序列[f(t)]分解为不同的具有有限带宽的分量[uk(t)],对应的中心频率[ωk]。每个分量的带宽可通过以下步骤估计:
1)对每一个输入进行Hilbert变换得到单侧频谱;
2)通过混合一个调至各自估计中心频率的指数,将各分量的频谱转移到基带区域;
3)通过对解调信号梯度的L2正规化进行高斯平滑估计,得到每个分量的带宽。则输入信号VMD可由式(5)表示:
[mink=1k||∂tδt+jπt×ukexp-jωt||22s.t.k-1kuk=ft]"" (5)
式中:[k]——分量总数;[∂t]——偏导;[δt]——Dirac分布函数;[uk]——模态函数集;[ωt]——中心频率集;[ft]——原始信号。
通过拉格朗日乘子[λ]和二次惩罚项[α]将上述有约束极值问题转换为无约束问题进行求解,为:
[Luk,ωk,λ=αk=1k||∂tδt+jπt×ukexp-jωt||22+||ft-"""""""""""""""""""""""""""""" k=1kukt||22+λt,ft-k=1kukt]
(6)
各分量[uk]及相应的中心频率[ωk]可通过交替方向乘子法优化求解。更新方法为:
[ud+1kω=fω-i≠kud+1kω+λdω2/1+2αω-ωdk2ωd+1k=0∞ω|ud+1kω|2dω/0∞|ud+1kω|2dω]"""""""""""""""""""" (7)
式中:[fω]、[ukω]和[λω]——[f(t)]、[uk(t)]和[λ(t)]的傅里叶变换;[ω]——中心频率;[d]——迭代次数[16]。
2.3 核极限学习机
基于核函数的极限学习机采用核函数取代未知的隐含层特征映射,其优点是无需预先确定隐含层节点的数目,仅需获得其核函数即可。核函数的选择根据核函数参数具体分析,这里采用径向基核函数,既保留了原始模型的优势,也获得了复杂模型的优势,同时获得更好的映射结果,径向基核函数公式为:
[Kx,xi=exp-||x-xi||2δ2] (8)
用矩阵形式表示为:
[ΩELM=YYT:ΩELMj=gxi∙gxj=Kxi,xj]"""""" (9)
式中:[gx]——隐含层节点输出函数;[xi,][xj]——实验输入向量。
那么,基于核函数的KELM算法输出函数表示为:
[f(x)=Kx,x1"""""""⋮"""""""Kx,xNTIC+ΩELM-1T]""" (10)
式中:[K]——核函数;[xi、][xN]——给定训练样本;[N]——样本数量;[I]——单位矩阵;[C]——正则化系数。
2.4 麻雀搜索算法
麻雀搜索算法是2020年提出的一种新兴群体智能算法,具有收敛速度快、寻优能力强等优点。
假设麻雀初始数量是[m],用X=[X1,1,X1,2,…,Xm,d]表示。式(11)~式(13)分别可找出麻雀种群中发现者更新后的新位置,跟随着更新后的新位置,意识到危险个体更新后的新位置数学模型为:
[Xi,jt+1=Xi,jt×exp-iβ×tmax,"Rlt;UaXi,jt+W×L,"R≥Ua]"""nbsp;" (11)
式中:[Xi,j]——解空间中第[i]只麻雀在第[j]维度上的位置信息;[t]——当前的迭代次数;[β]——(0,1]的随机值;[tmax]——算法出口,表示最大迭代次数;[R]——算法中麻雀个体遇到危险时发生的鸣叫预警值,取值范围是[0,1];[Ua]——预警值超过阈值时移去安全地方觅食,范围在[0.5,1]。
[Xi,jt+1=W∙expXw-Xi,jti2,"""""""""""""""""""igt;n2Xi,jt+Xi,jt-Xpt∙A*∙L"""",其他]"""" (12)
式中:[W]——正态分布的随机数;[L]——维度[l×d],元素都是1的矩阵;[Xp]——适应度值最优位置;[Xw]——适应度值最差位置;[A]——维度[l×d],元素为1或-1的矩阵。
[Xi,jt+1=Xbt+γXi,jt-Xbt"","fi≠fbXi,jt+MXi,jt-Xwtfi-fw+ε,"fi=fb]"""""" (13)
式中:[Xb]——当前迭代最优位置;[γ]——步长调节因子,均值为0,方差为1,正态分布随机值;[M]——麻雀移动方向是[-1,1]随机值;[ε]——接近0的常数;[fi]——当前迭代第[i]只麻雀位置;[fb]——当前迭代适应度最优值;[fw]——当前迭代适应度最差值[17]。
3 基于相似日聚类PCC-VMD-SSA-KLEM的短期光伏功率预测模型建立
基于相似日聚类PCC-VMD-SSA-KELM预测模型步骤和流程见图2。
1)对异常数据进行清理重补,归一化处理,并将数据划分为训练集和测试集,训练集、测试集的比例根据不同天气具体划分,每种天气类型最终测试集都占45个数据,用Pearson相关系数对环境因素进行筛选,筛选出与输出功率相关性大的因素作为输入;
2)结合K-均值算法对原始输入数据进行相似日聚类,分为晴天、多云、雨天3类;
3)将每一类天气中辐照度、组件温度、输出功率历史数据进行VMD分解;
4)初始化SSA参数,设置种群规模、最大迭代次数、发现者比例、寻优维度及变异概率;
5)构建KELM网络模型,设置优化参数取值范围,将KELM网络结构待优化参数设置到麻雀个体的初始位置;
6)计算初始麻雀个体的适应度值,并更新麻雀种群的最优极值,同历史最优值进行比较筛选。判断是否找到最优解或达到最大迭代次数,若符合条件,则迭代终止,反之继续迭代寻优;
7)用麻雀算法对核函数极限学习机的正则化系数C以及核函数参数S进行优化;
8)将VMD分解后的子序列输入到SSA优化的KELM模型中,通过样本数据集对优化后的混合模型进行训练并预测,以每一类气象数据分别作为模型的输入,将每一类气象数据序列分量的预测结果进行叠加并反归一化,得到最终预测结果;
9)采用均方根误差(RMSE)、平均绝对误差(MAE)、决定系数([R2])来评价不同模型的预测性能。
4 算例仿真分析
4.1 K-均值聚类结果
采用K-均值聚类算法得到结果如图3所示,根据总水平辐射变量的数据特征,将天气划分为晴天、多云及雨天。
4.2 变分模态分解参数设定
VMD分解时,分量数量[k]的选择十分重要,过小导致模态欠分解,过大会导致模态严重重复或产生额外噪声。选择中心频率法对[k]进行确定,一般[k=3~9],对不同天气类型分别设计试验,选择效果最好的分量数量,以晴天辐照度为例进行VMD分量数量[k]的选取,表3为晴天辐照度模式中心频率表[16]。
从表3可看出,辐照度模式中心频率在[k=8]和9时数值相等,为0.46,即在[k=8]时模式中心频率达到稳定,因此分量数量确定为8,表4为VMD参数设定。
以晴天辐照度为例,VMD分解结果如图4所示。
4.3 预测模型参数设定
SSA参数主要包括种群数量、最大迭代次数和维度,种群数量为20,最大迭代次数为20,维度为2。本文将辐照度、温度、训练集光伏发电功率作为输入信号,预测光伏发电功率。KELM模型主要参数包括核函数的选择[K],隐含层神经元数量[L],正则化系数[C],核函数参数[S]作为优化超参数,[K]设置为径向基函数,[L]设置为190,随机设置参数[C、S]的大小,在有限的数据集的情况下,结合预测结果评价指标,分析不同参数的设置对预测结果的影响。
由表5可知,在有限的数据情况下,不同参数的选择对于
预测结果的精度会有很大的影响。所以,选择最优的KELM参数可更好地提高预测精度。
采用SSA对KELM的正则化系数C以及核函数参数S进行优化,对3种不同天气下各分量进行寻优,寻优过程及结果详见图5和表6,以晴天天气类型为例。
4.4 预测模型的评价指标
选取均方根误差[YRMSE]、平均绝对误差[YMAE]、决定系数[R2]对模型进行评价。公式分别为:
[YRMSE=i=1ny1(i)-y2(i)2n]"""""" (14)
[YMAE=i=1ny1(i)-y2(i)n]""" (15)
[R2=1-iy2(i)-y1(i)2iy1(i)-y1(i)2]" (16)
式中:[y1(i)]——实际值;[y2(i)]——预测值;[y1(i)]——实际值的平均值[18]。
4.5 预测结果对比分析
将相似日聚类下PCC-VMD-SSA-KELM方法应用到实际光伏电站中进行预测,为验证模型的有效性,将BPNN、ELM、KELM、VMD-KELM、SSA-KELM、VMD-SSA-KELM模型进行试验对比,结果如图6所示。
图6横坐标为采样时间,每15分钟采样一次,从晴天、多云、雨天的预测结果图中可看出,单个的BPNN预测结果与实际值偏差最大,单个ELM预测结果优于BPNN,KELM预测结果优于ELM,但与实际值偏差仍较大,VMD-KELM与SSA-KELM模型的预测结果都优于KELM,可见采用VMD与SSA对KELM模型进行优化起到了提高预测精度的效果,VMD-SSA-KELM模型预测结果优于VMD-KELM和SSA-KELM模型,与实际值偏差较小,聚类后PCC-VMD-SSA-KELM预测结果优于VMD-SSA-KELM,且与实际功率曲线吻合度最高,
预测结果更好,可说明所提模型提高了短期光伏功率的预测精度。BPNN、ELM、KELM、VMD-KELM、SSA-KELM、VMD-SSA-KELM、PCC-VMD-SSA-KELM这7个预测模型预测时间存在一定的差异,其中单个预测模型的预测时间较快,组合模型的预测时间略慢于单个模型。为了更加全面地对各模型性能进行评价,现对各模型的预测所用时间进行对比试验,选用4月份每日07:00—18:00共1354个数据进行耗时比较,结果见表7。
分析表7可知,随着模型复杂度的增加,模型的预测时间也在逐渐增加,单个模型的耗时短于组合模型的耗时,但组合模型的预测精度较单个模型有很大提升,具体评价指标见表8。
对表8数据进行分析,晴天、多云和雨天类型下,在BPNN、ELM、KELM、VMD-KELM、SSA-KELM、VMD-SSA-KELM模型中,3种天气类型均为BPNN预测效果最差,VMD-SSA-KELM模型预测效果较好,但都没有PCC-VMD-SSA-KELM模型预测精度高。其中在晴天类型下,BPNN模型的RMSE为9.69,MAE为7.99,R2为83%,VMD-SSA-KELM模型的RMSE为5.02,MAE为4.21,R2为95%,而PCC-VMD-SSA-KELM的RMSE为4.32,MAE为3.93,R2为97%,相较于对比模型中效果最差的BPNN,PCC-VMD-SSA-KELM模型的RMSE、MAE分别降低55.41%、50.81%,R2提
升16.87%,相较于对比模型中效果较好的VMD-SSA-KELM模型,RMSE、MAE分别降低13.94%、6.65%,R2提升2.11%;在多云类型下,PCC-VMD-SSA-KELM模型的RMSE、MAE较BPNN模型降低57.21%、55.23%,R2提升15.48%,PCC-VMD-SSA-KELM模型的RMSE、MAE较VMD-SSA-KELM模型降低29.94%、28.87%,R2提升3.19%;在雨天类型下,PCC-VMD-SSA-KELM模型的RMSE、MAE较BPNN模型降低56.98%、48.94%,R2提升73.68%,PCC-VMD-SSA-KELM模型的RMSE、MAE较VMD-SSA-KELM模型降低11.84%、0.84%,R2提升15.12%。通过分析,本文所提的PCC-VMD-SSA-KELM组合模型预测精度高于其他模型的预测精度。
上文通过江西某光伏电站4月份数据验证了本文所提的PCC-VMD-SSA-KELM 模型在预测精度上有所提升。为了验证本文所提方法的泛化性,选取该电站2017年全年数据进行实验,将本文提出的PCC-VMD-SSA-KELM 模型与VMD-SSA-KELM模型进行比较,经过验证训练集、测试集数据比为9∶1,全年共35040个数据,每15分钟采集一次,其评价指标见表9。
SSA对KELM优化结果如表10所示。
分析表9,观察评价指标,可得知综合一年数据,本文所提PCC-VMD-SSA-KELM模型预测精度有所提升。
5 结 论
为提高光伏利用率以及减少光伏削减措施,短期光伏功率精准预测是必要的,本文提出一种新方法,基于相似日聚类下PCC-VMD-SSA-KELM混合模型,并结合光伏电站实际数据对模型性能进行验证,选取RMSE、MAE、R2作为评价指标,实验结果表明,所提模型性能优于其他模型,结果更加稳定。主要贡献如下:
1)利用K-均值算法对历史数据进行相似日聚类,分为晴天、多云、雨天分别预测,可降低不同天气条件对预测结果的影响;皮尔逊相关系数确定关键输入因素,避免相关性较低因素引起的预测误差。
2)采用中心频率法确定VMD最佳分量数量,确定晴天、多云、雨天分量数分别为8、7、7,VMD将不同天气条件下辐照度、组件温度、光伏功率进行信号分解,降低原始信号噪声影响,提高了预测精度。
3)采用KELM模型,在ELM基础上引入核函数,并用SSA对KELM的正则化系数和核函数参数进行优化,克服KELM对参数选择敏感问题,相比于随机设置参数,模型性能有所提升。
4)在3种典型天气下,所提模型的R2都超过0.96,且雨天的R2为0.99, RMSE为2.68,其他天气情况下所提模型的RMSE、MAE、R2也都有显著提升,说明混合模型预测效果更好。
本文提出的新混合模型算法使得预测精度得到提高,但存在局限性如下:考虑了优化KELM参数,但并未考虑改进KELM拓扑,这一项内容是未来要研究的主要工作。
[参考文献]
[1]"""" 谭小钰, 刘芳, 马俊杰, 等. 基于DBN与T-S时变权重组合的光伏功率超短期预测模型[J]. 太阳能学报, 2021, 42(10): 42-48.
TAN X Y, LIU F, MA J J, et al. Ultra-short-term PV power forecasting model based on DBN and T-S time-varying weight combination[J]. Acta energiae solaris sinica, 2021, 42(10): 42-48.
[2]nbsp;""" 张姗, 冬雷, 纪德洋, 等. 基于NWP相似性分析的超短期光伏发电功率预测[J]. 太阳能学报, 2022, 43(4): 142-147.
ZHANG S, DONG L, JI D Y, et al. Power forecasting of ultra-short-term" photovoltaic" station" based" on" NWP similarity analysis[J]. Acta energiae solaris sinica, 2022, 43(4): 142-147.
[3]"""" MISHRA M, DASH P B, NAYAK J, et al. Deep learning and wavelet transform integrated approach for short-term solar PV power prediction[J]. Measurement, 2020, 166: 108250.
[4]"""" LI Q, ZHANG X Y, MA T J, et al. A multi-step ahead photovoltaic power prediction model based on similar day, enhanced colliding bodies optimization, variational mode decomposition, and deep extreme learning machine[J]. Energy, 2021, 224: 120094.
[5]"""" 王清亮, 杨博, 应欣峰, 等. 非晴空条件下光伏发电短期功率预测方法[J]. 太阳能学报, 2022,43(3):188-196.
WANG Q L, YANG B, YING X F, et al. Short-term photovoltaic power forecasting method under non-clear sky condition[J]. Acta energiae solaris sinica, 2022,43(3):188-196.
[6]"""" ZHONG J Q, LIU L Y, SUN Q, et al. Prediction of photovoltaic power generation based on general regression and back propagation neural network[J]. Energy procedia, 2018, 152: 1224-1229.
[7]"""" 李秉晨, 于惠钧, 刘靖宇. 基于Kmeans和CEEMD-PE-LSTM的短期光伏发电功率预测[J]. 水电能源科学, 2021, 39(4): 204-208.
LI B C, YU H J, LIU J Y. Prediction of short-term photovoltaic power generation based on Kmeans and CEEMD-PE-LSTM[J]. Water resources and power, 2021, 39(4): 204-208.
[8]"""" 王福忠, 王帅峰, 张丽. 基于VMD-LSTM与误差补偿的光伏发电超短期功率预测[J]. 太阳能学报, 2022, 43(8): 96-103.
WANG F Z, WANG S F, ZHANG L. Ultra short term power prediction of photovoltaic power generation based on VMD-LSTM and error compensation[J]. Acta energiae solaris sinica, 2022, 43(8): 96-103.
[9]"""" HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: theory and applications[J]. Neurocomputing, 2006,70(1/2/3): 489-501.
[10]""" SUN S L, WEI Y J, TSUI K L, et al. Forecasting tourist arrivals with machine learning and internet search index[J]. Tourism management, 2019, 70: 1-10.
[11]""" 章勇高, 高彦丽, 马迪. 基于GA-KELM的光伏短期出力预测研究[J]. 控制工程, 2018, 25(7): 1155-1159.
ZHANG Y G, GAO Y L, MA D. Research of photo-voltaic short-term output power prediction based on GA-KELM[J]. Control engineering of China, 2018, 25(7): 1155-1159.
[12]""" CHEN X X, YE Y, DONG C, et al. Grasshopper optimization algorithm combining Gaussian and chaos theory for optimization design[C]//2019 3rd International Conference on Electronic Information Technology and Computer Engineering (EITCE). Xiamen, China, 2019: 1484-1488.
[13]""" 张水平, 高栋. 基于随机替换和混合变异的蜻蜓算法[J]. 科学技术与工程, 2020, 20(22): 9108-9115.
ZHANG S P, GAO D. Dragonfly algorithm based on random substitution and hybrid mutation[J]. Science technology and engineering, 2020, 20(22): 9108-9115.
[14]""" LIU Z, QIN Z W, ZHU P, et al. An adaptive switchover hybrid particle swarm optimization algorithm with local search strategy for constrained optimization problems[J]. Engineering applications of artificial intelligence, 2020, 95: 103771.
[15]""" 谢少华, 何山, 闫学勤, 等. 基于SSA-BP神经网络的光伏短期功率预测[J]. 浙江工业大学学报, 2022, 50(6): 628-633.
XIE S H, HE S, YAN X Q, et al. Short term photovoltaic power" prediction" based" on" SSA-BP" neural" network[J]. Journal of Zhejiang University of Technology, 2022, 50(6): 628-633.
[16]""" 杨晶显, 张帅, 刘继春, 等. 基于VMD和双重注意力机制LSTM的短期光伏功率预测[J]. 电力系统自动化, 2021, 45(3): 174-182.
YANG J" X," ZHANG" S," LIU" J" C," et" al." Short-term photovoltaic power prediction based on variational mode decomposition and long short-term memory with dual-stage attention"" mechanism[J]." Automation"" of"" electric" power systems, 2021, 45(3): 174-182.
[17]""" 黄敬宇. 融合t分布和Tent混沌映射的麻雀搜索算法研究[D]. 兰州: 兰州大学, 2021.
HUANG J Y. Research on sparrow search algorithm based on fusion of T distribution and Tent chaotic mapping 2[D]. Lanzhou: Lanzhou University, 2021.
[18]""" 刘国海, 孙文卿, 吴振飞, 等. 基于Attention-GRU的短期光伏发电功率预测[J]. 太阳能学报, 2022, 43(2): 226-232.
LIU" G" H," SUN" W" Q," WU" Z" F," et" al." Short-term photovoltaic power forecasting based on Attention-GRU model[J]. Acta energiae solaris sinica, 2022, 43(2): 226-232.
SHORT TERM PHOTOVOLTAIC POWER PREDICTION BASED ON
SIMILAR DAY CLUSTERING AND PCC-VMD-SSA-KELM MODEL
Li Zheng1,Zhang Jie1,Xu Ruosi1,Luo Xiaorui1,Mei Chunxiao2,Sun Hexu1
(1. School of Electrical Engineering, Hebei University of Science and Technology, Shijiazhuang 050018, China;
2. Hebei Construction amp; Investment Group New Energy Co., Ltd., Shijiazhuang 050051, China)
Abstract:Because the randomness and instability of photovoltaic power generation will affect the accuracy of power prediction, this paper proposes a short-term photovoltaic power prediction model based on Pearson correlation coefficient (PCC), K-means algorithm (K-means), variational mode decomposition (VMD), sparrow search algorithm (SSA), and kernel based extreme learning machine (KELM). Firstly, PCC is used to select the main factors as input; K-means algorithm clusters the historical data into sunny, cloudy and rainy days. Secondly, VMD decomposes the original signal to fully extract the input factor information in the set to improve the data quality. SSA optimizes the kernel function parameters and regularization coefficients of KELM model to solve its sensitive problem of parameter selection. Finally, the final prediction result is obtained by superimposing the prediction values of different series. The simulation results show that the PCC-VMD-SSA-KELM model with similar day clustering has small prediction error.
Keywords:photovoltaic power generation; power forecasting; variational mode decomposition; K-means; sparrow search algorithm; kernel based extreme learning machine