白青飞, 林永君, 杨 凯, 李 静
(华北电力大学 新能源电力系统国家重点实验室,河北 保定 071003)
碳中和、碳达峰目标的提出,对电网安全稳定运行提出新的考验。对于光伏发电,亟待提高光伏功率预测的准确度,给电网调度提供可靠依据[1]。大气中的颗粒物(particulate matter,PM)对太阳辐射的影响作用明显,因此考虑大气颗粒物浓度成为光伏发电功率预测不可忽视的因素[2-3]。
文献[4]通过研究污染天气对太阳辐射强度的影响,对光伏发电功率进行预测,由于天气污染程度差别大,预测准确度参差不齐。文献[5]研究了环境因素对光伏系统出力的影响,结论为太阳辐照度对光伏系统出力的影响最大。文献[6]通过天气聚类实现对光伏功率预测准确度的提高,但实用性较差。基于历史天气数据进行光伏功率预测,具有比较大的随机性,过于依赖历史天气数据;在天气逐时变化较大的情况下,光伏功率预测误差偏大。太阳辐射强度预测方面,文献[7]考虑大气气溶胶光学厚度(aerosol optical thickness,AOT)对太阳辐射强度的削弱作用,通过大气辐射传输理论计算地表的辐射强度,由于模型参数简化较多,AOT 预测准确度偏低。文献[8]通过对MODIS气溶胶光学厚度产品模拟PM2.5浓度时空分布,得到了比较精确的结果。文献[9]证明了AOT与PM2.5浓度有良好的相关性。以上研究证明通过PM浓度预测AOT的可行性,但预测更为精确的AOT,需要进一步研究相关气象因素。
为改善太阳辐射强度预测模型预测准确度及对历史数据依赖性,提高光伏功率预测模型的准确度与实用性,本文主要工作如下:利用K-means算法与径向基神经网络(radial basis function,RBF)组合,建立基于PM浓度、相对湿度聚类的多类型AOT预测模型;在预测的AOT基础上,基于大气辐射传输理论以及倾斜面太阳辐射强度计算模型,计算到达光伏面板的太阳辐射强度;在太阳辐射强度预测的基础上,结合光电转换模型,实现对光伏发电功率的预测。
大气气溶胶是各种颗粒状物质均匀地分散在空气中构成一个相对稳定的庞大的悬浮体系,根据空气动力学直径可将其分为TSP、PM10和PM2.5,由于大气颗粒物受温度、湿度、风速、气压和气溶胶标高等因素影响,因此本文对440 nm波段、1 020 nm波段的AOT与主要气象因素进行了相关性分析。
本文AOT预测模型所用的气象数据来源于中国气象数据网(http://data.cma.cn/)北京朝阳台站;PM2.5和PM10数据取自北京市环境保护检测中心(http://www.bjmemc.com.cn/)朝阳监测点;AOT 数据利用比较精确的地基观测方式,取自全球地基气溶胶遥感自动观测网AERONET(https://aeronet.gsfc.nasa.gov/),监测站点选择了离朝阳区气象观测点最近的北京监测站点(坐标:116.583°E/39.783°N;);气溶胶标高数据选自文献[10],春季为1.563 km,夏季为1.777 km,秋季为0.851 km,冬季为0.909 km。为适应大气传输模型,对所获取的数据进行了筛选,最终筛选出2014年5月14日-2018年3月6日的2018组数据。
对440 nm波段AOT、1 020 nm波段AOT分别与PM浓度、气溶胶标高以及温度、风速等气象因素进行相关性分析,相关性表达式为
式中:r(X,Y)——X与Y的相关性紧密程度;
x,y——数据集X与Y中的数据;
通过计算分析得到数据相关性的结果,见表1。
表1 AOT与影响因素相关性分析
由表可以看出,两个波段的AOT与PM2.5浓度、PM10浓度以及相对湿度有比较强的相关性,与温度呈一定相关性,440 nm AOT与气溶胶标高为弱相关性,而1 020 nm AOT与气溶胶标高呈一定相关性,考虑到气溶胶标高取值为季节均值,所计算的相关性较弱在合理范围之内。两个波段的AOT与风速、气压呈一定负相关性。本文选取了相关性最高的PM2.5、PM10以及相对湿度3个影响因素对AOT进行研究。
本文为提高AOT预测准确度,首先通过K-means算法[11]对PM2.5、PM10、相对湿度3个影响因素进行分类,起到对预测选取相似日的作用。K-means聚类算法实现过程如下。
1) 设置簇数k,并在样本数据中随机选取k个聚类中心{∂1,∂2,∂3∂k}作为初始值;
2) 计算各个历史样本xi与各聚类中心的距离d,选择离聚类中心的最小距离形成k簇:
其中∂i为簇Ci的中心样本。
3) 计算更新聚类中心:
4) 通过设定的迭代次数,不断运行步骤2)和3),直到达到设定的迭代次数结束。
RBF神经网络相较于BP神经网络等算法结构简单、训练简洁、学习收敛速度快,能够逼近任意非线性函数,克服局部极小值问题[12]。RBF神经网络是一种3层神经网络,包括输入层、隐含层、输出层。从输入空间到隐含层空间的变换是非线性的,而从隐含层空间到输出层空间变换是线性的,本文的RBF神经网络结构如图1所示。
图1 RBF神经网络结构图
输入层为PM2.5、PM10和相对湿度,输出层为440 nm波段和1 020 nm波段的AOT。隐含层由RBF作为隐单元的“基”组成,这就实现了输入矢量到隐空间直接映射。映射关系随RBF的中心点确定而确定。隐含层到输出层的映射是线性的,即网络的输出是隐单元输出的线性加权和,权值是可调参数。
本文首先通过K-means算法对历史数据进行分类,通过Calinski-Harabasz(CH)指标选取了最佳聚类数,CH指标通过类内离差矩阵描述紧密度,类间离差矩阵描述分离度,其定义为
式中:n——聚类的数目;
k——当前的类;
trB(k)——类间离差矩阵的迹;
trW(k)——类内离差矩阵的迹。
依据CH指标选取了k=3,结果如图2所示。
图2 CH指标结果
本文设定分类簇数为3,对2018组数据进行了分类,簇1包含624组数据,簇2包含1 208组数据,簇3包含186组数据,分类结果如图3所示。
图3 分类结果
本文基于分类后的数据分别以两个波段的AOT值作为训练目标建立径向基神经网络,逐步增加神经元个数,不断重新设计网络线性层来逐步减小误差,本文通过设置最大神经元数量进行数据训练。每组随机选取90%的样本数据进行训练,即簇1有562组训练样本,簇2有1 088组训练样本,簇3有168组训练样本;剩下的10%为检验样本。每次神经元添加个数设为50,最大神经元个数取200,3类网络训练结果的均方误差(mean squared error, MSE)分别为 0.027、0.021、0.007,表明训练模型可以得到比较好的拟合效果。通过检验样本对模型拟合验证,3种分类结果如图4~图6所示。
图4 簇1训练及检验结果
图5 簇2训练及检验结果
图6 簇3训练及检验结果
为了检验训练模型的泛化适用性,计算了检验样本预测值与真实值的绝对误差,分别统计了绝对误差小于0.2的占有率,得到关于检验样本绝对误差的结果如下:440 nm波段AOT检验样本占90.50%;1 020 nm波段AOT检验样本占98.63%。绝对误差结果如图7所示,由结果可知本文的训练模型有着较好的泛化性和预测准确度。
图7 绝对误差分布结果
当前对太阳辐射模型的研究较多,多为晴空条件下的辐照度模型,其中REST2模型相较于其他模型有更高的预测准确度[13-14]。REST2模型是计算太阳辐射在 0.29~0.70 μm 波段与 0.70~4 μm 波段的直射强度和散射强度值的大气辐射传输模型。
本文利用REST2模型[15]计算到达地表的直射、散射辐射强度,再通过倾斜面直接辐射计算公式以及倾斜面辐射强度计算模型Koronakis模型和地面反射辐射经典公式[16],得到最终的光伏板倾斜面的总辐射强度。
倾斜面总辐射强度It由三部分组成:倾斜面直射辐射Ibt、倾斜面散射辐射Idt、地面反射幅射Ir。相关公式为
式中:Z——太阳天顶角;
Ibn——直射辐射强度;
Ibh——水平面直射辐射强度;
ρgi——波段i的地表反照率;
Id——散射辐射强度;
Ib——水平面总辐射强度。
本文涉及的光伏板为正南方向放置,即方位角ϒ=0,所以倾斜面太阳入射角可定义为
式中:i——光照所在的不同波段;
θi——倾斜面太阳入射角;
θ——太阳入时角;
φ——当地纬度;
β——光伏板倾斜角。
本文于2021年4月-5月在保定市华北电力大学一校区晴空条件下,利用TES-1333R型光度计对倾斜面的光辐射强度进行数据收集,共5天数据。再通过当地空气质量监测站所测得的PM2.5浓度、PM10浓度和相对湿度数据进行双波段AOT预测。将预测的AOT数据、相对湿度数据输入本文所用的REST2模型计算大气太阳辐射强度,最后通过倾斜面辐射强度计算模型,求得倾斜面辐射强度数据,将计算的倾斜面太阳辐射强度数据与实测数据进行验证,实测的倾斜面太阳辐射强度选取了11:00-16:00时间段,结果如图8所示。
图8 倾斜面太阳辐射强度预测对比
为了检验模型的可信程度,本文计算了相对误差,统计了相对误差的分布情况,如图9所示。
图9 倾斜面太阳辐射强度预测相对误差分布
由分析可以看出,相对误差小于20%的数据占100%,说明本文模型有着较高的预测准确度。
太阳辐射强度和光伏板的工作温度是影响其发电功率的主要因素,当忽略积灰影响时,光伏电池发电模型[17]为:
式中:PA——光伏板的输出功率;
η——光伏板的效率;
A——光伏板的有效面积;
S——光伏板接收的太阳辐射强度;
TPV——光伏板的工作温度;
TSTC——标准测试条件下的温度。
TPV可以根据太阳辐射强度S与环境温度T估算[18]:
其中ω为光伏板的温度系数。
实验所用数据采集于2021年4月-5月,筛选出晴空天气数据,通过垂直于光伏板面的TES-133R光强计采集实际倾斜面太阳辐射强度值作为本文预测模型验证数据,PM浓度、湿度、温度等数据通过华北电力大学气象数据监测点发布网站获取,通过搭建的实验平台获取实际的光伏发电功率作为本文的预测模型验证数据。
本文实验平台由50 W的光伏电池板、MPPT控制器、上位机数据采集软件等部分组成,50 W光伏电池板组成阵列如图10所示,本文实验基于单个光伏板进行验证,单个光伏板相关规格参数如表2所示。
图10 光伏阵列
表2 50 W光伏电池板规格参数
本文所用MPPT控制器涉及电压传感器、电流传感器、BOOST电路和XS128微控制器,利用电导增量法实现光伏发电的最大功率跟踪控制,如图11所示。
图11 MPPT控制器
在晴朗天气下,保持光伏板面的清洁,于2021年4月17日、23日、28日以及5月1日、2日共5个测量日,采集实际光伏电池板发电功率。
在华北电力大学气象数据监测点发布网站,收集逐时发布的5个测量日的PM浓度、温度以及湿度数据,选择本文对应的K-means-RBF组合算法对PM浓度、湿度进行聚类分析,选择对应的RBF预测模型实现对AOT预测,基于AOT的预测数据,利用双波段大气传输模型及倾斜面太阳辐射强度计算模型对太阳辐射强度进行预测,5个测量日的预测结果与实际PM浓度数据如图12所示,将预测的太阳辐射强度以及获取的温度数据输入到光电转换模型来预测光伏发电功率,光伏功率预测结果如图13所示,并计算了光伏功率预测的相对误差,结果如图14所示。
图12 太阳辐射强度预测结果
图13 光伏发电功率预测结果
图14 光伏发电功率预测相对误差
通过计算倾斜面太阳辐射强度预测的平均相对误差为6.73%,每个测量日的16:00误差偏大,本文分析主要由于此时的PM浓度以及湿度的变化浮动较大,所建立的 AOT预测模型误差偏大所致。综合来看,本文的倾斜面太阳辐射强度预测有较高准确度,结合PM浓度变化来看,5个测量日中4月23日PM浓度均值最大,太阳辐射强度均值最弱,每个测量日PM浓度与太阳辐射强度呈现明显的负相关性。
结果显示,在PM浓度比较高的4月23日,太阳辐射强度显著降低,光伏发电功率也明显小于其他测量日,本文较好地实现了考虑太阳辐射强度受大气颗粒物浓度影响的光伏发电功率预测,模型预测的平均相对误差为6.07%,相对误差小于10%的样本占比达到85%,预测模型具有较高准确度和泛化能力。
1)考虑大气颗粒物浓度对太阳辐射强度的影响,建立基于PM浓度、湿度对AOT进行预测的K-means-RBF神经网络模型,具有较高的泛化性和准确度,再利用晴空下的太阳辐射传输理论以及倾斜面辐射强度计算模型对倾斜面太阳辐射强度进行预测,得到了准确度较高的太阳辐射强度预测值,平均相对误差为6.73%。
2)基于模型预测的倾斜面太阳辐射强度、监测站点获取的气温对光伏发电功率进行了预测,预测准确度达到93.93%,预测模型具有较高准确度且工程易于实现。