卞海红,孙健硕
(江苏省主动配电网重点建设实验室(南京工程学院),江苏 南京 211167)
我国光伏资源十分丰富。随着光伏产业规模的不断扩大,为了改善环境,实现可持续发展,提高光伏能源利用率,研究精确度更高的光伏发电量预测技术已成为未来趋势[1—3]。如今,基于历史运行数据和历史气象数据相结合的光伏发电量预测模型应用广泛,其中天气因素对光伏系统及光伏发电预测量影响最大,所以在进行光伏发电量预测时,构建特定地区典型气象年数据非常重要[4—7]。
文献[8]选取中国南海地区7个数据较完整的气象观测点,通过3种方法构建典型气象年数据,综合分析比较3种生成结果,发现The Festa-Ratto Method是生成中国南海地区典型气象年的适用算法。文献[9]通过构建中国不同气候区域的35个代表性城市的典型气象年数据,分析对比3种典型气象年的生成方法,提出了一种混合典型气象年构建方法,提高了在不同气候区域形成典型年数据的精确度。文献[10]通过皮尔逊相关系数和灰色关联分析选取最佳相似日,将最佳相似日中相关气象参数和光伏输出功率作为广义回归神经网络(general regression neural network,GRNN)模型的输入参数,预测出各个时刻的输出功率,解决了天气类型改变时预测精度下降的问题。
针对上述文献未考虑典型气象周数据与历史长期平均数据之间误差关系的缺点,文中利用改进的平均绝对百分比误差(mean absolute percentageerror,MAPE)方法,构建改进典型气象年方法(typical meteorological year method,TMY Method)下的典型气象年数据,使用因子分析法(factor analysis,FA)筛选气象指标进行标准化处理,结合GRNN预测模型进行日光伏发电量预测。文中选取江苏省南京市2000年—2015年历史气象数据和日光伏发电量数据进行算例分析,验证模型的预测精度。
典型气象年通常是由历年气象数据中选择出的12个典型气象月组合成一个“虚拟年”[11]。构建典型气象年的常用方法有:The Danish Method[12],The Festa-Ratto Method[13]和TMY Method等。
TMY Method最早由美国的Sandia National Laboratories提出,主要通过Finkelstein-Schafer[14]统计方法来选取和确定典型气象年数据。
为提高基于改进TMY Method-GRNN的光伏发电预测模型的预测精度,文中针对标准TMY Method进行以下改进:
(1)文中介绍的光伏发电量预测模型是为了提高短期光伏发电量预测精度。相较于按月度划分,对历年气象数据按照一周7 d进行划分可以提高模型的预测精度,因此文中选择从历年气象数据中选取52个典型气象周组合构成一个“虚拟年”。
(2)为了使构建出的典型气象年数据与长期气候数据有较高的拟合度,采用计算候选周数据与历史长期平均数据间MAPE值的方法选取典型气象周,构建改进TMY Method下的典型气象年。
在历史气象指标中,由于日太阳总辐射、日最高 大气干球温度、日平均大气干球温度、日最低大气干球温度、日平均风速和日平均大气相对湿度对光伏系统和光伏发电量预测的影响最大,所以选取上述6种气象指标作为形成典型气象年的历史气象数据。
首先针对历年每周短期与长期的累积分布函数进行分析比较[15]。累积分布函数计算如下:
(1)
式中:Tn(s)为气象指标s的累积分布函数值;n为气象指标s的总个数;i=1,2,3,…,n-1。
各个参数指标的Finkelstein-Schafer统计值计算如下[16]:
(2)
式中:Fs(y,w)为气象指标s的第y年第w周统计值;Lw(si)为气象指标s的各周历年长期累积分布函数值;Ly,w(si)为气象指标s的各周第y年短期累积分布函数值;N为一周的总天数,取7。
根据6种历史气象指标的F(y,w)值进行综合统计,计算得出加权统计值,加权统计值最小的周被选取为标准TMY Method下的典型气象周。加权统计值的计算如下:
(3)
(4)
式中:C(y,w)为第y年第w周的加权统计值;Ws为气象指标s的权重系数;气象指标个数M为6。
考虑到空间尺度对于光伏发电功率有一定影响,文中使用位于亚热带(区域年积温为4 500~8 000 ℃)的江苏省南京市的历史气候数据,且构建的典型气象年数据主要用于光伏发电量的预测。因此,给日太阳总辐射这一气象指标设定较高的权重系数,大小为50/100,即0.5[15]。文中选用的6种气象指标的权重系数经过仿真检验表明在中国亚热带城市效果较好。具体权重系数见表1[20]。
表1 气象指标的权重系数Table 1 Weight coefficients of meteorological parameters
在标准TMY Method下生成典型气象周的过程中,未考虑典型气象周数据与历史长期平均数据之间的误差。为了使构建出的典型气象年数据与长期气候数据的分布规律类似且有较高的拟合度,文中提出相应的改进方法。
将计算得出的各周加权统计值按照升序排列,选取加权统计值最小的3个周作为候选周。
日太阳总辐射是光伏发电量预测中最为关键的因素,因此计算候选周日太阳总辐射与历史长期平均数据间的MAPE值,选取MAPE值最小的候选周作为改进TMY Method下的典型气象周。MAPE值的计算如下:
(5)
式中:Mw为第w周太阳总辐射的MAPE值;Ky,w,d为第y年第w周第d日的日太阳总辐射;Kw为第w周的日太阳总辐射量历年的均值。
将获得的52个典型气象周组合起来构建成在改进TMY Method下的典型气象年。
GRNN是一种非线性回归的前馈式神经网络[16]。通常是由输入层、模式层、求和层和输出层构成。GRNN算法在运算速度与学习能力上比径向基函数神经网络(radial basis function,RBF)、反向传播神经网络(back propagation,BP)更强,广泛应用于系统辨识、预测、控制等领域中[17—18]。
GRNN网络模型如图1所示,含有四部分:
图1 GRNN模型Fig.1 Model of GRNN
(1)输入层。输入层作用是将样本数据传送到模式层且不运行计算,输入向量的维数为m。文中通过FA法确定在南京地区使用该模型时输入向量的维数m=7,7种数据分别为平均大气干球温度、最高大气干球温度、最低大气干球温度、平均相对湿度、平均风速、日太阳总辐射和日光伏发电量。输入向量为:
X=[x1,x2,…,xm]
(6)
(2)模式层。模式层中含有的神经元数目和学习样本的数目相同,均为n,神经元i的传递函数为:
(7)
式中:Xi为神经元i所对应的学习样本;σ为平滑参数,将平滑参数σ代入神经网络训练过程,以Δσ的间距在[σmin,σmax]寻取最优平滑参数。
(3)求和层。求和层含有2种类型的神经元,分别表示如下:
(8)
(9)
式中:Yi为第i个样本观测值。
(4)输出层。在输出层进行如下计算:
Y=SN/SD
(10)
式中:Y为具有最大概率的输出变量。
文中使用的气象数据为2000年—2015年江苏省南京市某气象观测站点的实测气象数据,选取平均大气干球温度、最高大气干球温度、最低大气干球温度、平均相对湿度、平均风速和日太阳总辐射6种气象指标作为构建典型气象年的历史气象数据。文中使用的历史发电数据为2000年—2015年江苏省南京市某分布式光伏电站的日光伏发电量。
文中选用相对误差(relative error,RE)和均方根误差(root mean squared error,RMSE)评价基于改进TMY Method-GRNN的光伏发电预测模型的预测效果。RE和RMSE的计算如下[19—21]:
(11)
(12)
式中:X为实际测量的日光伏发电总量;Y为预测的日光伏发电总量;Xi,Yi分别为元素个数为i时实测和预测的日光伏发电总量;n为测试样本中的元素个数。
根据上文介绍的TMY Method算法,文中建立标准和改进TMY Method下的典型气象年模型,对生成的典型气象年数据进行对比分析。
由于篇幅原因,文中只展示典型气象周第25~30周的选取结果,结果如表2、表3所示。
表2 南京地区第25~30周典型周(标准TMY Method)Table 2 Typical meteorological week 25~30 in Nanjing area (using the original TMY Method)
表3 南京地区第25~30周典型周(改进TMY Method)Table 3 Typical meteorological week 25~30 in Nan-jing area (using the optimized TMY Method)
对比典型气象周的周平均数据与2000年—2015年长期周平均数据,选择日太阳总辐射和平均大气干球温度2种关键气象指标进行展示,具体对比如图2、图3所示。
图2 典型周日平均太阳总辐射值对比Fig.2 Comparison of the average solar radiation values on a typical week
图3 典型周日平均大气干球温度对比Fig.3 Comparison of average atmospheric dry bulb temperature on a typical week
分析图2和图3可知:改进TMY Method较标准TMY Method在典型气象年数据中的日太阳总辐射和平均大气干球温度2种关键气象指标上和长期平均数据之间误差较小。
3.4.1 选择输入的气象指标
使用统计学中常用的FA法对光伏发电量和典型年数据中的6种气象指标进行相关性分析。选取因子载荷矩阵中绝对值超过0.8的气象指标作为预测模型的数据输入。因子载荷矩阵如表4所示。
表4 因子载荷矩阵Table 4 Correlation coefficient of factor analysis
分析表4可知典型年数据中6种气象指标都和光伏发电量有较高相关性,所以文中选取典型气象年数据中全部6种气象指标作为预测模型的输入。
3.4.2 数据预处理
根据上文FA法结果,文中使用标准和改进TMY Method典型气象年中的6种气象指标,结合日光伏发电量作为GRNN光伏发电量预测模型的输入数据。由于输入数据间单位不一致,因此需对数据进行标准化处理,具体如下:
(13)
式中:bi为指标i的实际数据;bi,max,bi,min分别为指标i的最大、最小值。
3.4.3 样本选择
(1)训练样本的选择。文中选取预测日前7日典型气象年数据中6种气象指标数据和日光伏发电量作为训练样本输入,预测日光伏发电预测量作为训练样本输出。采用改进TMY Method典型气象年中第1~299天的相关数据对预测模型进行训练。
(2)测试样本的选择。测试样本的输入、输出与训练样本类似。采用改进TMY Method典型气象年中第300~364天的数据对预测模型进行测试。
为了验证基于改进TMY Method-GRNN的光伏发电量预测模型性能,将改进和标准TMY Method下光伏发电预测量与日光伏发电量分别进行对比,计算RE值和RMSE值。标准和改进TMY Method下光伏发电预测量与日实测光伏发电量对比如图4所示。标准和改进TMY Method下光伏发电预测量相对误差对比如图5所示。
图4 改进和标准TMY Method下光伏发电预测量与日光伏发电量对比Fig.4 Comparison of forecasted photovoltaic power generation and daily photovoltaic power genera-tion under optimized and original TMY Method
图5 标准和改进TMY Method下光伏发电预测量相对误差对比Fig.5 Comparison of relative errors of forecasted photovoltaic power generation under the original and optimized TMY Method
分析图4和图5可知:标准与改进TMY Method-GRNN光伏发电预测模型输出的光伏发电预测值和日光伏发电实际值之间曲线趋势相同且数值接近,使用改进TMY Method比使用标准TMY Method预测效果更佳。在与日光伏发电实际值进行对比时,使用改进TMY Method下光伏发电预测量比使用标准TMY Method下光伏发电预测量的相对误差更小。
通过计算比较可得:使用标准TMY Method-GRNN模型输出的光伏发电预测量与日光伏发电量之间RMSE为12.73 (kW·h)/m2;使用改进TMY Method-GRNN模型输出的光伏发电预测量与日光伏发电量之间RMSE为5.28 (kW·h)/m2。改进TMY Method-GRNN预测模型的预测均方根误差小,预测准确度高。
文中介绍了使用TMY Method生成典型气象年的具体方法,并针对光伏发电量预测方向进行改进,提出了基于改进TMY Method-GRNN的光伏发电预测模型。
选取对光伏发电预测影响最大的6种历史气象指标,生成在标准和改进TMY Method下的典型气象年数据,并与长期平均数据进行对比分析。将标准和改进TMY Method下生成的典型气象年数据中6种气象指标和日光伏发电量作为GRNN的输入数据,得到预测日光伏发电量,进行对比分析后得到以下结论:
(1)标准和改进TMY Method的典型气象年数据中日太阳总辐射和平均大气干球温度都与长期平均数据十分接近,其中改进TMY Method下典型气象年数据与长期平均数据更接近。
(2)基于改进TMY Method-GRNN的光伏发电预测模型输出的预测值与日光伏发电量实际值的曲线趋势相同且数值接近。改进TMY Method-GRNN预测模型与标准TMY Method-GRNN预测模型相比,其预测准确度更高,预测效果更佳。
本文得到2020年江苏省研究生科研创新项目(SJCX20_0718),2019年度南京工程学院校级科研基金(CKJB201904)资助,谨此致谢!