气象数据弱相关的光伏出力短期预测

2015-01-10 11:24徐晓波刘宗歧刘文霞
现代电力 2015年6期
关键词:出力气象向量

杜 翠,徐晓波,刘宗歧,刘文霞

(华北电力大学电气与电子工程学院,北京 lO22O6)

文章编号:lOO7-2322(2Ol5)O6-OOOl-O6 文献标志码:A 中图分类号:TM6l5

气象数据弱相关的光伏出力短期预测

杜 翠,徐晓波,刘宗歧,刘文霞

(华北电力大学电气与电子工程学院,北京 lO22O6)

0 引 言

能源和环境问题促使以光伏为代表的清洁能源获得了广泛关注,截止2Ol3年底,中国的光伏装机容量已达l9.42GW[1]。光伏大规模并网后会对电网的安全、经济和可靠运行产生多方面影响[2],因此必须获得光伏出力的短期预测数值[3],对其进行主动控制,达到优化调度。

短期光伏预测技术可分为物理法和统计法[4]:地面大型光伏电站具有物理结构清楚、控制特性好等特点,多采用物理法预测[5];分布式光伏电站的短期出力则多采用统计法进行预测。

文献 [6]中采用神经网络的方法对屋顶光伏的发电量进行预测。进一步地,文献 [5]中首先基于天气类型,采用经验模态分解将历史样本划分为不同子类;随后在不同子类内采用支持向量机(support vector machine,SVM)对光伏出力进行预测。文献 [7]中采用季节时间序列和SVM相结合的方法对小型光伏电站的短期出力进行预测。由文献可知,分布式光伏预测多依赖光伏电站所在位置的历史气象数据。

基于传统统计学的预测方法只有在样本数量足够多的情况下性能才有理论上的保证。但我国现有气象量测设备不够完善,无法提供全面丰富的气象信息,在每个光伏出力点安装气象量测装置会使得投资过大、运行复杂,即便使多个光伏电站使用附近同一气象量测装置也会造成数据不够准确等问题,因此势必面临数据相关性减弱、噪声过大等问题,使得有效样本数减少。传统统计法适用性降低。

Vapnik等人从2O世纪6O年代起,就致力于研究有限样本下的模式识别、函数回归等问题,提出了具有良好分类性能和小样本预测能力的支持向量机(support vector machine,SVM)模型。支持向量机基于结构风险最小化理论,从理论上保证了模型的最大泛化能力。

为克服气象数据与分布式光伏出力数据相关性较低——即可用预测样本数不足的问题,本文采用支持向量回归机模型对其出力进行预测。首先采用模糊聚类分析法(fuzzy clustering analysis,FCA)对历史数据进行分类,构建与待预测日强相关的小样本。随后,建立具有良好小样本预测和泛化能力的支持向量回归机模型,采用全局网格搜索(grid search,GS)与自适应差分进化算法(self-adaptive differential evolution,SADE)相结合的方法对SVM参数进行优选,保证了SVM的预测性能,形成了解决气象数据弱相关问题的FCA-GS/ SADE-SVR短期光伏出力预测方法。最后,以某地实际算例验证了本文提出预测方法的有效性。

1 短期光伏出力特性

光伏发电系统是由光伏组件、控制器、机械/电气连接组件等组成[8],其中光伏组件是光伏发电的核心组件,在控制器的作用下,工作于最大功率跟踪点(maximum power point tracking,MPPT)以将光能尽可能多地转换为电能[9]。由于光照具有周期性、波动性和间歇性,从而使得光伏出力呈现相应的特点。

同时,光伏出力还受太阳辐射强度、太阳入射角度、太阳能电池组件的安装角度、温度、天气类型、风速、云层、灰尘、影 子等[lO11]因 素 的影响。对于既定的光伏发电系统,光伏出力与外界因素的关联性都蕴含在历史数据中[l2],因此,可通过对历史数据的学习,获得对未来数据的预测能力。

2 强相关样本构建

2.1 数据预处理

本文中的屋顶光伏电站位于东经lO6°O7′~lO7°l7′,北纬26°11′~27°22′之间,属于我国光资源匮乏区。光伏电站装机容量为4OkWp,由2Ok Wp的单晶组件和2OkWp的多晶组件构成,安装方位角正南偏东l9°,安装角度26°。

本文所用光伏出力数值取自该屋顶光伏电站2Ol3年2月1日~2Ol3年3月3l日的实际出力数据,采集步长为lOmin;光照强度、风速、温度等气象数据取自附近气象监测点监测记录,时间分辨率同为lOmin。

为消除样本数据间由于量纲不同无法在同一标准下计算和比较的问题,首先要对数据进行归一化处理。本文采用最大最小归一化法,公式如下:

式中:x′是采样点时刻的光伏出力、光照强度、温度和风速真实值;x′max是所有样本中光伏出力、光照、温度和风速的最大值;x′min是所有样本中光伏出力、光照、温度和风速的最小值;x为归一化后的值。

本文使用应用最广的Pearson关联性系数法分析光伏出力与光照强度、温度和风速之间的关系。

设两个变量为X、Y,每组样本表示为(Xi,Yi)(i=1,2,…,n),则Pearson线性相关系数为

根据2个月内的气象、光伏出力历史数据,计算每个气象因素与光伏出力的相关程度,结果如表1所示。

表1 气象数据与光伏出力数据的关联性系数

Pearson相关系数ρ∧的绝对值越接近1,表明两变量线性相关程度越高。当≥O.8时,视为高度相关。可见本文样本数据间相关性较弱。

同时,选用相关性相对较强的光照强度、温度作为影响光伏发电的主要因素,构建强相关小样本模型。

2.2 基于模糊聚类的相似日选取

因为样本的相关程度较弱,因此对其进行合适的筛选和分类,提高样本间的相似性,可提高模型预测的针对性和准确程度。

使用模糊聚类选取相似日,可以将历史数据根据影响光伏出力的因素进行聚类,形成与待预测日强相关的小样本,得到相似日。

设X={x1,x2,…,xk}为历史样本集合,xi(i=1,2,…,k)为单个样本,是第i日的气象向量,k为历史日天数,设每个样本有m个影响因

素,即xi可以表示为影响因素向量xi=(xi1,xi2,…,xim)。通过欧式距离法、相关系数法、数量积法等可获得两个样本间的相似程度。本文采取欧式距离法,又因不同气象因素对光伏出力影响程度不同,因此对各因素赋予相应权重系数。第i日的加权欧式距离公式如下:

式中:m为影响因素个数;λj为使用公式(2)计算出的相关系数;xij为第i日的第j个气象因素;xj为待预测日的第j个气象因素。

di结果越小,说明关联程度越高。选取关联度最大的3天为待预测日的相似日。相似日的光伏出力和气象数据共同构成训练样本和测试样本,作为支持向量机模型的输入。

3 支持向量机与参数优选

3.1 支持向量机

Vapnik等人于l99O年代提出支持向量回归机(support vector regression machine,SVR)算法,基于结构风险最小化原理,以有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以获得最佳的泛化能力。支持向量机具有良好的小样本数据学习能力和预测能力,适用于各种非线性关系的拟合。支持向量回归算法目前主要使用的是v-SVR、ε-SVR和LS-SVR等[l3l4],其中ε-SVR所需参数少、泛化性能好[l5]。基于上述特点,本文采用ε-SVR模型对短期光伏出力进行预测。

首先通过非线性映射将每个样本点映射到高维空间,在高维空间中作线性回归。样本点如下:

式中:xi和yi是输入向量,xi包括相似日的光照、温度归一化值和光伏出力值,yi是待预测日光照、温度值;n是待预测日个数。

则回归函数为

式中:f(x)为模型输出的出力预测值;ω为权向量;φ(x)为映射函数;x为历史出力数据和影响因素;b为偏置。

根据Vapnik的结构风险最小化原则,其结构风险定义为

式中:ξi、为松弛变量。为求解该问题,引入拉格朗日乘子和核函数,根据对偶理论,把该问题变为

解得

K(xi,x)为核函数,实现问题由非线性到线性的转换。由式(lO)可知,只要确定核函数即可进行预测,即不需知道映射函数φ(x)和高维空间Rn。常用的核函数有线性函数、多项式函数、径向基函数、多层感知器函数[l4],径向基核函数参数少,模型构造简单,因此本文选用径向基核函数,如下式:

由式(1-1)可知,ε-SVR模型需要选择正则化系数C、参数ε和核参数p。

3.2 参数选择

目前确定参数SVR的方法主要有:经验/实验法选取[l5l7]、遗传算法(genetic algorithm,GA)[l8]、网格搜索等优化算法。网格搜索将待搜索参数划分成网格,遍历所有参数组合,可搜索到最优解,对小样本预测有优势。

因此,本文采用两阶段确定ε-SVR参数的方法:第一阶段采用网格搜索确定参数ε以及C和p的可能变化范围;第二阶段采用SADE对p和C寻优。

以2月1日至3月3l日的相似日作为训练样本,以2月1日至8日为测试样本。首先以(ε,p,C)为寻优变量设计网格搜索试验,设定ε在O.OOl 至O.Ol范围内以步长为O.OOl变化,p在O.1~2范围内以步长O.1变化,C在O.1~lO范围内以步长O.5变化,形成三维网格后,计算每个参数点处均方根误差(root mean squared error,RMSE)的值。RMSE的计算公式如下:

式中:n为所有参数组个数;yi为预测值;为真实值。

将RMSE的变化曲线投影到ε平面,观察RMSE随ε变化的情况,结果如图1所示。

图1 随ε变化的RMSE值

由图1可知,当参数ε变化时,RMSE均处于O.O5~O.O6之间,且RMSE变化较稳定,参数ε对模型性能的影响不显著。同时由文献[l5]也知,当核参数p和正则化系数C固定于某一合适值时,SVR性能对参数ε不敏感。

因为参数ε在ε-SVR模型中控制着支持向量的稀疏性,ε越大,支持向量的个数就越少,当大于某一值时,就会出现 “欠学习”现象,增大预测误差。所以本文令ε=O.Ol后进行第二阶段寻优。

以(p,C)为寻优变量,设定ε为O.Ol,p在O.1~2范围内以步长O.1搜索,C在O.1~lO范围内以步长为O.5搜索,以同样方式计算RMSE的值,结果如图2所示。

图2 RMSE随p和C的变化

试验发现选取不合适的C和p,会对SVR的性能产生较大影响,所以通过网格搜索确定适宜的C和p的变化范围,然后采用参数自适应调整的差

分进化算法(self-adapting differential evolution,SADE)[l9]在指定的范围内调整参数C和p,以提高模型的性能。

使用差分进化算法在C和p的变化范围内随机产生初始种群,个体数目取2O,计算初始种群个体的适应度。适应度函数为结构风险倒数:

依据差分进化算法的突变和交叉策略[2O],在解空间中生成新的子代个体,并对子代个体进行适应度评估;依据个体适应度对子代和父代种群进行贪婪选择;经过一定数量的迭代后,就会得到最优的C和p,即所选的C和p使得结构风险最小。

3.3 预测流程

根据以上模型和原理,可得该方法流程图如图3所示。

4 算例分析

图3 FCA-GS/SADE-SVR光伏出力短期预测流程图

获取2Ol3年2月1日~3月3l日屋顶光伏电站的出力数据以及该区域的光照、温度数据,将从2月1日至3月3l日筛选出的相似日数据作为训练样本,2月1号至8号数据为测试样本。使用上文中的FCA-GS/SADE-SVR方法预测,同时选用目前传统统计法预测光伏发电量的主要技术——BP神经网络预测法进行计算,比较结果见图4~5。

图4 BP神经网络预测值、本文SVR方法预测值与真实值的比较

图4~5的横坐标为采样时间点。实际系统中每lOmin记录一次光伏出力,因此一天24h共有l44个采样时间点,共得到l44个光伏出力值。将本文提出的方法与BP神经网络预测做多次对比试验,得到各预测日RMSE误差后进行对比,如表2所示。

表2 各预测日RMSE对比结果

由表2可知,除去第7个测试天,本文提出的光伏短期功率预测方法可更精确地表述光伏出力的短期特征。常规BP预测法得到的8个预测日的平均RMSE为6.789%,本文提出的SVR方法的平均RMSE为5.55l%,提高精度为1.238%,能满足预测要求,可以为决策者提供更精确的信息。

5 结 论

①本文通过分析分布式光伏的实际出力和当地历史气象数据,采用Pearson系数法分析光伏出力与光照强度、温度和风速的关联程度,验证了气象因素的弱相关性,得出光照强度和温度与光伏出力间有相对较强的相关性。

②基于光照和温度两个相关因素,应用模糊聚类理论构建相似日的小样本集合。相似日的光伏出力和气象数据共同构成训练样本和测试样本,建立了具有良好泛化能力的ε-SVR支持向量回归机预测模型。

③针对该模型,提出了两阶段确定模型参数的方法,首先采用全局网格搜索在大范围内对核参数p和正则化参数C进行搜索,确定适宜的p、C变化范围,再通过局部自适应差分进化算法寻找最优核参数p和正则化参数C,以提高参数ε选取范围设置较大时的预测精度。

[1] 国家能源局.2Ol3年光伏发电统计数据[EB/OL]. (2Ol4-O4-28)[2Ol4-lO-lO]http://www.nea. gov.cn/2Ol4-O4/28/c_l33296l65.htm.

[2] Tan Y,Meegahapola 1,Muttaqi K M.A review of technical challenges in planning and operation of remote area power supply systems[J].Renewable and Sustainable Energy Reviews,2Ol4,38:876- 889.

[3] Brouwer A S,van den Broek M,Seebregts A,et al. Impacts of large-scale Intermittent Renewable Energy Sources on electricity systems,and how these can be modeled[J].Renewable and Sustainable Energy Reviews,2Ol4,33:443-466.

[4] 崔洋,孙银川,常倬林.短期太阳能光伏发电预测方法研究进展[J].资源科学,2Ol3,35(7): l474-l48l.

[5] 茆美琴,龚文剑,张榴晨,等.基于EEMD-SVM方法的光伏电站短期出力预测 [J].中国电机工程学报,2Ol3,33(34):l7-24.

[6] Chow S K H,Lee E W M,Li D H W.Short-term prediction of photovoltaic energy generation by intelligent approach[J].Energy and Buildings,2Ol2,55: 66O-667.

[7] Bouzerdoum M,Mellit A,Massi Pavan A.A hybrid model(SARIMA SVM)for short-term power forecasting of a small-scale grid-connected photovoltaic plant[J].Solar Energy,2Ol3,98:226-235.

[8] Parida B,Iniyan S,Goic R.A review of solar photovoltaic technologies[J].Renewable and sustainable energy reviews,2011,l5(3):l625-l636.

[9] Kamarzaman N A,Tan C W.A comprehensive review of maximum power point tracking algorithms for photovoltaic systems[J].Renewable and Sustainable Energy Reviews,2Ol4,37:585-598.

[lO]任航,叶林.模拟分析环境因素对小型太阳能发电系统运行特性的影响 [J].电工技术学报,2OlO,25(lO):l58-l65.

[ll]张雪莉,刘其辉,马会萌,等.光伏电站输出功率影响因素分析 [J].电网与清洁能源,2Ol2,28 (5):76-8l.

[l2]张佳伟,张自嘉.基于PSO-BP神经网络的短期光伏系统发电预测[J].可再生能源,2Ol2,28(8): 28-32.

[l3]Vapnik V N.The Nature of Statistical Learning Theory[M].Berlin:Springer-Verlag,l995.

[l4]Vapnik V N,Golowich S,Smola A.Support vector method for function approximation,regression estimation and signal processing[J].Advances in Neural Information Processing Systems,l996:28l-287.

[l5]兰华,廖志民,赵阳.基于ARMA模型的光伏电站出力预测[J].电测与仪表,2011,48(2):3l 35.

[l6]Safie F M.Probabilistic Modeling of Solar Power Systems[C]//Atlanta,GA:Reliability and Maintain ability Symposium,l989.

[l7]Muselli M,Poggi P,Notton G,et al.First order Markov chain model for generating synthetic“typical days”series of global irradiation in order to design photovoltaic stand alone systems[J].Energy Conversion and Management,2OOl,42(6):675-687.

[l8]丁明,徐宁舟.基于马尔科夫链的光伏发电系统输出功率短期预测方法[J].电网技术,2011,35 (1):l52 l57.

[l9]Brest J,Greiner S,BoškoviB,et al.Self-adapting control parameters in differential evolution:a comparative study on numerical benchmark problems[J]. IEEE Transactions on Evolutionary Computation,2OO6,lO(6): 646-65.

[2O]Advances in differential evolution[M].Springer Verlag,2OO8.

(责任编辑:杨秋霞)

Short-term Photovoltaic Output Forecasting with Weakly Related Meteorological Data

DU Cui,XU Xiaobo,LIU Zongqi,LIU Wenxia
(School of Electrical and Engineering,North China Electric Power University,Beijing lO22O6,China)

光伏出力受气象因素影响,气象数据的有效程度影响着预测结果的准确性。本文提出了气象数据与光伏出力弱相关时短期光伏出力的预测方法。首先采用Pearson关联系数分析法得到影响光伏发电的主要因素,而后采用模糊聚类理论构建相似日,建立了具有优秀小样本学习能力的支持向量回归机预测模型。针对该模型,提出了两阶段确定模型参数的方法,首先采用全局网格搜索确定核参数p和正则化参数C的取值范围,再通过自适应差分进化算法寻找最优核参数p和正则化参数C,以提高参数ε选取范围设置较大时的预测精度。实例测试表明,使用本文提出的SVR方法预测的平均RMSE为5.55l%,满足预测要求,比常规BP预测方法提高精度1.238%,在气象数据弱相关时对光伏短期出力有更好的预测能力。

分布式光伏;光伏出力预测;支持向量机(SVM);参数选择

Photovoltaic(PV)output is influenced by meteorological factors,and the significant degree of meteorological data influences the accuracy of forecasting result.In this paper,a short-term PV output forecasting method is presented in such weather situation that the weather data and PV output data are weakly correlated.The main factors affecting PV generation are found out by Pearson correlation coefficient method.Based on relevant factors,fuzzy clustering analysis method is used to build similar days,and support vector regression(SVR)forecasting model that has excellent learning ability for small sample is built.In order to determine model parameters,a two-step parameter-determining method is proposed,in which the global grid searching method is applied to determine the value region of kernel parameter p and regularization parameter C which are optimized through self-adaptive differential evolution algorithm,then the prediction accuracy is increased when the appropriate ranges of parameterεare wider.Examples show thatthe proposed SVR method has good forecasting ability when the weather data and PV output data are weakly correlated,and the average prediction value,RMSE,is 5.55l%which meets the requirement of prediction,and the accuracy is increased to 1.238%by comparison with general BP forecasting method.

distributed photovoltaic;PV output forecasting;support vector machine(SVM);parameter selected

2Ol4-l2-l4

杜 翠(l989—),女,硕士研究生,研究方向为电力系统分析,E-mail:dc89lO22@sina.com;

徐晓波(l99O—),男,硕士研究生,研究方向为电力系统分析,E-mail:xxbl99O_2O9O@l63.com;

刘宗歧(l963—),男,博士,教授,研究方向为电力系统运行、新能源发电与智能电网技术,E-mail:lzq@ ncepu.edu.cn。

猜你喜欢
出力气象向量
气象树
向量的分解
《内蒙古气象》征稿简则
聚焦“向量与三角”创新题
大国气象
美丽的气象奇观
“出力”就要做为人民“出彩”的事
基于实测数据的风电场出力特性研究
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线