利用最佳相似日的光伏电站短期出力预测

2015-10-12 06:40郭宇杰袁晓玲李昌明刘皓明
电力需求侧管理 2015年6期
关键词:出力形状电站

郭宇杰,袁晓玲,李昌明,刘皓明

(1.河海大学 能源与电气学院,南京 211100;2.中利腾晖光伏科技有限公司,江苏 常熟 215500)

◆研究与探讨◆

利用最佳相似日的光伏电站短期出力预测

郭宇杰1,袁晓玲1,李昌明2,刘皓明1

(1.河海大学 能源与电气学院,南京211100;2.中利腾晖光伏科技有限公司,江苏 常熟215500)

光伏发电系统的输出功率易受辐照、温度等环境因素影响,其输出功率具有较大的波动性和随机性,并网时对电网的调度、保护等方面将产生较大影响,因此光伏发电出力预测研究逐渐发展,尤其是在短期、超短期出力高精度预测方面的研究[1]。光伏电站的出力预测方法主要可归纳为2类:直接预测法和间接预测法。直接预测法是直接对光伏发电系统的输出功率进行预测;间接预测法首先对地表太阳辐照强度进行预测,然后根据光伏发电系统的出力模型得到系统的输出功率[2]。直接预测法较间接预测法相对简单,因此研究更为广泛。而在采用直接预测法之前,先对样本数据进行预处理,选出与预测日最为接近的历史日作为其相似日。文献[3]运用欧氏距离公式比较预测日与各历史日的气象因素的差异度,选取差异度较小的历史日作为预测日的相似日。文献[4]利用灰色关联系数法,综合各个气象因素的关联系数,得到预测日与各历史日的关联度,选取相似度最大的历史日作为预测日的相似日。欧氏距离法反映的是各样本空间距离的远近,关联度反映的是样本间的线性关系,即曲线形状的相似性。而实际情况中,若只考虑其中一种关系,对预测日选择相似日容易造成较大误差,进而影响光伏发电功率的预测精度。

本文利用加权欧氏距离法和相关系数法分别得到历史样本的出力水平相似日集和曲线形状相似日集,判别预测日分别所属相似日集,取二者交集得最佳相似日。选取预测日的最佳相似日作为预测模型输入样本,采用神经网络算法实现光伏电站短期出力预测。

1 最佳相似日

所谓相似日是指和预测日的天气情况最接近的历史样本,本文采用2种不同的聚类函数:加权欧氏距离法和相关系数法对光伏电站历史样本进行分类,考虑各历史样本间出力的距离关系和曲线形状关系,对样本进行合理分类,取2种聚类集合的交

1.1出力水平相似日集

出力水平相似日集是指光伏出力曲线距离相距较小的集合,若采用传统欧氏距离法作为聚类函数,样本中各对象对样本的影响程度的差异会被忽略。基于此方面的考虑,本文采用加权欧氏距离以提高聚类精度。

在对历史样本进行出力水平相似日聚类时,各样本对象为经过量化的每日天气类型、最高温度和最低温度的环境因素数据,给定环境样本集合X={X1,…,Xn,…,XN},其中Xn=[Xn1,…,Xnm,…XnM],N为样本数量,M为各样本的对象数,这里M=3。给定光伏电站出力P={P1,…,PN},则自变量Xm对因变量P的偏相关因数rXm→P如式(1)所示[5]式中:-Pn为历史样本平均值;-PCk为历史样本聚类中心平均值。

式中:bm为偏回归系数;-Xm和-P分别为环境因素和光伏电站出力样本的平均值。

根据各自变量的偏相关因数可得各自变量对因变量的影响权重ωm,如式(2)所示

给定聚类中心集合XC={XC1,…,XCk,…,XCK},其中XCk=[XCk1,…,XCkm,…,XCkM],K为聚类中心数量。引入权值ω=[ω1,…,ωm,…,ωM],则聚类中心XCk与各样本Xn间的距离可表示为

1.2曲线形状相似日集

样本曲线形状相似是指光伏出力曲线变化趋势相近,采用相关系数法对历史样本进行聚类[6]。设某历史样本出力为Pn=[Pn1,…,Pnl,…,PnL],历史样本聚类中心为PCk=[PCk1,…,PCkl,…,PCkL],l=1,2,…,L,本文中L是指每天光伏电站出力采集点总数,则历史样本与聚类中心的相关系数如式(4)所示集为最佳相似日。

1.3最佳相似日的确定

当出力水平相似日集与曲线形状相似日集确定分类数后,对2个集合中各子集求取对应环境因素聚类中心,根据式(3)求出预测日与2个集合中各子集环境因素聚类中心的距离矩阵分别为D1和D2,按距离最小原则分别确定其所属两大集合中的2个子集,二者的交集所对应的历史样本作为预测日的最佳相似日。

2 K⁃means聚类算法

K⁃means聚类算法是一种基于划分的经典聚类方法,其核心思想是把数据划分为相似度最高的K类,而其主要存的问题如下:①随机选取初始聚类中心易导致选中噪声数据或孤立点,使得算法迭代次数增多,算法运行时间增长,同时也会使算法陷入局部极值;②算法自身无法判定最优聚类数[7]。针对这2个问题,本文通过密度指标选取K⁃means聚类算法的初始聚类中心,最终确定最大初始聚类数K0;通过WCBCR值确定出力水平相似日与曲线形状形似日的最优聚类数K*[10]。

2.1初始聚类中心的选取

为改善K⁃means聚类算法效果,本文基于密度指标确定K⁃means聚类算法的初始聚类中心。定义数据X密度指标T1,如式(5)所示[8]

式中:“‖‖·”表示向量的模;ha为一正数,其取值如式(6)所示

根据最大值原则,将密度指标{Tn

1}(n=1,2,…,N)中最大的数据对应的样本记为Xn1,并将其作为第1个初始聚类中心,记作XC1,对应的密度指标记为TC1。

第k-1个聚类中心确定后,运用式(7)对余下N-k+1个样本数据(已去除Xn1,…,Xn,k-1)再进行密度指标计算

式中:为避免距离过近的聚类中心出现,取h=1.5h[8]。

同样根据最大值原则,从余下的N-k+1个样本数据中选取第k个聚类中心XCk,对应的密度指标记为TCk。

通过上述?公式计算密?度指标选取对应聚类中心,直到满足≥δ且<δ时结束。研究表明,δ≥0.5时,可得到合理分类数[9]。通过以上计算可以得到最大初始聚类数为K0,此时对应出力水平相似日和曲线形状相似日的1×K0维密度指标向量分别记为TC1和TC2。

2.2最优聚类数的确定

本文选取预测日的最佳相似日时,选用K⁃means聚类算法作为基础,取式(3)和式(4)作为聚类函数,采用WCBCR聚类指标作为评价函数确定最优聚类数。WCBCR值定义为组内距离平方和与组间距离平方和的比值式中:Ωk为第k类数据集。

WCBCR聚类指标值越小,说明聚类效果越好[10],但过小的聚类指标值可能会导致聚类集合为空集的情况,因此,最优聚类数K*对应着不存在空集下的最小WCBCR指标。

3 仿真与分析

3.1实验数据与计算

为验证本文的预测方法,收集某光伏电站2014年1月到12月的发电数据和当地气象站发布的环境数据。其中,发电数据为每天6:00~17:00每间隔15 min的采样值;环境因素包括:天气类型、最高温度和最低温度。选取天气类型分别为晴天、雨天和阴转多云的3个典型日作为预测日,经过筛选最终分别确定为8月1日、8月13日和8月21日。

首先进行出力水平相似日选择。根据式(1)和式(2)求得每日天气类型、最高温度和最低温度对出力的权值为ω=[0.52,0.43,0.05],然后再根据2.1节得到出力水平相似日和曲线形状相似日的最大初始聚类数K0都为9,对应出力水平相似日密度指标TC1=[94.60,94.48,94.21,93.42,92.11,89.09,81.93,68.57,48.11],曲线形状相似日密度指标TC2=[47.67,47.64,47.56,47.31,46.70,44.85,41.35,35.01,24.11]。

将式(3)代入K⁃means聚类算法中,分类结果如表1所示。比较分类数为2至8的WCBCR值,虽然逐渐减小但减幅不大,而当分类数为9时,WCBCR值出现较大幅度降低,这是因为此时聚类子集中出现空样本集现象。式(8)中WCBCR计算表达式分母多加1项其值明显变大,而分子几乎不变,导致WCBCR值大幅减小。因此,确定出力水平相似日集最优聚类数K*=8。曲线形状相似日选择过程与出力水平相似日类似,但K⁃means聚类算法中聚类函数及样本变量不同,使用的是式(4)及历史日各时刻的出力大小。通过WCBCR值判断,曲线形状相似日集最优聚类数K*=6。

表1 2种相似日的聚类结果

当出力水平相似日集聚类数为8类时,3个预测日与出力水平相似日集各子集的距离矩阵D1为

同理,当曲线形状相似日集聚类数为6类时,3个预测日与曲线形状相似日集各子集的距离矩阵D2为

选取2个矩阵中各行向量最小值对应的子集,各预测日对应2个子集的交集作为最佳相似日。需要说明的是,不同天气类型的预测日所对应的出力水平相似日与曲线形状相似日的交集中的样本数量一般不同,对于天气环境比较一致的如晴天,一般交集样本较多,本文在交集中选取日期与预测日最接近的5个样本作为最佳相似日。

3.2预测模型数据

本文选取3层BP神经网络[11]作为出力预测模型,输入量选取最佳相似日中与预测日相似度最大的5日出力和环境数据及预测日的环境数据,输出量为预测日6:00~17:00每间隔15 min的发电功率。BP神经网络隐含层为单层,隐含层的节点数根据经验选为19个[12]。

3.3预测结果与误差分析

分别使用曲线形状相似日、出力水平相似日和最佳相似日3种方法选取预测模型的输入量进行预测,对3种天气类型的预测日预测结果如图1—图3所示。

图1 晴天光伏功率预测结果对比曲线

图1是晴天的出力对比图。由于晴天环境因素比较稳定,光伏电站输出功率相对稳定,3种方法都有较高的预测精度。图2和图3分别是雨天和阴转多云的出力预测对比图,由于这2种天气类型下太阳辐照波动较大,光伏电站输出功率变化较为剧烈且规则性不强,相对而言,最佳相似日选择法比曲线形状相似日和出力水平相似日具有更好的精度。为了清晰对比预测效果,采用平均绝对百分误差(MAPE,mean absolute percentage error)和均方根误差(RMSE,root mean square error)对预测效果进行分析,结果如表2所示。

图2 雨天光伏功率预测结果对比曲线

图3 阴转多云光伏功率预测结果对比曲线

表2 3种天气类型的预测日出力预测误差%

4 结论

为了利用已有数据准确预测光伏电站出力,对各类数据的预处理至关重要。本文结合出力水平相似日选取与曲线形状相似日选取2种方法,由其交集确定最佳相似日集,保证了相似日在距离大小和形状关系上的最大相似度。分别将出力水平相似日、曲线形状相似日和最佳相似日作为神经网络预测模型的输入量,通过实测数据仿真对比分析,验证了所提基于最佳相似日预测方法的优势。D

[1]Chen Changsong,Duan Shanxu,Cai Tao,et a1.Online 24 h solar power forecasting based on weather type classification using artificial neural network[J].Solar Energy,2011,85(11):2 856-2 870.

[2]Yuehui Huang,Jing Lu,Xiaoyuan Xu,et a1.Comparative study of power forecasting methods for PV stations[C]∥IEEE Conferences on Power System Technology.Hangzhou,China:2010:1-6.

[3] 李建红,陈国平,葛鹏江,等.基于相似日理论的光伏发电系统输出功率预测[J].华东电力,2012,40(1):153-157.

[4] 王晓兰,葛鹏江.基于相似日和径向基函数神经网络的光伏阵列输出功率预测[J].电力自动化设备,2013,33(1):100-103.

[5] 白俊良,梅华威.改进相似度的模糊聚类算法在光伏阵列短期功率预测中的应用[J].电力系统保护与控制,2014,42(6):84-90.

[6] 康重庆,夏清,刘梅.电力系统负荷预测[M].北京:中国电力出版社,2007.

[7] 李飞,薛彬,黄亚楼.初始中心优化的K⁃means聚类算法[J].计算机科学,2002,29(7):94-96.

[8] 孙谦,姚建刚,赵俊,等.基于最优交集相似日选取的短期母线负荷综合预测[J].中国电机工程学报,2013,33(4):126-134.

[9]Nikhil R P,Chakraborty D.Mountain and subtractive clustering method:Improvements and generalizations[J].International JournalofIntelligentSystems,2000,15(4):329-341.

[10]George J Tsekouras,Nikos D Hatziargyriou,Evangelos N Dialynas.Two⁃Stage pattern recognition of load curves for classification of electricity customers[J].IEEE Transactions on Power System,2007,22(3):1 120-1 128.

[11] 陈昌松,段善旭,殷进军.基于神经网络的光伏阵列发电预测模型的设计[J].电工技术学报,2009,24(9):153-158.

[12] 袁晓玲,施俊华,徐杰彦.计及天气类型指数的光伏发电短期出力预测[J].中国电机工程学报,2013,33(34):57-64.

Short⁃term forecasting for photovoltaic power generation based on optimal similar set

GUO Yu⁃jie1,YUAN Xiao⁃ling1,LI Chang⁃ming2,LIU Hao⁃ming1
(1.College of Energy and Electrical Engineering,Hohai University,Nanjing 211100,China;2.Zhongli Talesun Science and Technology Co.,Ltd.,Changshu 215500,China)

提出一种基于最佳相似日的光伏电站短期出力预测方法。该方法利用密度指标确定初始聚类中心优化K⁃means聚类算法,采用加权欧式距离法获得历史样本的出力水平相似日集,采用相关系数法获得历史样本的曲线形状相似日集,确定预测日出力水平相似日集和曲线形状相似日集,选取两集合的交集样本作为最佳相似日。建立BP神经网络出力预测模型,采用光伏电站的实测数据训练预测模型,对比不同类型天气的预测结果与实测数据,表明论文的预测方法具有较高的预测精度。

光伏发电;短期出力预测;出力水平相似;曲线形状相似;最佳相似日

This paper proposes a short⁃term power forecasting method for photovoltaic generation based on optimal similar days. Density index is adopted to choose the initial clustering centers to op⁃timize K⁃means algorithm.Weighted Euclidean distance is used to get power generation level set of historical samples.Correlation coeffi⁃cient is used to get power generation shape set of historical samples. The intersection set of power level and power shape is the optimal similar set.Forecast model of BP neural network is constructed and trained by operation data from photovaltaic power station.Forecast re⁃sults reveal that the proposed method has high accuracy by compar⁃ing the forecast results and operation data in different type weathers.

photovoltaic generation;short⁃term power genera⁃tion forecasting;similar power generation level;similar power genera⁃tion shape;optimal similar set

TM615.2

B

2015-06-27;

2015-09-14

国家自然科学基金项目(51207044)

郭宇杰(1990),女,江苏靖江人,硕士研究生,研究方向为光伏发电出力预测;袁晓玲(1971),女,安徽巢湖人,博士,副教授,从事新能源发电技术的研究及教学工作。李昌明(1983),男,江西萍乡人,电气工程师,从事光伏电站研发及运营管理;刘皓明(1977),男,江苏盐城人,博士,副教授,研究方向为智能电网、电力系统伏压运行和电力市场。

猜你喜欢
出力形状电站
挖藕 假如悲伤有形状……
三峡电站再创新高
低影响开发(LID)在光伏电站中的应用
你的形状
火眼金睛
风电场有功出力的EEMD特性分析
要争做出力出彩的党员干部
汽车内饰件用塑料挂钩安装力及脱出力研究
心的形状