基于最小二乘支持向量机的光伏出力超短期预测

2015-03-02 05:22张华彬杨明玉
现代电力 2015年1期

张华彬,杨明玉

(华北电力大学电气与电子工程学院,河北保定 071003)

Ultra-Short-term Forecasting for Photovoltaic Power Output Based on Least Square Support Vector MachineZHANG Huabin,YANG Mingyu

(School of Electrical and Electronic Engineering,North China Electric Power University,Baoding 071003,China)



基于最小二乘支持向量机的光伏出力超短期预测

张华彬,杨明玉

(华北电力大学电气与电子工程学院,河北保定071003)

0引言

随着光伏电站并网容量的增大,在缓解能源危机和降低环境污染问题的同时,光伏出力的随机性也对电网的安全稳定运行带来了严峻挑战[1-3]。对于一个既定的电网,其接纳光伏电站并网容量一般不宜超过10%~15%[4],这在一定程度上限制了光伏系统的发展。因此,加强光伏出力预测研究,对于提高系统稳定运行能力、电网经济合理调度、降低系统旋转备用容量等都具有重要意义。

光伏出力预测根据预测方法可分为直接法和间接法:前者利用历史出力数据和气象信息,直接建模进行预测;后者需要先建立太阳辐射强度预测模型,然后二次建模预测光伏出力。根据预测时间尺度可分为提前1~2d进行的短期出力预测和提前15min~4h的超短期出力预测。文献[5]提出了一种神经网络短期出力预测模型,但对不同日类型进行统一泛化拟合,预测效果较差。文献[6-7]利用光伏出力和气象信息的采样点数据输入神经网络模型,对连续几个预测日的光伏出力分别作了短期预测,总体预测精度较高,但当天气类型变化较快时预测精度还有待提高。文献[8]先由卫星云图信息建模推出云层指数,然后由云层指数、太阳天顶角、大气消光系数预测地表太阳辐射强度,最后再建立最小二乘支持向量机(Least Square Support Vector Machine,LS-SVM)超短期模型提前1h预测光伏出力。但是,该方法建模复杂,计算量大,太阳辐射强度的预测误差在光伏出力预测结果中会放大,而且以1h为步长的预测不能满足电网调度部门对15min预测时间分辨率的要求。

本文在分析光伏出力影响因素的基础上,通过计算温度、湿度和太阳辐射强度等气象因素的加权欧氏距离确定各时段训练样本,结合待预测时段最新气象信息,对4个季节不同天气类型的各时段分别建立了LS-SVM模型,对未来1h内每刻钟的出力进行预测,避免了复杂的二次建模和短期预测不能很好地反映天气类型突变情况的不足。最后,利用光伏电站实际运行数据验证了所提模型的有效性,可为电网调度部门制定合理的调度计划提供有效的参考依据。

1气象因素对光伏出力的影响

光伏系统出力要受众多因素的综合影响。本文以保定某光伏系统历史出力和气象数据为对象,重点研究季节类型、日类型、太阳辐射强度、大气温度、光伏面板温度和相对湿度对光伏系统出力的影响。由于光伏阵列所处楼顶空旷,周围无建筑物或高大树木遮挡,故不考虑阴影[9]对光伏出力的影响。

1.1太阳辐射强度

固定安装光伏系统的出力模型为

(1)

式中:N为光伏阵列中正常工作的组件数;η1为组件的额定光电转换效率(%);η2为最大功率点跟踪(Maximum Power Point Tracking,MPPT)的工作效率(%);η3为逆变器的转换效率(%);S为光伏阵列的面积(m2);I为光伏面板得到的总太阳辐射强度(kW/m2);α为组件温度系数;T0为光伏面板温度(℃)。

对于正常运行的光伏系统,N、S、η1的值已确定,几乎所有的并网逆变器都工作在MPPT模式[10],且在光伏系统正常使用周期内η2、η3只发生微小变化,可认为是常量。

图1显示出光伏系统出力与当天的太阳辐射强度总量(包括直辐射、反辐射和散辐射)曲线高度相似,前者受后者影响显著。

图1 光伏出力与太阳辐射强度的关系

1.2季节类型和日类型

图2为不同日类型时的光伏系统输出功率。日类型不同时,光伏系统的发电量相差很大。图3显示出,当日类型相同季节类型不同时,光伏出力曲线具有上升—保持—下降的高度相似性,但出力大小不同。综上,对于固定安装的光伏阵列,不同日类型、季节类型时,光伏面板上获得的太阳辐射强度总量不同,这是造成出力大小不同的主要因素。为了提高模型对晴天和非晴天时的预测精度,本文结合光伏系统历史出力数据,将每种日类型分别赋予0~1的天气类型指数,作为选择与待预测时段天气属性相似集合的标准之一。

图2 不同日类型时的光伏出力

图3 不同季节晴天时的光伏出力

1.3温度

由式(1)可知,光伏面板温度对光伏出力有直接影响,而大气温度通过影响光伏面板温度间接影响其出力,这是因为光伏电池工作环境温度影响其光电转换效率。晴天时光伏出力与温度(包括光伏面板温度和大气温度)的关系如图4所示。

图4 光伏系统出力与温度的关系

图中可看出,光伏面板温度对光伏出力影响较大,当光伏面板温度增加时,光伏出力也随之增加,二者接近呈正相关。为了提高预测精度,选择大气温度和光伏面板温度两种温度因素作为预测模型的两个重要输入变量。

1.4相对湿度

图5显示出,当相对湿度较大时,空气中的水汽对太阳辐射强度的吸收及折、反射增强,光伏面板获得的光照强度减弱,因而光伏系统出力就减少,二者呈负相关。

图5 光伏出力与相对湿度的关系

2最小二乘支持向量机算法

最小二乘支持向量机(LS-SVM)是由Suykens等人在继承传统支持向量机(SVM)优点基础上对其作出的改进,泛化能力强,能以其特有的优势解决小样本、非线性、高维数以及局部极小等实际问题。

(2)

式中:ω为加权向量,ω∈Rk;b为常量,b∈R。

这样,用高维特征空间的线性运算取代ω和φ(x)的点积运算。LS-SVM优化目标误差估计部分采用平方项,约束条件也由SVM中的不等式约束变为等式约束,如式(3)和式(4)所示为

(3)

(4)

式中:ei为误差变量;惩罚参数γ>0,控制对超出ei的样本的惩罚程度。式(2)中参数ω和b可由式(3)和式(4)来估计。

引入Lagrange乘子λi(λi∈R),构造函数

(5)

由KKT条件求最优解,化简得到

(6)

其中K(xi,xj)=φ(xi)Tφ(xj)为核函数。由于核函数的引入,可用原低维空间的核函数运算代替高维特征空间的点积运算,巧妙地避免了高维特征空间中“维数灾难”等问题[11],使得LS-SVM算法能更好地解决非线性问题。

3光伏出力预测模型设计

3.1预测模型总体框架及流程

预测模型总体框架如图6所示。

图6 光伏系统出力预测模型框架

首先将光伏系统历史出力、气象数据按季节类型分类,然后结合出力值和气象信息对4个季节的每条数据分别赋予不同的日类型指数,便得到每个季节不同日类型指数下的数据样本,再从中选择相似时段并筛选出各时段训练样本,建立预测模型,最后将4季的模型进行整合便得到全年完整光伏出力预测模型。实际预测时,由待预测日期及天气预报数据确定季节类型、日类型指数,然后根据待预测时段最新气象信息找到相同日类型指数的对应时段预测模型,选择训练集,预测未来1h内每15min的光伏出力。

3.2相似时段选择

由第1节的分析可知,待预测日的光伏出力与相同日类型指数的各样本出力相似度较高,在相似样本出力基础上有少许变化,这主要源于二者气象因素的差异。

本文首先由待预测日的天气属性筛选出与其日类型指数一致的样本D,其次取相应时段的太阳辐射强度、大气温度、相对湿度作为气象特征向量,对样本数据进行二次筛选,能更好地反映待预测日的实际天气属性。第i日第j个时段的气象特征向量如式(7)所示:

(7)

式中:Iij为第i日第j个时段初始时刻的太阳辐射强度;tij1~tij5分别为第i日第j个时段每刻钟的大气温度值;hij1~hij5分别为第i日第j个时段每刻钟的相对湿度值。

记待预测日第j个时段的气象特征向量为xj=[Ij,tj1,…,tj5,hj1,…,hj5]。为了识别不同因素对光伏出力的影响程度,对每一变量分别赋予一权重系数,采用式(8)计算样本D中第i日第j时段与待预测日相同时段的加权欧氏距离。

(8)

式中:xij(k)、xj(k)分别为特征向量xij、xj中的第k个元素;λk为第k个影响因素与光伏出力之间的相关系数,采用Pearson相关系数法进行计算,可体现出各影响因素的重要程度。

上式计算结果记为{dij},取dij≤0.5的多条数据作为待预测时段的相似时段集合,称dij最小值对应的数据为“最佳相似时段”。从该集合中选择训练样本,用与待预测时段的气象特征相似度较高的样本对模型进行训练,然后用训练好的LS-SVM模型预测光伏出力,能更好地反映待预测日各时段的实际出力情况,有助于提高预测精度。

3.3数据预处理

对数据进行预处理,去除奇异数据、修补缺失数据,并按式(9)进行归一化,将各量限制在(0,1)内,可有效提高模型训练、收敛速度。

(9)

3.4模型输入输出量

本模型以15min为步长预测未来1h的光伏出力,如图7所示,输入变量见表1所列,输出为待预测时段4个点的光伏出力。

图7 预测模型结构

输入变量变量名称x1~x5最佳相似时段每刻钟的大气温度值x6~x10最佳相似时段每刻钟的光伏面板温度值x11~x15最佳相似时段每刻钟的相对湿度值x16~x20最佳相似时段每刻钟的光伏出力值x21~x25最佳相似时段每刻钟的太阳辐射强度值x26~x30待预测时段每刻钟的大气温度值x30待预测时段初始时刻光伏面板温度值x31~x35待预测时段每刻钟的相对湿度值x36待预测时段初始时刻光伏出力值x37待预测时段初始时刻太阳辐射强度值

3.5选取核函数

采用式(10)所示的RBF核函数:

(10)

式中:x是输入向量;xi是第i个核函数中心;σ是核宽度参数,控制着核函数距中心点的宽度。由于LS-SVM中惩罚参数γ和核宽度参数σ的选择直接决定着预测模型的精度,成为模型优劣的关键,本文采用粒子群优化算法[12](Particle Swarm Optimization,PSO)优化选择模型参数。

4算例分析

利用Matlab编程实现了LS-SVM学习算法和迭代过程,模型的训练和测试数据来自保定某光伏实验电站2013年实测出力和对应气象信息。光伏出力和气象数据从6:00~19:00时段中每15min采样一次。以春夏秋冬四季光伏出力预测子模型为例,分别对2013年4月15日(晴间多云)、7月7日(多云)、10月14日(小雨)、12月11日(晴)四组光伏出力数据6:00~19:00时段以15min为步长每1h预测1次,并把预测结果进行整合,此为模型Ⅰ。文献[10]提出一种LS-SVM光伏出力预测模型,把温度、湿度及光伏出力数据作为输入,以15min为步长预测第2日的光伏出力,该模型记为模型Ⅱ,与本文所提模型的预测精度做一对比。两种模型的预测结果如图8所示。

图8 预测结果

由图8(a)和图8(d)可知,晴天时段两种模型均有较高预测精度,基本能反映待预测日实际光伏出力情况,个别时刻预测值等于实测值,但模型Ⅱ较模型Ⅰ预测结果存在少许波动,且个别时段(如图8(a)中9:15~10:30和图8(d)中11:30~13:00)预测值偏离实测值较大。图8(a)中多云时段(图中12:45~14:45)两种模型预测精度有所下降,预测值与实测值偏离程度增大,但模型Ⅰ仍保持较好的预测能力,反映出实际出力变化趋势,而模型Ⅱ在该时段预测值出现较大偏差,没能很好地体现出待预测日的天气类型突变现象。

1.需要在文中表达“作者简介”或“通讯作者简介”的,请提供作者的相关信息,一般格式为“姓名(出生年月-),性别,籍贯,最高学位,职称,研究方向或者工作方向等”;若在科研工作中取得了突出成绩,可适当详细介绍,一般不超过100字。对于缺乏实质内容介绍的,如仅表达了工作单位的,将不予在刊出时标明。

图8(b)和图8(c)所示结果显示出,非晴天条件下光伏出力预测值波动幅度较晴天(如图8(a)和图8(d)所示)时明显增大,当天气类型变化剧烈时(如图8(b)中12:00~15:00和图8(c)中11:00~16:30 时段)这种现象更为明显。图8(b)和图8(c)中模型Ⅰ虽然整体预测误差较晴天时有所增大,但仍能较好地反映出实测出力曲线的变化情况;模型Ⅱ整体预测值偏离实测值较模型Ⅰ大,图8(c)中12:15~15:15时段模型Ⅱ预测结果甚至出现了与实测出力变化相反的情况。

为了具体评价两种模型的预测效果,本文采用平均绝对误差EMAPE来评估模型整体预测能力,用均方根误差ERMSE来衡量模型与实测值的偏离程度,结果如表2所示。

(11)

(12)

表2 预测误差

由表2可知,4组测试数据中模型Ⅰ预测精度均较模型Ⅱ高,当天气类型为非晴天时尤为明显。在所有测试数据中,2013年12月11日(晴)预测误差最小,模型Ⅰ、模型Ⅱ的平均绝对误差分别为2.967%、4.998%;2013年10月14日(小雨)预测误差最大,模型Ⅰ、模型Ⅱ的平均绝对误差分别为16.783%、43.576%,此时模型Ⅱ预测结果与实际情况相差较大,失去了实用价值,这与上述分析基本一致。

总体来说,模型Ⅱ预测值在晴天时段能大致反映实际出力变化趋势,但在非晴天阶段与实测值偏差较大,这是因为模型Ⅱ所选相似日不能很好地反映待预测日每个时段的详细天气属性;模型Ⅰ由于采用分时段预测,适当缩短了预测周期,以待预测时段最新气象信息作为输入,能够详细反映出待预测日各时段的实际天气情况,总体精度较高,当天气类型发生突变时效果较模型Ⅱ更为明显。

5结论

本文分析了影响光伏出力的主要气象因素,利用实际运行的光伏电站出力数据和对应气象信息,根据季节类型和天气类型形成不同的数据集合,并确定日类型指数;然后对光伏出力、温度、湿度、太阳辐射强度每刻钟采样一次,根据气象因素的加权欧氏距离计算结果选取相同日类型指数条件下每1h的相似时段集合,并从中筛选训练样本,使样本能准确地反映待预测日的天气属性,结合待预测时段最新天气预报信息,对4个季节不同天气类型指数的每个待预测时段分别建立LS-SVM模型,提前1h预测每刻钟的光伏出力,不需要复杂的二次建模。预测结果显示,所提模型具有较高的预测精度,在天气类型发生突变时仍能保持较高的精度,可为电网调度部门制定合理的调度计划提供一定的参考依据。

参考文献

[1]陈昌松,段善旭,蔡涛,等.基于模糊识别的光伏发电短期预测系统 [J].电工技术学报,2011,26(7):83-89.

[2]刘光明,刘祖明,何京鸿,等.基于多元线性回归模型的并网光伏发电系统发电量预测研究 [J].现代电力,2011,28(2):44-48.

[3]辛晓帅,粱主坤.基于LMS-Wiener滤波模型的光伏电站出力预测 [J].现代电力,2013,30(2):53-56.

[4]栗然,李广敏.基于支持向量机回归的光伏发电出力预测 [J].中国电力,2008,41(2):74-78.

[5]陈昌松,段善旭,殷进军.基于神经网络的光伏发电阵列发电预测模型的设计 [J].电工技术学报,2009,24(9):153-158.

[6]王晓兰,葛鹏江.基于相似日和径向基函数神经网络的光伏阵列出力预测 [J].电力自动化设备,2013,33(1):100-103,109.

[7]代倩,段善旭,蔡涛,等.基于天气类型聚类识别的光伏系统短期无辐照度发电预测模型研究 [J].中国电机工程学报,2011,31(31):28-35.

[8]朱永强,田军.最小二乘支持向量机在光伏功率预测中的应用 [J].电网技术,2011,35(7):54-59.

[9]肖景良,徐政,林崇,等.局部阴影条件下光伏阵列的优化设计 [J].中国电机工程学报,2009,29(11):119-124.

[10]傅美平,马红伟,毛建荣.基于相似日和最小二乘支持向量机的光伏发电短期预测 [J].电力系统保护与控制,2012,40(16):65-69.

[11]杨晓伟,郝志峰.支持向量机的算法设计与分析[M].北京:科学出版社,2013.

[12]金鑫,袁越,傅质馨,等.天气类型聚类的支持向量机在光伏系统输出功率预测中的应用 [J].现代电力,2013,30(4):13-18.

张华彬(1985—),男,硕士研究生,研究方向为微电网能量管理和光伏发电系统出力预测,E-mail:ncepu_zhb@163.com;

杨明玉(1965—),女,硕士,副教授,研究方向为电力系统继电保护和微电网能量管理, E-mail:yangmy1026@hotmail.com。

(责任编辑:林海文)

Ultra-Short-term Forecasting for Photovoltaic Power Output Based on Least Square Support Vector MachineZHANG Huabin,YANG Mingyu

(School of Electrical and Electronic Engineering,North China Electric Power University,Baoding 071003,China)

摘要:随着大规模光伏电站接入配网,为了减轻光伏出力的随机性对电网安全稳定运行的影响,有必要加强光伏出力预测研究。提出了一种基于最小二乘支持向量机(LS-SVM)的光伏出力超短期预测模型,模型的输入考虑了待预测时段的最新气象信息,提前1h对每刻钟的光伏出力进行预测。为了能更精确地反映待预测日的天气情况,对影响光伏出力的每一气象因素,分别赋予一适当权值,通过计算加权欧氏距离确定各时段的训练样本。最后,利用含有突变情况的天气对训练好的模型进行了测试和评估。结果表明,所提模型预测精度较高,能够为电网调度部门制定合理调度计划提供一定的参考依据。

关键词:最小二乘支持向量机;光伏发电系统;超短期预测;加权欧氏距离;相似时段

Abstract:With the connecting of large-scale photovoltaic(PV)power station to the distribution network, it is necessary to strengthen the study of photovoltaic power output prediction in order to mitigate the impacts of randomness on power system.An ultra-short-term forecasting model based on least square support vector machine(LS-SVM)is proposed.To predict the PV output for every quarter ahead of 1h,the inputs of the model are the latest meteorologic information.To accurately reflect the weather condition of predicted day, a proper weight value is set to each meteorological factor which affects the PV output,then the training samples are determined by calculating the weighted Euclid distance. In the end, the trained model is tested and evaluated by using weather data with sudden changes.The results show that the proposed model has high precision, and can provide reference for dispatching department to formulate reasonable schedule.

Keywords:least square support vector machine(LS-SVM);photovoltaic system;ultra-short-term forecast;weighted Euclid distance;similar period

作者简介:

收稿日期:2014-04-24

文章编号:1007-2322(2015)01-0070-06

文献标志码:A

中图分类号:TM615