张华彬,杨明玉
(华北电力大学 电气与电子工程学院,河北 保定071003)
随着全球能源危机和环境保护问题的日益突出,并网光伏发电以其特有的优势得到了快速推广应用,但是其出力的波动性、间歇性及随机性会威胁到电网的安全、稳定运行[1~4]。因此,对光伏出力进行预测以减少其对电网的冲击,实现传统能源和可再生能源的优势互补变得极为重要[5]。
文献[6]根据历史气象信息先估计出待预测日的太阳辐射强度,再由太阳辐射强度建立模型预测光伏出力,但是没有考虑光伏阵列的安装角度以及光电转换效率等自身因素的影响。文献[7]先对云层指数和晴空地表太阳辐射值进行预测,再对有云层遮挡时的地表太阳辐射进行预测,然后建立模型预测光伏出力,预测精度较高,但是预测地表太阳辐射强度时间尺度过长,当天气类型变化较快时难以反应待预测日实际天气属性,造成光伏出力预测误差放大。文献[8~9]根据影响光伏出力的气象因素建立了BP 神经网络预测模型,获得了较高预测精度,但是对于一天内天气变快剧烈时的预测精度还有待提高。
本文通过分析光伏出力与对应气象信息之间的内部联系,提出一种基于天气类型聚类和LSSVM 的光伏出力直接预测模型,无需建立复杂的太阳辐射强度预测模型,具有更高预测速度和准确性。
光伏发电系统输出功率受到内部和外部众多因素的综合影响[10]。正常运行的光伏系统,内部电路组成已确定,几乎所有的并网逆变器都工作在最大功率点跟踪(Maximum Power Point Tracking,MPPT)模式,且安装位置、光伏面板倾角等这些因素都隐含在光伏系统历史出力数据中,因此只需考虑影响光伏出力的外部气象因素。本文以保定地区某光伏实验电站中总容量为10 kW的薄膜太阳能电池方阵为研究对象,以其历史出力数据和历史气象信息为参考,分析影响光伏出力的外部因素。
图1 显示出光伏系统出力与太阳辐射强度总量(包括直辐射、反辐射和散辐射)关系曲线高度相似,光伏系统历史出力数据中隐含了一天各时刻的光照强度信息。
图1 光伏系统出力与太阳辐射强度的关系
图2 显示出,不同日类型时光伏系统输出功率相差很大,这主要源于不同日类型时,光伏面板所获得太阳辐射强度总量的明显差异。图3 为不同季节晴天时的光伏出力。
图2 不同日类型时的光伏系统出力曲线
图3 不同季节晴天时光伏系统出力曲线
分析图3 可知,晴天时光伏系统输出功率除了具有明显的上升-保持-下降的基本规律,还有季节性差异,其中夏季和冬季出力差别最为明显,春季和秋季出力差别较小,这主要源于太阳辐射强度的季节性差异。对比图2 可知,季节类型对光伏系统出力的影响要小于日类型的影响。为了提高模型预测精度,本文将光伏系统历史记录数据按季节类型和晴、多云、阴、小雨(雪)4 种日类型聚类。
光伏出力与大气温度的关系如图4 所示,当温度增加时,光伏系统出力也随之增加,二者接近呈正相关,这是因为光伏电池工作环境温度影响其光电转换效率。
图4 光伏系统出力与温度的关系
除上文已讨论的因素外,还需考虑相对湿度对光伏系统出力的影响。如图5 所示,当相对湿度较大时,空气中的水汽对太阳辐射强度的吸收及折、反射增强,落在光伏面板上的光照强度减弱,因而光伏系统出力就会减少;反之,光伏系统出力会出现相应增加,二者呈负相关关系。
图5 光伏出力与相对湿度的关系
支持向量机(SVM)是基于结构风险最小化(Structural Risk Minimization,SRM)原则得到实际最小风险,泛化能力强,存在全局唯一解,能以其特有的优势解决小样本、非线性、高维数以及局 部 极 小 等 实 际 问 题[11~13]。LS-SVM 在 继 承SVM 优点基础上对其作了改进,采用平方项优化指标,以等式约束条件替代原来的不等式约束条件,可加快求解速度[14]。由于核函数的引入,可用原低维空间的核函数运算代替高维特征空间的点积运算,巧妙避免了高维特征空间中“维数灾难”[15]等问题,使得LS-SVM 算法能更好地解决非线性问题。
本文选用式(1)所示的RBF 核函数:
式中:x 是输入向量;xi是第i 个核函数中心;σ是核宽度参数,控制着核函数距中心点的宽度。
惩罚参数和核宽度参数对LS-SVM 算法实现起着至关重要的作用,本文采用粒子群优化算法(Particle Swarm Optimization,PSO)对两参数进行优化选择。
图6 为光伏系统出力预测模型总体框架。
图6 光伏系统出力预测模型框架
首先把光伏监控系统数据库中记录的历史出力数据和对应气象信息按季节类型聚类,再按日类型聚类,得到每个季节晴、多云、阴和小雨(雪)4 种日类型的聚类子样本,然后从中筛选出多条数据记录作为最佳聚类样本集合,选择并训练样本,形成预测模型,综合各个模型,便得到全年光伏系统出力预测模型。实际预测时,先根据待预测日期确定季节类型,然后由待预测日气象特征找到对应的预测子模型,选择最佳训练集,对光伏出力进行预测。
根据第1 节的分析可知,日类型相同时,光伏出力具有高度相似性,出力大小差异主要由各自气象因素所引起。因此,把历史数据按天气类型聚类,筛选出与待预测日气象特征高度相似的数据集合,能够有效提高模型预测精度。
本文首先由待预测日期找到季节聚类样本,再根据详细气象特征选出与其高度相似的样本集。选取每日气象特征向量:
式中:Ti为第i 日光照时间(h);Thi,Tli,Tai分别为第i 日大气温度最高、最低、平均值(℃);t1i,t2i分别为第i 日最高、最低气温出现的时刻;Hhi,Hli,Hai分别为第i 日相对湿度的最高、最低、平均值;t3i,t4i分别为第i 日最高、最低相对湿度出现的时刻。
记待预测日气象特征向量为X=[x(1),…,x(n)],第i 日气象特征向量为Xi=[xi(1),…,xi(n)],其中n 为特征向量中元素个数。由于各气象因素在聚类时对光伏出力影响程度不同,本文对每种因素根据其重要程度赋予一个权重系数,用加权欧氏距离法来选择聚类样本,第i 日的加权欧氏距离如式(2)所示,将计算结果{di}按从小至大顺序排列,并称最小值对应日期为“最佳聚类日”。
式中:n 为影响因素数量;λj为采用Pearson 相关系数法[16](式(3)所示)计算出的各影响因素与光伏出力之间的相关系数;xij为第i 日的第j 个气象因素;xj为待预测日的第j 个气象因素。
式中:RXY为向量X 与Y 之间的相关系数,|RXY|越接近1表明两变量相关程度越高,关系越密切。
历史数据聚类结果决定了训练样本的选取,从聚类集合中选出前k(1 <k≤n,可根据实际需要指定大小)条数据记录作为训练样本,用这些与待预测日高相似度的样本对模型进行训练,然后用训练好的LS-SVM 模型预测光伏出力,可有效提高模型预测精度。
由于光伏系统出力的随机性、间歇性等特点,光伏数据本质上是一组随机序列。对原始数据进行预处理,去除其中奇异数据、修补缺失数据,并按式(4)进行归一化处理,将各量的值限制在(0,1)区间内,可提高模型训练、收敛速度。
式中:xi为原始输入数据;i 为{xi}中的数据序号;xmin,xmax为 {xi}中的最小值和最大值;为xi的归一化值。
预测模型以1 h 为间隔预测第2 日7:00~18:00 的光伏出力值,模型结构如图7 所示。
图7 预测模型结构图
输入变量共有15 个,如表1 所示。为了减少光伏出力的过大波动性对预测结果的影响,取采样点时刻前后15 min 的出力平均值作为该时刻的出力值,模型输出为待预测日对应整点时刻的光伏出力。
表1 预测模型输入变量
本文编写Matlab 程序实现了LS-SVM 算法迭代过程,以1 h 为步长,预测第2 日7:00~18:00 时段的光伏出力。以保定地区某光伏实验电站10 kW 薄膜太阳能电池方阵为研究对象,对其2012 年实际出力数据和对应历史气象信息从7:00~18:00 每1 h 采样一次,按照2.2 节~2.4 节所述方法进行聚类、预处理,并从中筛选训练和测试数据。以春季聚类子样本为例,分别采用晴、多云、阴、小雨4 组数据对模型进行训练和预测,此为模型Ⅰ。为了便于直观对比分析,采用文献[8]中提出的仅加入气象信息而未作聚类识别的方法作为模型Ⅱ。两种模型预测结果如图8 所示。
图8 预测结果
由图可知,当日类型为晴天时,两种模型均具有较高预测精度,预测出力值都能较好地跟随实测出力曲线,个别时刻预测值等于实测值。当日类型为多云、阴和小雨时,两模型预测精度较晴天时均有所降低,模型Ⅰ基本能反应待预测日的实际光伏出力,但个别时刻如阴天时的12:00,14:00,小雨天气时的14:00 等,没能很好地反映出光伏出力的突变现象;模型Ⅱ个别时刻(如多云天气时的11:00,16:00,阴天的6:00~8:00,小雨天气时的10:00,12:00 等)预测值较模型Ⅰ接近实测值,但当光伏出力发生突变时(如阴天时的12:00~14:00,小雨天气时的12:00~15:00),模型Ⅱ较模型Ⅰ则偏离实测值大。
为了定量分析两种模型整体预测能力,采用平均绝对误差(Mean Absolute Percentage Error,MAPE)EMAPE来评估两模型预测结果,如下式所示,分析结果见表2。
式中:Pi为光伏出力实测值;为光伏出力预测值;n 为预测样本序列个数。
表2 预测结果的平均绝对百分比误差 %
由表2 可看出,两种模型对晴天光伏出力均有较强预测能力,而对多云、阴天、小雨天气时的出力预测误差依次增大。模型Ⅱ对每种日类型的预测误差均较模型Ⅰ有一定幅度增大,其中晴天预测误差的差额最小,小雨天气时差额最大,这主要源于模型Ⅱ选取训练和预测样本时未采用天气类型聚类识别方法,使得训练、预测样本与待预测日的天气属性相似度不高。
考虑到较少的样本数据点可能对预测结果造成一定影响,故将样本数据提高一倍,与之前采样做法一致,把每个采样点前后15 min 的出力平均值作为该采样点时刻的出力值,两种模型的预测结果如表3 所示。
表3 步长为0.5 h 时的预测结果 %
由表3 可知,在相同预测时段内,两种模型预测精度均因采样点增加而有一定提高,晴天时预测精度增加较为明显,其中模型Ⅱ晴天时误差减少为原来的45.0318%,在各组预测数据中减少幅度最大。算例证明了本文所提预测模型无论在晴天还是在非晴天条件下的预测精度均高于模型Ⅱ,并且在增加采样点后的预测效果更明显。
本文以光伏系统实际运行数据和对应气象信息为参考,分析了影响光伏出力的气象因素,提出一种把历史数据按天气类型聚类的方法。从最佳聚类集合中选取的训练样本,能更好地反映待预测日的实际天气属性。预测模型直接以气象信息和历史出力数据作为输入,输出为待预测日对应时刻的光伏出力值,避免了复杂的二次建模,有效提高了预测速度。算例结果表明,所提模型是有效和可行的,在相同预测时段内,增加样本数据点可获得更加精确的结果。
[1]陈昌松,段善旭,蔡涛,等.基于模糊识别的光伏发电短期预测系统[J].电工技术学报,2011,26(7):83-89.
[2]栗然,李广敏.基于支持向量机回归的光伏发电出力预测[J].中国电力,2008,41(2):74-78.
[3]戴武昌,孔令国,崔柱.大规模光伏并网发电系统建模与运行分析[J].中国电力,2012,45(2):58-63.
[4]王哲,王飞,刘力卿,等.基于多元回归分析的光伏电站太阳辐射曝辐量模型[J].华北电力大学学报(自然科学版),2011,38(5):53-58.
[5]程泽,韩丽洁,李思宇,等.光伏发电功率的智能预测算法[J].电力建设,2014,35(7):34-39.
[6]Yona A,Senjyu T,Funabashi T.Application of recurrent neural network to short-term-ahead generating power forecasting for photovoltaic system[C].Tampa,FL:IEEE Power Engineering Society General Meeting,2007.1-6.
[7]朱永强,田军.最小二乘支持向量机在光伏功率预测中的应用[J].电网技术,2011,35(7):54-59.
[8]陈昌松,段善旭,殷进军.基于神经网络的光伏阵列发电预测模型的设计[J].电工技术学报,2009,24(9):153-158.
[9]卢静,翟海青,刘纯,等.光伏发电功率预测统计方法研究[J].华东电力,2010,38(4):563-567.
[10]于炳霞,谭志萍,崔方,等.光伏发电功率预测自适应建模方法研究[J].电网与清洁能源,2013,29(1):70-73,81.
[11]傅美平,马红伟,毛建荣.基于相似日和最小二乘支持向量机的光伏发电短期预测[J].电力系统保护与控制,2012,40(16):65-69.
[12]刘耀年,庞松岭,李鉴.基于粗糙集理论和最小二乘支持向量机的中长期负荷预测[J].中国电力,2007,40(10):42-44.
[13]石亚欣.基于时间序列的WD-LS-SVM 的风速周期预测模型研究[J].电力科学与工程,2014,30(2):41-45.
[14]纪国瑞,董泽,韩璞,等.基于最小二乘支持向量机的风力发电机组风速软测量[J].中国电力,2009,42(2):75-78.
[15]杨晓伟,郝志峰.支持向量机的算法设计与分析[M].北京:科学出版社,2013.
[16]代倩,段善旭,蔡涛,等.基于天气类型聚类识别的光伏系统短期无辐照度发电预测模型研究[J].中国电机工程学报,2011,31(34):28-35.