基于天气分型的风光出力互补性分析方法

2021-02-03 07:41:12乔延辉许彦平刘永前马天东

电力系统自动化 2021年2期

乔延辉，韩爽，许彦平，刘永前，马天东，蔡乾

（1. 新能源电力系统国家重点实验室,华北电力大学,北京市102206；2. 华北电力大学新能源学院,北京市102206；3. 新能源与储能运行控制国家重点实验室（中国电力科学研究院有限公司）,北京市100192；4. 国网宁夏电力有限公司,宁夏回族自治区银川市750001）

0 引言

风电和光伏出力具有随机性、波动性和不可控性等固有属性。随着渗透率的提高,显著增加了电网运行的不确定性,并严重影响了电力系统的安全稳定运行和风光接纳能力［1-2］。风光互补发电系统能够利用风能和太阳能在时间和地域上的天然互补优势,有效平抑风电和光伏出力波动,降低其带来的损失［3］。风电和光伏出力受风能、太阳辐射强度以及气温等因素的影响,其随机波动性与天气系统的动态变化密切相关［4-5］。在不同天气状况下,风电和光伏出力特性及其之间的互补关系具有明显的差异性［6-7］,定量评估不同天气类型下风电和光伏出力互补特性,能够为风光互补发电系统协调优化调度提供可靠的理论依据和数据支撑。

国内外相关学者针对天气分型方法进行了相应的研究。李湃等提出了基于主成分分析（principal component analysis,PCA）和层次聚类法的天气分型方法,分析了不同天气类型下风电场群总体出力的波动性和平滑效应［4］。王勃等基于数值天气预报数据,提出了基于PCA 和系统聚类的天气类型划分方法,并构建了不同天气类别下的风电功率预测模型［8］。熊音笛等提出了基于分布领域嵌入（tdistributed stochastic neighbor embedding,t-SNE）非线性降维和改进面板数据聚类的天气类型划分方法,并针对不同天气类型,选取邻近日分别建立基于支持向量机回归的风电功率预测模型［9］。S. Han 等提出了基于t-SNE 非线性降维和改进K-均值算法的典型日划分方法,并分析了不同典型日下风光水多能互补特性［10］。M.M.Gao等根据中国气象局制定的33 种天气类型标准,考虑了4 种广义天气类型,构建了基于天气分类的大型光伏电站日前功率预测模型［11］。F. Li 等利用改进的晴空指数将天气类型划分为4 类,并结合PCA 算法,构建了基于全球辐射测量的散射辐射率估计模型［12］。王飞等针对气象专业天气类型进行归纳合并,得到4 种广义天气类型,进而给出光伏出力分类预测的基本框架［13］。谭津等采用Adaboost 改进的K 近邻（K-nearest neighbor,KNN）方法实现典型天气分类,并定义天气类型衰减系数反映各天气类型下辐照度的变化差异［14］。焦田利等提出了地域分块天气类型指数,按照天气类型指数区间将光伏出力划分为5种广义天气类型［15］。杨锡运等采用模糊C 均值聚类算法对光伏出力数据进行天气类型划分,并将其分为晴天、少云、多云、阴雨等4 种天气类型［16］。

综上所述,国内外相关学者针对天气分型方法进行了相应的研究,并取得了一定的研究成果。但是,现有天气分型方法中常用的PCA 算法无法提取数据样本中的非线性结构特征,t-SNE 降维算法未考虑样本实际分布等不足,且缺少天气分型在风光互补发电系统协调优化调度中的应用研究。

针对上述问题,本文提出了基于核主成分分析（kernel principal component analysis,KPCA）和自组织特征映射（self-organizing feature map,SOFM）神经网络的天气分型及风光出力互补性分析方法。首先,基于数值天气预报数据,构建气象因素矩阵；利用KPCA 降维算法进行特征向量提取,并采用核主元贡献率法确定最佳核参数和最优核函数；以特征向量为输入条件,构建基于SOFM 神经网络的天气类型划分模型；然后,基于风电机组功率曲线和光伏出力计算模型,计算不同天气类型下风电出力和光伏出力；接着,利用波动互补率和爬坡互补率评估指标,从波动性和爬坡性2 个角度定量分析不同天气类型下风光出力互补程度,并利用粒子群算法确定不同天气类型下风光最佳并网容量比例；最后通过实际算例分析验证本文所提方法的有效性。

1 基于KPCA 和SOFM 神经网络的天气分型方法

1.1 KPCA 算法

各数值天气预报数据指标之间存在非线性交叉耦合关系,传统的线性PCA 算法无法提取数据样本的非线性结构特征,导致各主成分贡献率过于分散［17］。而KPCA 是对PCA 的非线性扩展,能够有效地弥补PCA 不能提取数据非线性结构特征的缺陷,可实现数据样本的非线性降维,获得的主成分贡献率更为集中［18］。KPCA 的基本思想［19-20］是：对于输入空间中的矩阵x,通过非线性变换将矩阵x映射到高维特征空间,然后在高维特征空间中采用PCA 降维算法进行特征提取。

式中：λ为CF的特征值；V为CF的特征向量。

将每个样本与式（2）做内积可得：

由式（7）可知,根据矩阵K的特征向量α可以得到CF的特征向量V,进而得到映射空间的主元方向。矩阵K可以通过选择的核函数来确定。

对矩阵K进行对角化,得到对应的特征值分别为λ1≥λ2≥…≥λM,并将对应的特征向量[α1,α2,…,αM]进行标准化,令

式中：IM为每个元素均为1/M的M×M矩阵。

KPCA 通过引入某种非线性映射将输入空间中的非线性问题转化为映射空间中的线性问题,该非线性映射是在输入空间中利用核函数内积运算实现的,常用的核函数主要有高斯径向基核函数和多项式核函数［17］。

高斯径向基核函数：

式中：σ为高斯径向基核函数的宽度参数。

多项式核函数：

式中：s、c、d为多项式核函数参数。

不同的核参数以及核函数会影响对数据样本进行信息特征提取的效果。因此,本文采用核主元贡献率法［21］确定最佳核参数和最优核函数。

1.2 SOFM 神经网络

SOFM 神经网络是一种无监督学习和高维可视化的聚类算法,其通过各神经元之间的自组织能力寻找不同类型数据的固有特征来进行映射分布和类型划分,能够有效解决特征不明显且交叉耦合非线性的类型识别问题［22］。相较于K-均值算法,SOFM 神经网络不需要事先确定聚类数目,且聚类结果实际簇数可能会小于神经元个数,而且网络具有自稳定性、无需外界评价函数、抗噪音能力强等优点。SOFM 神经网络是单层神经网络,仅包含输入层和输出层2 层,输入层各神经元通过权向量将外界信息汇集到输出层的各神经元,输入层的神经元数与样本维数相等；输出层也称为竞争层或计算层,根据各神经元竞争对输入模式的响应结果,实现对输入样本的类别划分,SOFM 神经网络的具体算法流程参见文献［23］。

2 风光出力互补性评价指标

采用波动互补率和爬坡互补率等波动互补性评估指标［10］,从波动性和爬坡性2 个角度定量评估不同天气类型下风电和光伏出力的互补程度。

风光出力波动互补率主要衡量风电和光伏联合出力波动量相较于风电、光伏单独出力波动量的下降率,能够有效消除风电和光伏出力波动对互补性的影响,保持风电和光伏出力时间序列的连续性,可准确表征风光出力实际互补特性,同时用于风光互补发电系统规划与调度［24］。计算公式可表示为：

式中：D1和D2分别为风电和光伏在联合发电系统中所占的比例；γt,1和γt,2分别为t时刻风电和光伏出力波动量标幺值；n为时刻总数；ηCROF为风光出力波动互补率,介于0 和1 之间,ηCROF的值越大,表明风电和光伏出力波动互补性越强。

风光出力爬坡互补率主要衡量一段时间内风电和光伏联合出力平均爬坡率相较于风电和光伏单独出力平均爬坡率的下降率,能够准确表征风电和光伏互补发电降低出力爬坡程度的能力,较波动互补率针对性更强,主要用于风光互补发电系统运行调度,可降低旋转备用容量。计算公式可表示为：

式中：R1和R2分别为一段时间内风电和光伏出力爬坡率标幺值绝对均值；N1和βi,1分别为一段时间内风电出力爬坡事件次数和第i次爬坡事件的爬坡率标幺值,本文定义在1 h 时间窗口内出力最大值和最小值的绝对差大于额定装机容量的20%为1 次爬坡事件；N2和βi,2分别为一段时间内光伏出力爬坡事件次数和第i次爬坡事件的爬坡率标幺值；OR为一段时间内风电和光伏联合出力平均爬坡率；ηCROR为风光出力爬坡互补率,介于0 和1 之间,ηCROR的值越大,表明风电和光伏出力爬坡互补性越强。

3 算例分析

3.1 数据基础

本文采用中国某新能源站的数值天气预报数据进行算例分析,数据长度为1 年,时间分辨率为15 min；采用相关性原则,选取与风电和光伏出力相关性较强的短波辐射、风速、风向、相对湿度、大气温度、地表气压等6 个气象指标,并计算各指标的小时平均值。由于风速波动规律较为复杂,计算风速方差,组成8 760×7 气象因素矩阵；以1 日为1 个数据样本,每个数据样本为168（=24×7）维,共有365 个数据样本,构建365×168 气象因素矩阵,并进行无量纲归一化处理,形成标准气象因素矩阵；基于2 MW 风电机组功率曲线和光伏出力计算模型获取风电和光伏理论出力,数据长度均为1 年,时间分辨率为15 min,分别构建365×96 风电和光伏出力矩阵。

3.2 天气类型划分

为了消除冗余信息和降低天气分型模型的复杂程度,利用KPCA 算法对标准气象数据矩阵进行特征向量提取。采用核主元贡献率法确定最佳核参数,即以第一核主成分贡献率为判据分别确定高斯径向基核函数和多项式核函数的最佳参数,使得在特征向量维数较少的情况下包含尽可能多的信息。附录A 图A1 为高斯径向基核函数参数优选图,从图中可以看出基于高斯径向基核函数的前一主成分随着宽度参数的增加逐渐增大。当σ＞100 时,基于高斯径向基核函数的前一主成分贡献率增量很小,稳定在32.78%左右,故选取σ=100 作为高斯径向基核函数最优核参数,并采用同样的方法确定多项式核函数最佳核参数组合（s=1,c=0,d=6）。

不同特征提取方法的前4 个主成分的累计贡献率,如表1 所示。由表1 可知,基于多项式核函数的KPCA 算法提取的前一主成分贡献率为86.48%,涵盖原始数据86.48%的信息；而基于PCA 算法和高斯径向基核函数的KPCA 算法提取的前一主成分贡献率差别不大,分别为33.17%和32.78%,涵盖原始数据信息较少。为了从数据样本中提取足够多的信息特征且降低数据样本维数,本文采用基于多项式核函数的KPCA 算法进行气象因素特征提取。

表1 不同特征提取方法的前4 个主成分累计贡献率Table 1 Cumulative contribution rate of the first four principal components with different feature extraction methods

以基于多项式核函数的KPCA 算法提取的前4 个主成分作为输入特征向量,构建基于SOFM 神经网络的天气类型划分模型,前4 个主成分累计贡献率为91.05%,已涵盖原始数据足够多的信息特征。为了兼顾聚类效果和训练速度,本文首先采用5×5 的六边形拓扑结构进行模型训练,各神经元的输入样本获胜次数,如附录A 图A2 所示。SOFM神经网络共有25 个神经元,实际聚类数目为17,聚类结果实际簇数小于神经元个数。但是,其中5 个类别所包含的数据样本个数小于3,说明过细的分类产生更多类别的天气类型,从而失去实际意义,需要将少数类样本与多数类样本合并。

由于SOFM 聚类算法无法显示聚类中心位置,因此通过计算不同类别内各样本与所有样本的欧氏距离,以欧氏距离之和最小的样本序列作为该类别的聚类中心,并分别计算少数类样本与各多数类聚类中心的欧氏距离,将少数类样本合并到欧氏距离最小的多数类中,合并后的不同天气类型样本数量及聚类中心日期如附录A 表A1 所示,并采用时间对标法获取不同天气类型下聚类中心对应的风电和光伏出力,如图1 所示,图中每个时段时长为15 min。

图1 不同天气类型下风电和光伏出力Fig.1 Power output of wind and photovoltaic under different weather types

如附录A 表A1 和图1 所示,共划分为12 种天气类型。受不同天气条件的影响程度不同,不同天气类型下风电和光伏出力的波动规律具有不同程度的差异性,但同时呈现一定的相似性。光伏出力受天气条件的影响程度大于风电出力。光伏出力主要划分为晴天（第1 种、第2 种、第3 种）占12.60%,光伏出力曲线较为圆滑,呈现单峰变化趋势,出力峰值较大；阴雨天气（第4 种、第8 种、第9 种、第12 种）占73.69%,光伏出力随机性大,波动性强,远低于理论出力；多云或突变天气（第5种、第6种、第7种、第10种、第11 种）占13.71%,光伏出力短时波动频繁且幅值较大,该地区阴雨天气所占比例较大,多出现在夏秋2 季。风电出力的波动规律性不如光伏出力明显,主要分为低出力小波动（第3 种、第4 种、第8 种、第9种、第11 种、第12 种）；低出力中波动（第2 种、第5种、第7 种）；低出力大波动（第6 种）；高出力波动（第1 种、第10 种）。低出力波动的出力标幺值最大峰值在（0,0.5］范围内,低出力小波动没有明显的持续性波峰,低出力中波动有1 个持续性波峰,低出力大波动有多个持续性波峰；高出力波动的出力标幺值最大峰值在（0.5,1］范围内,该地区低出力小波动所占比例较大,风资源较差且较为平稳。

3.3 风光出力互补性分析

利用波动互补率和爬坡互补率等互补性评估指标,从波动性和爬坡性2 个角度定量评估不同天气类型下风光出力的互补程度,如图2 和图3 所示。

由图2 和图3 可知,在不同天气类型下风光出力波动互补率和爬坡互补率存在不同程度的差异,波动互补率的差异度大于爬坡互补率；从波动性角度分析,风电和光伏联合出力能够在一定程度上降低出力波动性,第3 种和第5 种天气类型下风光出力波动互补率较差,均低于6%,约占总样本数据的9.86%；第12 种天气类型下波动互补率最高,超过19%,约占总样本数据的47.66%,表明该地区风光资源的互补性很强。从爬坡性角度分析,除第1 种天气类型外,其余各天气类型爬坡互补率均保持在17%以上,表明风电和光伏联合出力能够显著降低出力爬坡率,减少功率爬坡事件的发生概率。

在风光互补发电系统运行阶段,可通过调整风光并网容量比例来提高互补能力,降低联合出力波动性,提高风光互补发电系统容量可信度。为了科学指导风光互补发电系统协调优化调度,分别以波动互补率和爬坡互补率为优化目标,利用粒子群算法确定不同天气类型下风光最佳并网容量比例,如附录A 表A2 所示。不同天气类型下风光出力最佳波动互补率和最佳爬坡互补率具有明显差异性,最佳波动互补率的差异度大于最佳爬坡互补率；第12种天气类型的最佳波动互补率最大,对应最佳并网容量比例为63∶37；第3 种天气类型的最佳爬坡互补率最大,对应最佳并网容量比例为41∶59。

图2 不同天气类型下风光出力波动互补率Fig.2 Complementary ratio of power output fluctuation between wind and photovoltaic under different weather patterns

图3 不同天气类型下风光出力爬坡互补率Fig.3 Complementary ratio of power output ramp between wind and photovoltaic under different weather patterns

4 结语

本文提出了基于KPCA 和SOFM 神经网络的天气分型及风光出力互补性分析方法。首先,基于数值天气预报数据,构建基于KPCA 和SOFM 神经网络的天气类型划分模型；然后,利用波动互补率和爬坡互补率评估指标,从波动性和爬坡性2 个角度定量分析不同天气类型下风光出力互补程度,确定不同天气类型下风光最佳并网容量比例。所得结论如下。

1）基于KPCA 和SOFM 神经网络的天气类型划分模型,能够有效提取数据样本非线性信息特征,通过自组织能力寻找不同类型数据的固有特征,从而实现不同天气类型的自动划分。

2）不同天气类型下风光出力互补程度及最佳并网容量比例差异明显,最佳波动互补率的差异度大于最佳爬坡互补率；可通过不同天气类型和优化目标确定风光最佳并网容量比例,降低风电和光伏联合出力波动性,提高风光互补发电系统容量可信度。

附录见本刊网络版（http：//www.aeps-info.com/aeps/ch/index.aspx），扫英文摘要后二维码可以阅读网络全文。