市场环境下考虑多因素影响的母线负荷预测方法

2019-08-30 01:18蔡秋娜张乔榆刘思捷闫斌杰赵燃易江文贺哲
广东电力 2019年8期
关键词:电价时段类别

蔡秋娜,张乔榆,刘思捷,闫斌杰,赵燃,易江文,贺哲

(1.广东电网有限责任公司电力调度控制中心,广东 广州 510600;2.北京清能互联科技有限公司,北京 100080)

母线负荷预测是提高电网调度水平的重要环节,也是现货市场环境下节点电价定价的关键依据,因此对市场环境下的母线负荷预测进行研究尤为必要[1-2]。大量的研究表明,母线负荷预测虽然具有负荷预测的共性特征,但与系统负荷预测相比,却具有鲜明的个性特征,如量大面广、负荷基数较小及易受气象因素变化影响等[3-5]。

针对母线负荷预测的预测精度方面,学术界开展了大量研究。文献[6]基于预测有效度构建了马尔科夫-云模型,实现了对母线负荷进行变权重组合预测,但所提模型的泛化能力及与实际区域情况的结合程度较低,难以满足实际应用需求。文献[7]针对母线负荷基数较小、易受区域气象因素影响的特征,提出了基于数值天气预报的母线负荷预测方法,实现了与实际地理气象因素的紧密关联,但所提方法考虑的影响因素仍然较为单一,难以适应当前及未来电力市场环境下母线负荷的预测要求。文献[8]基于新能源出力特征,采用两阶段还原法对母线净负荷进行预测,所得结果虽然具有较强的解析性,但新能源体量相对较小且其出力规律不显著,难以确保相应负荷的预测效果。

综上所述,当前对母线负荷预测的研究主要集中在负荷预测方法及母线负荷组成成分方面,但对于单一、分离的母线负荷进行预测分析,所得结果难以满足准确性、适用性及可解析性的需求;同时,母线负荷变化受到多个方面因素影响,各因素间的协同互动关系也是母线负荷预测需要考虑的部分。值得注意的是,随着全国范围的电力市场开展,用户用电行为受政策指引及市场电价波动影响将会更加显著,实时电价与负荷关系密切,电价的波动会迅速传递到用户端,从而导致敏感用户的负荷变化[9],这也是当前母线负荷预测研究中需要考虑的问题。

针对上述问题,本文提出了一种考虑多因素影响的母线负荷预测方法,以得到贴合未来现货市场运行的母线负荷预测,为调度计划制定和现货市场稳定运行提供有力支撑。

1 市场环境下考虑多因素影响的母线负荷预测方法总体框架

本文所提的考虑多因素影响的母线负荷预测总体框架如图1所示,该方法主要分为4个部分,即:

图1 所提方法的总体框架

a)数据预处理。提出适用于电力市场环境下母线负荷预测的数据需求库;针对数据样本中的空缺、零值等异常情况进行填补和修正,从而保持其在时间序列上的连续性;同时,采用max-min方法对数据样本进行归一化处理,以加强各样本类别间的可比性。

b)考虑气象因素的母线负荷预测。首先,对预处理后的数据应用k-means算法进行聚类分簇,得到各负荷类型的聚类中心,并以此为基准曲线;然后,针对基准曲线采用皮尔逊相关系数进行气象相关性分析,筛选出负荷敏感的气象因素;最后,应用支持向量机(support vector machine, SVM)模型对各类型负荷总和进行预测,从而综合得到母线负荷的初步预测结果。

c)考虑市场因素的母线负荷修正。基于各类负荷的基准曲线,结合总体电价响应特性及时间-电价差响应特性分析其与电价的互动关系,建立电价响应模型对母线负荷的初步预测结果进行实时电价响应修正,以使预测值更加贴近现货市场环境下的实际情况。

d)预测结果综合分析。针对加和还原的母线负荷预测结果,比对实际母线负荷数据,采用平均绝对值百分比误差模型来评价其预测效果[10]。

2 数据预处理

2.1 考虑多因素影响的母线负荷预测数据需求库

首先明确适用于市场环境下母线负荷预测所需的数据库,主要包括了与母线负荷预测相关的多元数据,涵盖了地理和气象、市场价格、用户行为和特性、电网结构信息以及母线历史负荷数据等,具体如图2所示。

图2 考虑多因素影响的母线负荷预测数据需求库

在本文所提的方法中,预测对象为母线上的不同类型负荷,为充分分析其与多元影响因素的相关性,本文选取地理气象类和用户市场类因素信息,其中地理气象数据主要包括各地区最高/最低温度、相对湿度、平均温度和降雨量;用户市场类信息主要有日内各时段电价曲线、用户特征负荷曲线等。

2.2 样本数据预处理

由于测量或传输方面的原因,采集得到的样本数据特别是母线历史负荷数据,常常会出现异常现象,如空缺、零值、连续值和跳跃值等,对此,本文采用拉格朗日插值法进行异常修正[11-13]。

此外,应用SVM模型进行母线负荷预测时,综合负荷和气象等因素构建了一个统一的输入矢量;同时为了处理输入矢量中不同数量级和不同量纲的变量,需要对输入矢量中的各变量数据进行统一化处理,对此,本文采用max-min方法对其进行归一化处理,即

(1)

3 考虑气象因素的母线负荷预测

利用k-means聚类算法把各母线底下的用户负荷划分为不同类别,选取各类别的聚类中心作为基准比对对象;基于天气预报模式的数值天气预报,通过相关性分析得到待预测日各类别负荷的敏感气象因子,并筛选出气象敏感类负荷和常规负荷;针对气象敏感类负荷应用SVM进行回归预测,而对常规负荷则采用时序外推的方法进行预测,从而综合得到母线负荷的初步预测结果。

3.1 k-means聚类算法原理

k-means算法属于无监督学习类算法,其思想可概述为:首先随机选取k个初始聚类中心,每一个聚类中心代表一类数据集簇;然后将数据点划分到最近的数据簇;最后重新计算数据簇中心点,直到聚类准则函数收敛[14]。其中收敛函数

(2)

式中:E为相应样本经聚类划分后所得的平方误差;C={C1,C2,…,Ci,…,Ck}为聚类簇,i=1,2,…,k;ν为相应簇Ci内数据点;ui为簇Ci的均值量,即该簇的聚类中心,如下式所示:

(3)

本文主要应用k-means算法进行用户负荷的类别划分,因此式(2)中的ν对应各用户负荷样本数据。一般来说,式(2)从空间维度上刻画了数据点对聚类中心的紧密程度,E值越小则相应聚类簇内数据样本相似度越高。

3.2 负荷气象因素关联分析

母线负荷的组成成分较为多样,研究表明其受温度及湿度等气象因素影响明显[15],因此可通过引入相关系数来直观表现母线负荷成分与气象影响因素间的相关程度。相关性分析的是负荷和气象因子间的波动相似程度,负荷序列与气象因子序列相关性越高则说明负荷受气象影响越强烈。对此,本文采用皮尔逊相关系数来量化分析负荷与气象因素间的相关性,即

(4)

式中:cov(X,Y)为X与Y序列的协方差;σX、σY为X、Y序列的对应标准差;X对应着各负荷类别的基准曲线值;Y对应着气象因素,主要包括最高/最低温度、相对湿度、平均温度及降雨量等。

3.3 SVM算法原理

SVM是计算机科学中进行数据分析和模式识别的一种监督学习方法,可用于分类和回归分析。标准的SVM属于非概率二元线性分类,假设给定一系列训练样本,每个样本都属于2种类别的其中一类,则SVM训练算法会建立一个将新的输入样本分配到其中一个类别中的模型。SVM模型是样本点在空间上的表象,对其建立映射并且使分类别中的样本能够通过尽可能宽的清晰界面得到区别,新的样本也将映射到相同的空间中,并预测其将落入到分界面的哪一侧。

分开平面内可分的2类样本点有无数种方法,而SVM则致力于寻求最佳的分类方法。对于二维平面中的直线,其表达式为

y=wTx+b.

(5)

式中:x、y分别为输入量和输出量,w为权重向量,b为常数。其中,w和b可用极小化目标函数来估计,其目标函数:

(6)

s.t.yi(wTxi+b)-1≥0,i=1,…,l.

(7)

式中:yi为第i个样本点的输出量;xi为第i个样本点的输入量;l为样本点总数。

目标函数的可行域为凸集,因此它是一个凸二次规划,对此可通过构造广义拉格朗日函数来求解,且求解问题可转化为

(8)

式中:L()为拉格朗日函数;ai为拉格朗日乘子,且ai≥0;a为ai的集合。

SVM算法的应用主要是为了实现对各类别总负荷值的预测,因此上文中的y对应待预测的类别总负荷,x对应根据对应类别负荷的敏感气象因子和负荷信息所构建的综合输入量。

4 考虑市场因素的母线负荷修正

实时电价实行后,用户可根据各时段的电价激励做出响应,从而改善各时段的用电安排,降低用电成本。电力市场环境下,通过经济利益激励和用户配合,可实现电力负荷在时空上的最佳分布,从而使得电力商品的社会价值最优。

4.1 总体电价响应

总体电价弹性用来表示当综合电价发生变化时用户负荷所对应的转移量,其定义为

(9)

总体电价响应中,如果目标日各时段的综合电价高于基准日的综合电价,则会导致目标日的负荷量相对基准日减少,因而总体电价弹性为负,结合式(9)可得总体电价响应模型为

(10)

式中:Δdi,1为目标曲线第i时段的负荷值变化量;εd为目标曲线的总体电价弹性。

4.2 时间-电价差响应

时间-电价差弹性直接面向不同时段,研究各时段间价格差变化时的负荷转移能力,其定义为

(11)

式中:Δdi-j为负荷曲线在时间段i与j的负荷差;wi-j表示电价曲线在时间段i与j的电价差,Δwi-j为基准日与目标日电价曲线在时间段i、j的变化。

在时间-电价差弹性的作用下,对于初始价差为正的2个时间段,如果2个时段的价格差扩大,那么负荷则会从高价时段转移至低价时段,反之亦然。

本文定义转移因子为

(12)

式中:αi-m为负荷曲线在时段i与m的转移因子;αm-i为负荷曲线在时段m与i的转移因子;wi-m,0为基准日电价曲线在时间段i与m的电价差。

因此在时间-电价差弹性激励下,待预测日第i时间段的负荷变化量为

(13)

式(13)中,考虑实际因素的限制,时段m电量的变化量不可能全部转移到时段i,因此给定负荷的转移系数为δ。

综合以上2种价格弹性的响应,可得在2种电价弹性共同激励下待预测日时段i的修正负荷为

(14)

5 算例分析

5.1 预测前准备

以广东东莞某母线下监测所得的用户负荷作为预测对象,进行预测时考虑的相关因素包括地区气象和节点电价等。首先针对采集得到的原始数据进行异常修补,主要包括空值、零值等,进而获得清洗后数据,再结合式(1)对各用户负荷近2个月平均负荷数据作归一化处理。利用k-means聚类算法划分得到3类典型负荷簇,选取聚类中心曲线作为基准曲线进行气象敏感和电价互动分析,用户负荷分类情况如图3所示。

从图3中可以看出,不同类别之间的负荷特征明显。其中,类别1负荷呈现日间峰谷相错的特征,一般峰值在9:00达到,12:00至13:00和18:00至18:30这2个时间段为谷负荷段,9:00至11:00、14:00至17:00和19:00至20:30这3个时段为峰负荷段,其余时段负荷相对较低,该类别负荷特征与工业类负荷特征相近。类

图3 各类别负荷曲线

别2负荷曲线呈现强烈的聚拢特性,负荷高峰在8:00至20:00时段基本持平,21:00之后负荷快速下降,该类别负荷特征与商业用电特征相近。类别3负荷曲线则相对较散乱,全天负荷水平不高,呈现较大的波动性,以及负荷规律性不强,其负荷特征与城镇乡村居民负荷特征类似。

根据k-means算法选取各聚类中心曲线作为基准曲线,标征该类负荷的总体特性,并以此为对象进行气象关联分析和考虑电价因素的预测修正,各类负荷归一化基准曲线如图4所示。

5.2 考虑气象关联的负荷预测

针对5.1节聚类所得的各基准曲线,对对应负荷点历史负荷数据及地区气象数据进行气象关联分析,并选取负荷点历史日内最大负荷和日内最高温度、最低温度、平均温度,以及平均湿度和降雨量为相关系分析对象。以4至9月的夏秋时节为例,同时设定气象敏感因素的筛选阈值为0.7[16],各类别负荷和对应的气象敏感因素见表1。

图4 各类别负荷归一化基准曲线

负荷聚类类别气象敏感因素1平均温度、降雨量2最高温度、降雨量、平均湿度3最高温度、平均湿度

结合表1信息,选用SVM作为预测模型,其中,核函数为多项式函数,损失函数为二次函数,同时设定惩罚因子为10,松弛因子为0.01[17]。应用SVM模型进行预测时,以待预测日前2个月的历史数据作为训练样本,以待预测日前3 d的相关数据作为输入矢量,从而得到各类别总负荷值,进而综合得到对应母线的总负荷预测值。

各负荷类型的预测曲线如图5所示,表2也展示了其对应的预测精度。总体上本文所提方法对实际情况的母线负荷预测有较好表现,总负荷的预测精度达到93%。由图5可以看出,各类负荷的预测曲线在非日间用电时段的预测效果较好,与实际曲线比较贴合,但类别1、2负荷在峰谷时段,无论在曲线形态还是在幅值上都存在较大预测偏差。主要原因是由于SVM预测模型是以总体预测误差最小为前提,牺牲了局部的精确度,因此需要结合外部信息进行修正。

表2 预测精度对比表

图5 考虑气象关联因素的预测负荷

5.3 考虑市场因素的母线负荷修正

南方电力现货市场是全国8个试点之一,目前广东现货市场正处于试运行阶段。本文基于广东现货市场试运行下的平均节点电价与现实行的分区峰谷电价,分析未来电力负荷在市场化环境下的响应情况。利用获取的广东试运行阶段东莞地区的日前平均节点电价形成标幺值曲线,再结合峰谷电价最大值还原得到对应的实际电价曲线,2种电价曲线如图6所示。

由图6可以看出,相对于峰-谷-平电价曲线,节点电价曲线在谷负荷时段的电价有较大差别,对峰负荷时段的电价反映较为确切,而且节点电价的

图6 节点电价曲线与实际峰谷电价曲线

平均负荷时段也不明显,因此总体电价水平更能反映实际电能价值。本文选取前14 d平均基准曲线作为负荷修正的参考曲线,同时考虑总电价弹性和时间-电价差弹性的共同激励,对待预测日的负荷值进行修正。修正后所得的预测负荷曲线及电价弹性数据分别如图7和表3所示,其中转移系数δ设定为4%,限于篇幅,此处仅展示了类别1负荷的情况。

图7 类别1负荷实际负荷曲线、初步预测曲线和修正后曲线

数据项目负荷类别1负荷类别2负荷类别3总体电价弹性-0.025-0.013-0.001平均时间-电价差弹性0.0050.0030.002

表3展示了各负荷类别在电价弹性下的响应情况,其中类别1负荷相对于其他2类负荷对电价表现更为敏感,且可调节的空间较大。由图6—7可以看出,节点电价水平相对于峰-平-谷电价水平有明显升高,故在总电价弹性影响下,用户出于节约成本的考虑,整体负荷需求将会下降;同时,由于节点电价曲线在非休息时段的电价水平并未呈现出明显的“峰、平相间”特征,使得原来峰-平-谷电价下的相应负荷在时间-电价差弹性影响下将会发生转移,用电价格较高的时段负荷将转移到用电价格相对低的时段。

图8展示了综合各类负荷修正后的预测曲线和实际母线负荷的对比情况。从图8中可以看出,相较于实际曲线,预测曲线在工作时段的波动性减弱,且期间负荷水平下降,相应减少负荷转移到夜间或凌晨时段,母线总负荷特性与类型1负荷相近。值得注意的是,虽然节点电价下凌晨夜间时段的用电价格有较大上升,但由于该时段的用电价格相对全天电价水平仍然是最低的,因此日间工作时段负荷仍然是向该时段进行转移,使得日间用电高峰特征得到一定削弱。

图8 母线总负荷实际负荷曲线和修正后预测曲线

6 结束语

本文面向电力市场环境提出了一种考虑多因素影响的母线负荷预测方法,所提方法综合考虑地区气象及市场电价因素的影响,结合广东现货市场试运行的电价数据,对在“峰-平-谷”电价下的负荷预测值进行修正,以反映未来现货市场正式运行后的负荷特征及用户用电行为,进而为后续市场环境下调度日前发电安排提供有效的技术支撑。

猜你喜欢
电价时段类别
养阳的黄金时段到了
四个养生黄金时段,你抓住了吗
德国:电价上涨的背后逻辑
探索电价改革
壮字喃字同形字的三种类别及简要分析
可再生能源电价附加的收支平衡分析
争议光伏标杆上网电价
服务类别
多类别复合资源的空间匹配
分时段预约在PICC门诊维护中的应用与探讨