基于双重相似机制的台风期间电力负荷预测方法研究

2022-03-30 12:49马骞周毓敏袁泉周辉
广东电力 2022年3期
关键词:相似性台风气象

马骞,周毓敏,袁泉,周辉

(1.中国南方电网电力调度控制中心,广东 广州 510663;2.北京清软创新科技有限公司,北京 100085)

电力负荷预测是电网公司各部门的重要工作之一。随着人工智能技术的发展,短期负荷预测算法不断优化[1-8],而针对沿海地区,台风所造成的气象变化,会随着台风的强度、登陆的时间和地点不同都会有所不同,这其中的复杂性和随机性使得一些对于正常日有良好精度的预测方法也难以得到较为满意的预测结果[9],并在此期间对电网的安全稳定性、电力调度控制性等均产生较大影响。为了进一步优化目前的台风期间电力负荷预测过程,充分发挥人工智能预测算法在预测方面的优势,提升预测精度,本文对台风期间的电力负荷预测进行研究与论述。

对于台风期间的负荷预测:文献[10]研究了基于气象信息粒还原的分时段预测方法;文献[11]将台风期间负荷拆分至台风负荷与基准负荷进行分别分析与预测;文献[12-17]采用基于历史相似日的方法进行特殊日期间的负荷预测。上述文献通常将待预测特殊日当作单独的主体进行研究,未考虑到特殊日前后日期的相关影响,而由于气象条件与电力负荷需求的连续性,台风的影响往往体现在一个周期内,并非单独的某天。

在此背景下,本文提出一种基于双重相似机制的台风期间负荷预测方法,将台风按照其对负荷产生的影响程度进行分类,针对各类台风均提出不同的预测思路;主要研究兼顾台风周期内的相似性以及台风登陆日的相似性的双重相似机制,并以广东省为例[18],采用考虑气象因素的正常日预测方法与本文研究的基于双重相似机制的预测方法分别进行台风期间负荷预测,验证本文研究方法的有效性。

1 台风天气负荷预测方法

考虑对于台风天气下的负荷预测,首先将台风天气进行分类,从其对负荷的影响程度入手,可以分为:无特殊影响台风、影响性台风、破坏性台风。无特殊影响台风主要是指由于台风的到来引起了各项气象指标的变化,而负荷的变化跟随温度、降雨等气象指标的变化而变化,即通过日常训练的气象与负荷之间的关联模型可以得到较为准确的预测值;影响性台风是指由台风引起的气象指标变化幅度较大或较为剧烈,超出日常训练模型的预估,在这种情况下则需要寻找历史数据中的相似情况,参考其进行预测;破坏性台风是指由于台风天气而造成物理破坏,如对电力设备与线路的损坏、公共财产与安全的影响等,在这种情况下,依靠数学模型是无法预估负荷的变化情况,需要在一定计算的基础上,辅以专家经验进行判断。

1.1 无特殊影响台风

一般情况下,台风影响负荷的主要因素就是气象,台风前天气闷热,温度上升,负荷水平上升;台风中大风强降雨导致温度下降,负荷急剧下降;台风后温度回升,用电负荷恢复。因此,判断台风是否属于无特殊影响台风,需要从台风前后及台风期间气温与负荷之间的关系是否产生明显变化来看。本文利用台风前一段时间气温与负荷之间的关系进行模型训练,通过该模型,评估临近台风以及台风中时间的气温与负荷之间是否满足该模型确定的关系。由于每个模型都存在一定的误差率,设置5%的置信区间,如果气温与负荷对应关系在该区间内,则认为其满足该模型。

如图1所示,圆形散点表示台风“鹦鹉”到来之前2周左右广东省日最大负荷与日平均温度之间的关系,三角形散点表示台风“鹦鹉”登陆期间的日最大负荷与平均温度之间的关系。

图1 台风“鹦鹉”前、中气温与负荷关系Fig.1 Relationships between air temperature and load before and during typhoon Nuri

由图1可以看到,本次台风期间,日负荷与气象之间的关系变化不明显,与台风到来前负荷-气象模型基本匹配,故认为该台风为无特殊影响台风,预测时不采取特殊策略,利用近期气象与负荷训练得到的模型进行预测即可。

1.2 影响性台风

影响性台风是指台风期间,负荷与气象指标之间的关系发生较大变化,与台风前一段时间内二者间关系差异较大,无法直接用数学模型进行预测。台风“海高斯”前、中气温与负荷关系如图2所示。

图2 台风“海高斯”前、中气温与负荷关系Fig.2 Relationships between air temperature and load before and during typhoon Higos

由图2可以看到,本次台风期间,登陆前1日以及登陆当天,台风导致的温度变化波动较强,直接造成负荷与气象之间的对应关系发生明显变化,偏离了近段时间二者之间已形成的关系。

在图2情况下,仅依靠历史气象与负荷数据训练的模型难以得到较准确的预测结果,对此本文研究了一种双重相似机制,即在历史数据中寻找一段周期内气象变化趋势相似、日特征相似的日期作为参考相似日,从而应用在未来台风条件下的预测中。

1.2.1 相似周期

研究发现,台风带来的影响往往是一个周期,台风前气温升高天气闷热,台风中出现强降雨和大风,台风后温度回升,均导致负荷产生相应的波动[19]。基于此特点,本文以台风登陆日为中心,结合登陆前2日与后2日形成一个5日的周期,作为待预测周期。

日常生活中,除了影响性台风外,由于气温的突变、异常的波动、突然的降雨等情况,也有可能发生与影响性台风期间相类似的负荷变化,这种情况称之为“类台风天气”。由于台风天气样本量较小,在预测时难以找到合适的相似参考情况,而考虑“类台风天气”的变化则是扩大样本的有效途径之一。根据上文分析,台风影响周期长短不一,结合气象预报时长,本文以5日为一个周期,遍历历史数据,寻找气象变化相似的周期,即为“类台风天气”。

考虑到日前负荷预测主要是根据历史数据中挖掘得到的规律建立模型,并依据未来的气象预报,得到未来的负荷预测值,因此,在进行台风相似周期的选择时,主要依据气象指标的相似度进行计算。本文采用欧氏距离进行相似度的衡量,由于欧氏距离计算前提是各维度指标具有相同的刻度级别,因此在相似度计算之前,首先进行数据的标准化处理,消除不同日期下气象指标的量级差异。

1.2.2 相似日特征

双重相似机制的第2个选取相似的步骤,是以相似周期内第3日,即台风登陆日为目标,同时考虑气象指标的相似、日期距离的远近、星期类型的差异、季节类型的差异以及台风强度等,计算与其相似的日期相似程度。

a)气象相似。台风期间的负荷预测中,气象指标带来的影响最为突出,因此,气象指标的相似是相似日判断的必要条件。

b)日期距离。电力需求会根据居民的生活习惯、产业结构的调整等发生改变,因此负荷的变化往往具有连续性,时间越接近,负荷特性越相似。相似日与待预测日的日期距离同样是相似日判断的重要条件。

c)星期类型。负荷的变化具有周维度特性,这主要是因为工作日与周末的生产活动、生活特性差异较大,因此在相似日选择时应考虑星期类型的相似程度。

d)季节类型。负荷的变化同时具有季节特性,主要是由于在不同的季节用电特性具有差异性,如夏季高温导致降温负荷增加,冬季低温导致采暖负荷增加;因此在相似日选择时还应考虑季节类型的相似程度。

e)台风强度。由于台风天气具有独特的负荷变化规律与特点,台风之间的相似程度更佳,因此将台风属性也作为相似程度评估的条件之一。

综合来看,相似日特征的选择主要以日特征向量的形式评估,每项评估指标分别计算其关联度,最终所有指标关联度相乘得到整体日特征的相似度。

在影响性台风的负荷预测中,首先进行第1步相似周期的计算,按照相似程度从大到小排列,并依次对这些周期内第3日与待预测的台风登陆日进行相似日的计算,得到相似周期、相似日的双重相似结果,将其输入模型中进行训练,使预测模型可以重点学习相似度较高周期与日期的负荷-气象变化规律。

1.3 破坏性台风

破坏性台风是指台风带来了破坏性的影响,对生命及财产安全产生危害。比如2018年的台风“山竹”,造成广东、广西、海南、湖南、贵州5省(区)近300万人受灾[20],5人死亡,1人失踪,160.1万人紧急避险转移和安置,1 200余间房屋倒塌,农作物受灾面积174.4千公顷,直接经济损失52亿元。由于其造成的严重影响,第51届台风委员会年度会议上,决定将“山竹”除名。台风“山竹”前、中气温与负荷关系如图3所示。

图3 台风“山竹”前、中气温与负荷关系Fig.3 Relationships between air temperature and load before and during typhoon Mangkhut

台风“山竹”2018年9月15日登陆期间,广东省负荷大幅度下降,这一变化较为罕见且无法利用数学模型进行分析及预判。对于这类破坏性台风,采用专家经验判断的方法进行预测。首先,对于历史上出现的破坏性台风进行标签设置,由于该类台风数量较少,结合专家经验判断与历史数据参考,是预测该类台风期间负荷变化趋势的有效方法。

2 基于双重相似机制的台风期间负荷预测流程

基于双重相似机制的台风期间负荷预测流程如图4所示,图中:i为周期内第1日与待预测周期第1日之间的天数差;di为每个历史周期与待预测周期之间的气象相似程度;N为历史数据长度;Aopt为对比周期内预测负荷值与实际负荷值平均偏差和最小偏差二者之间的最小值。下文将对各步骤分别进行介绍。

2.1 气象指标相关性评估

一般可以获取的气象指标包括温度、湿度、风速、降雨量,通过这些指标还可以计算得到人体舒适度、温湿指数等复合气象指标。采用皮尔逊相关系数rpq[21]对各个气象指标与负荷之间的相关程度进行评估,计算公式为

(1)

式中:p、q为时间序列向量;cov(p,q)为向量p

与q的协方差;σp、σq分别为向量p与q的标准差。

相关系数是描述2个变量p与q之间相关程度的定量指标,相关系数rpq无量纲,其值在[-1,1]范围内。当rpq=0,p与q不相关;当rpq>0,p与q正相关;当rpq<0,p与q负相关。

2.2 主导气象指标选择

依据计算得到的各个气象指标与地区负荷的相关性,选择相关程度最高的一个或多个指标作为主导气象因素,将其未来各个时刻点的预报数据作为重要的参数输入预测模型进行训练。

2.3 获取未来天气预报信息

对于短期的负荷预测,接入实时传输的天气预报信息至关重要。基于本文所描述的台风期间负荷预测方法,至少需要获取未来5日的气象预报信息。

2.4 气象数据标准化处理

不同日期、不同季节、不同年份的气象数据存在着量级有所差异的特点,在相似周期的选择步骤中,着重关注气象变化趋势的相似性,因此在进行相似性计算之前,对气象数据进行标准化处理。本文采用z-score标准化处理方式,通过变换,将多组数据转化为无单位的z-score分值,使得数据标准统一化,提高数据可比性。计算公式为

图4 基于双重相似机制的台风期间负荷预测流程Fig.4 Load forecasting flow chart during typhoon based on double similarity mechanism

(2)

式中:θ为观测值,指各指标数据的原始值;μ为总体数据的均值;σ为总体数据的标准差;z为经过z-score标准化后的数据。

2.5 第一重相似机制:周期相似性计算

对于以5日为一个周期的相似性计算,本文采用欧氏距离进行判断,距离值越小,则发展变化趋势越相似。

待预测周期日气象指标向量

Y=(y1,y2,y3,y4,y5).

(3)

式中:下标1—5表示周期内第1—5日;y1至y5为待预测周期第1—5日以15 min为间隔的日气象指标时间序列。

历史周期日气象指标向量

Xi=(x1i,x2i,x3i,x4i,x5i).

(4)

式中:i为周期内第1日与待预测周期第1日之间的天数差,i=5…N;x1i至x5i为历史周期第1—5日以15 min为间隔的日气象指标时间序列。

每个历史周期下,与待预测周期之间的气象相似程度

(5)

2.6 待预测台风属性判断

无特殊影响台风、影响性台风与破坏性台风可以通过其登陆期间气象指标与负荷的关系与台风前一段时间的差异性进行区分:差异性较小,即为无特殊影响台风;差异性适中,为影响性台风;差异性较大,为破坏性台风。

根据上一步相似周期的计算结果,可以对台风属性进行判断。具体如下:

a)选择与待预测周期Y相似性最高的历史周期记为Xopt。

b)以周期Xopt前2周工作日气象指标与负荷数据为基础,建立二者之间的相关模型记为Mopt。

(6)

如果Aopt≤5%,表示周期Xopt内负荷与气象之间的关系与该周期前2周内二者间关系接近,则认为Xopt对应天气为无特殊影响天气,可近似认为待预测周期Y对应台风为无特殊影响台风;如果5%10%,则认为待预测周期Y对应台风为破坏性台风。

2.7 依据属性选择预测方法

结合对上一步骤中待预测周期的台风属性判断,选择对应的预测方法:

a)如待预测周期Y对应台风为无特殊影响台风,则采用正常日预测模型直接预测;

b)如待预测周期Y对应台风为影响性台风,则进入第二重相似性的判断;

c)如待预测周期Y对应台风为破坏性台风,同样进入第二重相似性的判断,并重点采用专家经验预测的方式进行修正。

2.8 日特征向量构建

在第一重相似周期的计算中,保留相似程度前50%的历史周期,并提取这些历史周期内的第3日,对应待预测周期中的台风登陆日,构建此日特征向量。

日特征向量的构建旨在从气象指标、日期距离、星期类型、季节类型、台风强度等角度全方位评估历史日与待预测日的相似程度。气象指标、日期距离、台风强度等通过相似周期对应日与待预测周期中对应日的数值相似度进行判断,而星期类型与季节类型则依据广东省实际的用电规律性进行相应设定。

为了较准确探究广东地区星期类型用电特征,选择气象影响较弱的一段时间,观察每日最大负荷变化规律如图5所示。

图5 广东电网2020-10-15—11-15日最大负荷变化情况Fig.5 Daily maximum load variations of Guangdong power grid from October 15 to November 15 in 2020

由图5可以看到,广东电网存在较明显的周末效应。周一至周五用电需求旺盛且相对平稳,周六负荷较周中略有下降,而周日则出现较大幅度下降。因此对于星期类型的取值将对周六、周日与正常工作日做出区分。在此情况下,周一与周五作为衔接工作日与休息日的过渡日期,同样需要与周中正常工作日做出区分。

广东2018—2020年各月最大负荷变化情况如图6所示。

图6 广东省2018—2020年月最大负荷Fig.6 Monthly maximum load of Guangdong province from 2018 to 2020

由图6可以看到,广东整体呈现明显的夏季用电突出特性,从负荷水平结合气候情况来看,每年12月—次年1月负荷水平接近,2月—3月处于季节更迭期、4月—5月处于温度上升期且与10月—11月负荷水平与气温水平均接近、6月—9月则是主要的夏季期间,负荷水平受高温影响处于全年最高峰。根据上述特点,对季节类型的取值做出相应的区分。

综上所述,构建日特征向量:

Vj=(VWeatherj,VDayj,VWeekj,VSeasonj,VTyphoonj).

(7)

式中:j为距离待预测的台风登陆日的距离,j=5,…,N;VWeatherj取值为选定主导气象指标的实际值;VDayj取值为j;VWeekj取值为1、2、3、5、7,基于广东地区生产规律特点,设定周一取值为1,周二至周四取值为2,周五取值为3,周六取值为5,周日取值为7;VSeasonj取值为1、3、5、9,依据广东地区气象与负荷之间的关系,分别代表12月—次年1月、2月—3月,4月—5月、10月—11月、6月—9月;VTyphoonj取值为6~16,分别代表台风中心附近最大风力等级,如非台风日,则取值为1。

待预测周期y的台风登陆日特征向量表示为:

Vy=(VWeathery,VDayy,VWeeky,VSeasony,VTyphoony).

(8)

2.9 第二重相似机制:日特征相似性评估

日特征向量的相似性评估,由各特征值相似度综合评估得到。对日维度各特征设置评估系数,旨在评估历史日与待预测日之间该特征的相似程度,各特征评估系数相乘得到该日与待预测日的总体相似度。

a)气象指标评估系数。基于主导气象指标选择步骤中选定的主导气象指标,计算气象评估系数

(9)

b)日期距离评估系数[14-15]。历史日相对于待预测日之间的距离是评估相似度的特征之一,采用“近大远小”的原则,日期距离评估系数

(10)

式中:mod表示取余函数,mod(j,N1)即j/N1所得余数;int表示取整函数,int(j/N)即j/N2所得整数;Sj为1,0变量,表示历史日与待预测日是否为同一节假日;α1、α2与α3为常数,分别表示历史日与待预测日距离每增加1日、1周和1年的缩减比例,在此分别取值0.9、0.95、0.98;N1、N2与N3为常数,分别取值为7、7、365(闰年为366)。

c)星期类型评估系数

(11)

d)季节类型评估系数

(12)

e)台风强度评估系数

(13)

f)日特征综合相似度。日特征综合相似度由各特征指标评估系数相乘得到:

βj=βweatherjβdayjβweekjβseasonjβtyphoonj.

(14)

2.10 基于双重相似结果的负荷预测

第一重相似性计算后,得到相似度前50%的历史周期作为下一步计算的数据基础;第二重相似性计算后,得到每个历史周期内与台风登陆日对应日期与待预测台风登陆日的日特征综合相似程度,将日特征综合相似度作为可信度指标,输入至人工智能预测模型中,对模型进行训练,最终根据台风期间气象预报信息,得到负荷预测结果。

本次研究采用长短期记忆(long short-term memory,LSTM)算法进行预测,该算法可以选择过去任意时刻输入的信息是否有效,对具有一定周期性时间序列的预测具有很好的适用性。

3 预测算例

台风“海高斯”于2020年8月19日登陆广东省阳江市,以该台风为例,采用正常日预测方法以及基于双重相似机制的台风期间负荷预测方法分别进行预测。以19日为中心,17—21日为待预测周期,进行预测得如下。

3.1 第一重相似计算

通过气象与负荷之间的相关性分析(见表1)可以得到2020年夏季各气象指标的主导性。

表1 气象与负荷相关性计算Tab.1 Meteorological and load correlation calculations

由表1可以看到,在上述气象指标中,平均温度与负荷的相关性最强,因此在后续的相似性判断时选用平均温度指标,在预测模型中采用温度的逐时预报值作为气象输入参数进行预测。

通过相似周期的计算方式,得到相似性排名前5位的周期见表2。

表2 相似周期计算结果Tab.2 Similar cycle calculation results

其中,7月24日至7月28日之间的相似程度与待预测周期最高,计算得到在该周期内平均的预测偏差Aopt为6.21%,介于5%~10%,故判断待预测台风为影响性台风。

3.2 第二重相似计算

第二重相似性的计算主要针对台风登陆日的日特征向量构建与相似特性评估。通过对各相似周期内台风登陆日对应的日维度气象指标、日期距离、星期类型、季节类型、台风强度等逐一进行评估计算,得到7月24—28日周期内对应台风登陆日的日特征最相似,具体结果见表3。

表3 日特征向量相似计算结果Tab.3 Similarity calculation results of daily eigenvectors

3.3 预测结果

根据上述计算,采用LSTM算法对负荷进行预测,并对比正常日预测方法测算结果。正常日预测方法在预测模型的输入中仅包含日期、气象数据、假日标识等信息;而本文论述的基于双重相似机制的台风期间负荷预测方法则在日期、气象、假日标识之外,将相似程度作为另一个重要的可信度指标输入至模型。

本文在应用LSTM算法进行预测时,以广东省2013年1月—2020年8月18日的数据为基础,采用8∶2的比例拆分为训练集与测试集进行模型构建,正常日预测与本文所提双重相似机制的台风预测方法输入参数见表4。

表4 2种预测方法输入参数表Tab.4 Input parameters of two prediction methods

模型通过历史负荷变化规律,结合历史日的预测可信度,得到预测结果如图7所示。

由图7可以看到:在台风登陆前,由于气温升高,负荷高于正常情况,正常日预测算法得到的结果整体低于实际负荷;台风登陆当天,气温降幅较大,影响性台风带来超出正常日气象与负荷之间关系的影响导致负荷降幅超出预期,正常日预测算法对此规律无法掌握,因此预测结果偏高;台风过后,气温反弹,负荷大幅回升,此时正常日预测算法的预测结果偏低,整体预测负荷变化幅度小于实际。采用本文研究的基于双重相似机制的台风期间负荷预测算法进行预测,得到的预测结果在一定程度上优化了这一缺陷,在台风周期内,预测负荷与实际负荷更加接近,对此期间内负荷与气象之间的关系描述更加精准。2种方法预测精度见表5。

图7 台风“海高斯”期间负荷预测结果Fig.7 Load prediction results during typhoon Higos

表5 预测精度对比表Tab.5 Comparisons of prediction accuracy %

通过算例验证,本文研究的基于双重相似机制的台风期间负荷预测方法预测效果优于正常日预测方法,预测精度有较明显提升,具有较好的适用性。

4 结束语

鉴于台风天气影响时间、范围、程度的随机性,负荷预测工作面临较大的挑战。对此,本文提出基于双重相似机制的台风期间负荷预测方法,一方面以台风登陆日为中心,寻找与台风登陆前后一段时间内气象条件变化相似的周期,作为后续计算基础,增加考虑了预测当中气象、负荷变化的连续性与相邻日之间的关联性;另一方面在相似性较高的周期内,选择与台风登陆日对应的日期进行相似日特征的评估,同时从气象、日期距离、星期类型、季节类型以及台风强度等角度进行评估,得到每个备选日与待预测台风登陆日之间的日特征相似性,作为预测模型参考的可信度,使预测模型得到更有效地学习样本。

以台风“海高斯”期间广东省负荷预测结果为例,验证了该方法的适用性与有效性。但是综合来看,台风期间的负荷预测仍然存在历史样本较少、变化波动随机性强,很可能存在无法匹配历史相似周期或相似日的情况,因此未来的研究工作仍将持续,不断积累相关数据、优化预测方法。

猜你喜欢
相似性台风气象
一类上三角算子矩阵的相似性与酉相似性
台风过韩
气象树
《内蒙古气象》征稿简则
浅析当代中西方绘画的相似性
台风来了
大国气象
美丽的气象奇观
基于隐喻相似性研究[血]的惯用句
台风天外出小心