考虑台风影响的风速多步预测模型

2021-07-30 02:53魏翔宇沈晓东杨晶显刘俊勇
电力系统自动化 2021年14期
关键词:台风修正风速

魏翔宇,向 月,沈晓东,杨晶显,刘俊勇

(四川大学电气工程学院,四川省成都市 610065)

0 引言

随着人们环保意识的提高与化石资源的逐渐减少,新能源技术在全球范围内快速发展。由于风力发电具备无污染、运维成本低的优势,其发展备受瞩目[1-3]。然而,随着风能渗透率的不断提升,风力发电不确定性对电网影响愈加明显,电网安全运行受到挑战[4]。此外,对中国东南沿海地区而言,风电调度运行长期受台风极端天气威胁[5]。台风影响下的风电场风速预测难度极大,由于没有考虑台风影响的预测方法,使得中国沿海及海上风电机组在台风侵袭状况下的运行风险评估、停机计划制定难以细化。为此,考虑台风影响的高精度风速预测对于东南沿海地区风电场调度运行至关重要[6-7]。

在短期/超短期风速预测研究方面,物理方法在欧洲地区应用广泛,但对于中国而言,受制于中国所处东亚季风带影响,统计学方法相对更加重要[8]。统计方法以机器学习方法为主,适用于短期风速预测,包含但不限于时间序列法、支持向量机(SVM)、人工神经网络(ANN)等[9-11]。其中,基于循环神经网络(RNN)的深度学习方法由于在处理时序非线性问题上的优势,近年来发展迅速[12-14]。在当前的风速预测研究中,尚未见计及台风影响的风速预测研究。

风速时序数据具备波动性与非平稳性,信号预处理是风速预测过程中的重要步骤。相较于经验模态分解[15]与小波变换[16],经验小波变换(EWT)理论基础牢靠,具有较好的自适应性能且不存在虚假模态[17],已被证明在某些情况下的风速预测中具有一定的优势[18],具备良好的实用价值。

在考虑台风影响的风速预测中,台风预报信息至关重要。中国台风预报水平在近年来提升显著,在台风路径的高精度预报方面尤为突出[19],但并未充分考虑风雨强度[20],对台风影响下具体地点的风速预测也研究较少。台风期间的风电机组启停计划制定依赖于风速的实时预报更新,现有台风预报更新间隔长,难以做到实时预报。多模式集成(ME)技术结合台风实时路径,评测不同预报产品的可信度,可应用于台风预报信息的实时修订中[21]。

本文结合台风预报信息,提出了一种基于EWT、门控循环单元(GRU)网络、ME 技术与深度信念网络(DBN)的多步风速预测方法。其中,使用EWT 方法剔除风速序列信号噪声扰动,使用ME 技术整合不同数值气象产品的台风数值预报信息,完成数据预处理。考虑历史气象数据,构建基于GRU神经网络的风速预测模型,对降噪后的风速数据进行预测以获取基础风速预测信息。然后结合台风数据,构建基于DBN 的修正模型,完成台风影响下的风速预测修正,进而得到风速最终预测值。

1 考虑台风的风速多步预测框架

考虑台风影响的风速多步预测模型总体框架如图1 所示,主要分为5 个步骤。

步骤1:首先使用EWT 方法将历史风速时间序列数据自适应地分解为n个独立模态,然后采用自适应阈值分析方法剔除噪声信号模态,并重构风速序列信号,获得去噪后的风速序列。

步骤2:构建深度GRU 网络,考虑历史气温、气压、相对湿度、风向、风速及降水数据进行训练,并对重构后的风速信号进行多步预测,得到不考虑台风影响下的风速预测结果。

步骤3:使用ME 技术,基于当前时刻台风状态信息,筛选并融合中国大陆和香港数值、美国数值及日本数值等台风数值预报产品信息[21],得到实时修正的台风预报信息。

步骤4:提取台风情况下的风速预测误差,构建DBN 模型,将台风相对距离、相对角度、七级风圈半径、台风最大风速及台风中心气压额外引入DBN 模型训练集,进行台风条件下的风速预测修正。

步骤5:结合GRU 网络预测结果与DBN 的修正结果,得到风速预测最终输出。

其中步骤1 与步骤3 分别进行原始风速数据与台风预报信息的数据预处理,步骤2 与步骤4 分别构建神经网络预测/修正模型,步骤5 得到最终输出。

图1 考虑台风影响的多步风速预测框架Fig.1 Multi-step wind speed forecasting framework considering impact of typhoon

2 基于EWT 的历史风速序列重构

风速序列波动性强,包含部分噪声。而在台风来临时,该噪声会进一步加大,进而提升预测难度。为此,基于EWT 方法重构风速序列,削减不同分量中的噪声信号,从而在保留有效风速信息的同时减少噪声的干扰,进而提升后续预测精度。

2.1 EWT 模型

EWT 由Jerome Gilles 在2013 年提出[22],可以实现对输入信号的自适应模态分解。不同于传统小波分解,EWT 方法基函数的构造自适应完成,且构建好的基函数与原信号相独立。在风速序列f(t)的EWT 分解中,主要步骤如下。

1)获取待分析风速序列f(t)的傅里叶频谱F(ω),并对f(t)进行快速傅里叶变换。

2)对F(ω)进行分割,确定傅里叶频谱的边界Λ={ω0,ω1,…,ωK}。依据所得边界,将傅里叶频谱划分为K个连续区间Θk=[ωk−1,ωk],其中k∈[1,K],ω0=0,ωk=π。

3)确定划分区间Θk后,依据经验小波的定义,利用Littlewood-Paley 与Meyer 小波构造经验尺度函数φk(t)与经验小波函数ψk(t)。将两者分别变换至傅里叶空间内,其傅里叶变换分别记为φFk(ω)与(ω)。4)对一组紧框架的经验小波,分别求取其近似系数W0(0,t)与经验小波系数W1(k,t):

式中:F−1(⋅)表示傅里叶逆变换;-表示对应变量的共轭;⋅表示求取内积。

故原始风速序列的重构信号为:

式中:*表示卷积运算。

原风速序列的各模态分量为:

式中:f0(t)为近似分量;fk(t)为小波分量。

EWT 采用基追踪法消除截波,可以有效避免各模态分量出现波形叠加与模态混叠。

2.2 自适应阈值分析

在完成分解后,须对分解所得各系数进一步处理,以去除原始风速序列中的噪声干扰。为此须设置阈值函数,对系数进行阈值分析。传统阈值函数包含软阈值函数与硬阈值函数,文献[18]提出了一种自适应阈值函数,适用于风速数据的去噪。

式中:k∈(0,K);W′1(k,t)为修正后的经验小波系数;W1(k,t)为原经验小波系数;η(⋅)为符号函数;Tk为噪声方差相关阈值;a为软阈值相似系数,其大小决定了与软阈值函数的相似度,a∈(0,1)。

采用该方法进行原始数据去噪的阈值筛选。完成阈值筛选后,对各系数进行逆变换,并完成原始风速序列的重构,获得去噪后的风速数据。

3 基于GRU 网络的风速预测模型

在得到原始风速序列的重构序列后,构建GRU神经网络以完成风速预测。

GRU 网络由Cho Kyunghyun 在2014 年提出[23],其构造以长短期记忆(LSTM)网络为基础,通过对LSTM 网络中遗忘门与输入门的整合以及细胞状态的改动,优化网络整体结构,使得其在保留LSTM 网络优势的同时提升了网络求解速度,并优化了长时间依赖与梯度爆炸的问题。GRU 网络在序列建模上优势显著,常用于时序预测问题求解,是常用的RNN 变种。GRU 单元拓扑结构见附录A图A1。

GRU 模型中包含了更新门与重置门2 个门控单元。其求解如下:

式中:zt和rt分别为更新门和重置门的输出;σ(⋅)表示sigmoid 激活函数;Wz和Wr分别为更新门和重置门的权重系数矩阵,由模型训练得到;ht−1为GRU神经网络中上一个时间步的状态信息;xt为当前时间步的输入;⋅表示内积。

式中:Wh为预输出的权重系数矩阵;×表示复合关系。

由于台风数据的不足与台风表征关键参数的复杂性,在深度GRU 网络构建中并不考虑台风信息。预测的输入层由量测点自身存储的温度、相对湿度、气压、降水、风向、风速等历史气象数据共同构成。网络的输出层为观测点待预测风速。该网络用于捕捉预测风速与温度、湿度等常见气象要素间的关系,其拓扑结构见附录A 图A2。图中:N为输入时序变量所包含的时序数,N′为输出变量所包含的时序数,xt−N为t−N时刻观测点存储的温度、相对湿度、气压、降水、风向、风速的历史气象数据,输出集包含待预测风速信息。

4 考虑台风的误差修正模型

在完成不考虑台风情况下的风速预测后,考虑台风的实时信息与预报信息,引入DBN 方法对台风情况下的预测结果进行修正。GRU 网络在t时刻的预测偏差εG,t由式(12)表示。

4.1 台风状态表征

在考虑台风对风速预测的影响时,从台风实时信息与预报信息两方面出发,对其进行分析。

在台风来临时,从气象站处可实时得到台风当前时刻位置、移速、风力等级、台风半径、最大平均风速、台风中心气压等关键信息。在台风位置方面,考虑台风与观测点的相对位置,计算出两者相对距离lt及方向θt,以此对台风位置进行表征。在台风强度方面,着重考虑台风七级风圈半径rt、中心最低气压pt及台风最大平均风速vt。其中由于大部分台风并非对称结构,台风半径在不同位置具有不同数值。本文采用台风近观测点方向的半径,结合风力共同对台风形状进行表征。除此之外,由于台风登陆后威力衰减,其半径难以界定,并无有效数据,因此对登陆后缺失的半径数据采用该等级台风平均半径进行统一填补,同时在输入变量中加入“台风是否登陆”这一二元变量信息,以方便界定台风影响范围。

在预报信息方面,不同台风数值产品具备不同的更新频率、起报时间及预报时长,而在台风来临时,预报的实时性对后续风险评估、调度运行方案制定至关重要。因此采用ME 技术[24],对中国大陆和香港数值、美国数值及日本数值等台风数值预报信息进行融合集成,获取修正的台风预报位置、中心气压及最大风速信息。其中由于预报信息中台风半径的缺乏,预报半径信息由预报最大风速及台风当前时刻形状共同给出。

4.2 台风预报信息集成

在台风预报信息集成时,由于台风路径预报信息为散点,因此首先利用3 次样条插值,完善台风路径信息。然后利用短时误差进行筛选,具体操作如下:以台风当前位置为中心,所有预测产品在当前时刻预测误差的平均值为半径,划定有效域。若产品预测误差在平均误差范围内,则在该时刻认为其预报值误差在可接受范围内,接受其预报值。然后对所有已接受预报信息取算术平均值,得到修正后的预报信息。相对于其他数值产品,中国香港数值预报信息逐时更新预报信息,故而在预报产品集成中权重固定,不参与筛选。如附录A 图A3 所示,在一次预报信息集成中,预报信息1、预报信息4 相对当前时刻的预报值在误差平均值范围内,因此接受这两者对下一时刻的预报值。

4.3 DBN 修正模型

DBN 由Geoffrey Hinton 在2006 年提出[25],是一种多层隐含随机变量构成的概率生成模型。所构建台风条件下的风速修正模型见附录A 图A4。

在结构上,DBN 包含若干层受限玻尔兹曼机(RBM)与一层有监督反向传播网络,DBN 的训练包含预训练与微调两步。其中预训练阶段DBN 需对RBM 逐层进行无监督训练,使得特征向量能够在映射过程中尽可能多地保留下来。在预训练过程中,前层RBM 的隐层输出作为后一层RBM 的显层输入,完成特征信息的扩散。此时每层RBM 对权重的学习使得其可保证该层特征信息映射最优。在微调阶段中,采用有监督学习方式对反向传播层进行训练,将误差反向逐层传递,进而对RBM 网络中的权值进行微调。RBM 层的训练优化了反向传播(BP)层的初值选取,降低了全局训练中模型陷入局部最优解的可能性。

在中国,台风气象集中出现于夏季。2012—2018 年数据表明,中国除台湾地区外,近年来的年登陆台风数约为7~9 个。随着中国检测技术不断发展,近年来可获取的台风数据不断完善,但由于台风过境时间短,台风总体数据仍旧较为稀少。而在DBN 模型中,受益于RBM 自身特性及预训练-微调的训练策略,网络对输入特征敏感性增加,在数据量较少的情况下仍能取得具备可用性的结果。

基于DBN 模型,得到台风情况下t时刻GRU 网络预测结果的偏差预测值。此时考虑台风条件下的最终预测值表示为:

5 算例研究

采用中国南部某地区数据进行建模,对该地区进行步长为1 h 的6 h 向前多步风速预测。历史数据包含该地区2012—2018 年内的温度、相对湿度、气压、降水、风向及风速数据,采样周期为1 h。

5.1 EWT 数据重构

在实际EWT 分解过程中,风速序列的傅里叶变换被归一到[0,π]区间,因此随着风速序列的增长,时域的延展使得原始风速序列不同频率下的信息被过度挖掘,不同频率下的分量不断增加,傅里叶频谱中出现多个极值点,进而造成分解过程中的模态爆炸。此时原始风速序列被过度分解,模态数目大且包含信息混杂,难以用于进一步分析。为此,需将原有风速序列分解为多段,并逐段进行数据重构。经测试,针对文中所用数据集,在时间序列长度处于[200,750]时,EWT 方法能够保持分解模态量适中,便于进行后续除噪。

截取其中某段EWT 分解后的波形,如附录B图B1 所示。其中最上方为原始风速波形,f0(t)为滤波后的近似分量,f1(t)−f5(t)为滤波后的5 个小波分量。采用自适应滤波后对风速序列进行重组。该段风速序列的重组风速数据及原始风速数据对比见附录B 图B1,滤除波形见附录B 图B2,重构风速序列见附录B 图B3。

结合附录B 图B2、图B3 可知,经过EWT 重构后的风速序列整体与原序列整体保持一致,在部分细节处去除了噪声,使得原始序列中包含的噪声信息减少。同时噪声信号的滤除在多分量中同步进行,风速信号在频域的关联性增强。

5.2 基于GRU 网络的风速预测模型

为对比EWT 序列重构对后续预测性能的影响,分别构建原始序列与重构序列的GRU 预测模型,进行6 h 逐时向前多步预测。

为提高预测精度,对数据进行划分。其中2012—2016 年数据作为训练集,2017—2018 年数据作为测试集。除少量缺损数据外,训练集包含35 040 组数据,测试集包含17 520 组数据。同时在训练开始前进行数据的归一化处理。在风速基础预测模型中,所构建GRU 网络的超参数通过网格搜索法进行优化。其隐含层层数为2 层。从前至后分别具有220 和150 个神经元。损失函数设置为平方误差,批尺寸为10 000,最大迭代次数为150 次。共训练10 次,预测误差取10 次平均值。

在预测结果分析中,采用均方根误差(RMSE)、平均相对百分比误差(MAPE)和平均绝对误差(MAE)对预测结果进行评价。3 项指标均直接表征了误差的大小,其数值越小,预测精度越高。

EWT-GRU 方法与单一GRU 方法在测试集中进行多步预测的误差对比如表1 所示。截取其中某段时间预测结果进行单步预测的对比。在该时段的数据中,预测误差如表1 所示,其中某日预测结果如图2 所示。多步预测结果见附录B 图B4 和图B5。

表1 不同预处理的预测误差Table 1 Forecasting errors of different preprocessing conditions

图2 基于GRU 模型的单步风速预测结果Fig.2 One-step wind speed forecasting results based on GRU model

结合图2 与表1 可以发现,经EWT 处理后,由于频域低表征信号被弱化,EWT-GRU 方法的预测结果相较GRU 方法所得预测结果在大多数时候更为优秀,在MAPE、RMSE、MAE 这3 项指标上均表现更好。在1 h 向前单步预测中,EWT-GRU 方法的MAE 较GRU 方法降低2.53%,MAPE 降低1.16%,RMSE 降低9.48%。值得注意的是,2 个预测模型在MAPE 上相差更小。回溯数据,由于原始风速数据在部分点处异常陡降,陡降点处相对误差迅速增大,并在最终MAPE 中占据较大比重。如图2 中43 h,该时刻实际风速为0.09 m/s,而EWTGRU 模型得出风速预测值为1.36 m/s,GRU 模型得出风速预测值为1.39 m/s,均高于实际风速值。两者的绝对风速误差分别为1.27 m/s 与1.30 m/s,相对误差分别为14.11 与14.44。在MAPE 的计算中权重较大。由于类似节点的大量存在,且EWTGRU 方法并非每次预测结果都能更优,因此2 种方法MAPE 差距相较其余二者更小。

受制于原始数据的选取,该时段的预测精度并不理想。该观测站位置特殊,在风速数据的平稳性上表现欠佳。另一方面,该时段内的风速数值较小且波动性极大,进一步加大了该时段内的预测误差。然而,仍可从图中看出,EWT 预处理虽然对原始数据改动较小,但大多时候下都具备提升预测精度的能力。

5.3 考虑台风的误差修正模型

以2017 年的热带风暴苗柏(Merbok)为例,进行预测分析。使用EWT-GRU 模型对该台风进行风速预测,其预测结果及误差如图3 所示。

图3 苗柏过境时EWT-GRU 模型风速预测值及误差Fig.3 Wind speed forecasting results and errors based on EWT-GRU model during Merbok

图3 中:前27 h 台风生成后,七级风圈未将观测点纳入范围内;第28~34 h,台风七级风圈边缘部分覆盖测风点;最后6 h,台风已经过境,七级风圈内不包含该观测点。

从图3 中可以看出,由于台风的不断接近,自台风产生后的风速预测精度随预测步数上升迅速下滑,远低于无台风情况下的预测精度。同时可以观察到,在台风影响下,出现持续的风速上升情况时,即使是提前1 h 的预测,所构建模型也总是倾向于认为下一预测时刻风速会降低,即保持风速的稳定。而在气压发生变化,台风风速降低时,预测模型又倾向于认为风速会加速降低,甚至高于台风风速实际降低速度。与之对比,该观测点处在之后无台风天气中观测到了一次持续风速剧烈变化天气,此时并未出现此类状况,如附录B 图B6 所示。从机器学习原理角度来说,由于台风情况下风速变化具备连续性,与常态差异大,再加之训练输入少,在训练中所占权重低,因此在以整体误差最小为核心的学习策略中,难以进行有效学习。

为此,构建DBN 对预测结果进行修正。以2012—2016 年全部数据及2017 年部分数据作为训练集,2017 年部分数据与2018 年数据作为测试集。训练集包含799 组数据,共涵盖17 个台风信息;测试集包含134 组数据,共涵盖4 个台风的相关信息。在训练开始前进行数据的归一化处理。DBN 包含2 层RBM,从前至后分别具有45、30 个神经元。RBM 学习率设置为0.000 5,最大迭代次数为200。误差修正后的预测结果如图4 所示。

图4 基于EWT-GRU-DBN 模型的风速预测结果Fig.4 Wind speed forecasting results based on EWTGRU-DBN model

从图4 可以看出,对提前1 h 预测进行的台风情况下修正可有效提升预报精度。而随着预报时间增长,台风本身位置、强度等信息的预报精度也在逐步降低,此时DBN 网络的修正精度随之降低。但相较于不加额外修正的情况下,所得误差仍有较大改善,对比如图5 所示。

图5 提前6 h 预测结果对比Fig.5 Comparison of forecasting results of 6 hours in advance

结合图3 至图5,该模型在台风过境前、过境中、过境后3 个不同时间段内具备不同的表现。其中在过境前阶段,误差预测效果整体平稳,且随着台风的接近,误差修正效果逐渐提高。而在台风过境阶段,DBN 预测模型对风速预测值短期修正效果良好,有效将预测误差控制在1 m/s 内。但在提前4 h、6 h 预测中,由于台风在接触观测点前2 h 时转向,偏离数值气象产品的预报路径,致使提前4 h、提前6 h 的预测出现较大偏差。在台风过境后,由于陆地环境复杂,且台风难以继续吸收热能,台风影响范围迅速衰减。此时,依据台风信息对风速进行的修正效果有限,且稳定性降低。在给定台风数据集中,DBN 修正前后的预测误差如附录B 表B1 所示。经台风信息修正,台风时期的预测精度显著提升,验证了本模型在提升台风情况下风速预测精度的有效性。

除此之外,与使用按月划分训练集的BP 神经网络进行对比,以证明本方法的有效性及修正模型的可迁移性。不同方法在台风测试集上的误差对比如表2 所示。由表2 可知,本文所提EWT-GRU 风速预测模型在精度上相较传统BP 神经网络具有一定优势。同时在应用至BP 神经网络时精度的提升表明,所用DBN 修正模型具有一定可迁移性,能够嵌入其余预测模型中,改善台风时的预测结果。

表2 不同方法预测性能对比Table 2 Comparison of forecasting performance of different methods

6 结语

基于深度神经网络,计及台风对风速预测的影响,提出了一种风速多步预测模型,并通过算例验证了本文所提模型的可行性与有效性,结论如下。

1)采用EWT 方法对数据进行预处理能够在不改变数据整体趋势的前提下,消除风速序列中的部分噪声,改善预测结果。

2)针对台风对风速的影响,整合台风预报信息,构建DBN 模型对台风情况下的预测结果进行修正,结合前述EWT-GRU 模型可有效提高受台风影响时的风速预测精度,为后续台风影响下的风电运行风险评估与调度运行计划制定提供了参考。

3)所提台风条件下的DBN 修正模型具备一定通用性,可应用于其余机器学习方法,提升台风情况下的风速预测精度。

后续随着台风预测技术的提升与台风实时观测数据的逐步开放,该方法可运用至考虑台风影响的15 min 超短期风速预测或短期风速预测中。

附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。

猜你喜欢
台风修正风速
台风过韩
Some new thoughts of definitions of terms of sedimentary facies: Based on Miall's paper(1985)
修正这一天
基于最优TS评分和频率匹配的江苏近海风速订正
台风来了
合同解释、合同补充与合同修正
台风爱捣乱
软件修正
基于GARCH的短时风速预测方法
考虑风切和塔影效应的风力机风速模型