基于EEMD和LSTM的短期风速预测模型研究

2020-03-20 03:42陆冰鉴周鹏王兴周可
软件工程 2020年3期
关键词:经验模态分解

陆冰鉴 周鹏 王兴 周可

摘  要:由于风具有较强的阵性和局地性,影响因子较多,利用机器学习相关技术进行风速的预测,往往会受这些影响,降低预测的准确率,特别是对于瞬时大风的预测,准确度普遍不高。针对上述问题,提出一种基于集合经验模态分解法(EEMD)和长短期记忆神经网络(LSTM)相结合的短期风速预测模型,该模型采用EEMD将风速序列分解为多个频域相对稳定的子序列,进而改善经验模态分解法(EMD)模态混叠现象,再采用LSTM构建预测模型,实现短期风速预测。该方法与其他预测方法相比,预测的精度更高,误差更小,验证了本文预测方法的可行性和有效性。

关键词:风速预测;集合经验模态分解;经验模态分解;长短期记忆神经网络

中图分类号:TP183     文献标识码:A

Abstract:Because the wind has strong transient and regional characteristics,the impact factors are numerous.Using machine learning technology to predict wind speed will often be affected by these factors,reducing the accuracy of prediction.Especially for the prediction of instantaneous high winds,the accuracy is generally not high.In order to solve this problem,this paper proposes a short-term wind speed forecasting model based on EEMD and LSTM.The model uses the ensemble empirical mode decomposition (EEMD) method to decompose the wind speed sequence into multiple sub-sequences whose frequency domain is stable.This method improves the aliasing phenomenon of the empirical mode decomposition (EMD) method.Then,this paper uses the long short-term memory (LSTM) neural network to build the forecasting model to forecast short-term wind speed.Compared with other forecasting methods,this method has higher accuracy and less error,which verifies the feasibility and validity of this method.

Keywords:wind speed forecast;ensemble empirical mode decomposition;long short-term memory neural  network

1   引言(Introduction)

風速具有不确定性,波动性等特点,是气象要素中最难预测的一个要素之一。风速预测对于天气预报精确性的提高、短时强风灾害的预测、空气污染物的扩散速度、风电机组的安全运行等都具有重要的意义[1]。在气象灾害中,强风不仅对生态自然环境造成巨大破坏还威胁人们的生产生活、生命财产安全,如:2015年的“东方之星”号游轮事故和2017年的“鹏安盛”号轮的受强风影响导致的事故。而且,新能源如风电产业对于提高风的利用效率也对风速预测的需求迫切。

目前风速预测的方法主要是基于数值天气预报预测结果的物理方法和基于历史数据建模的统计方法这两大类[2]。前者受数值模式本身机理的限制,对于短期的风速预测准确率往往较低,且时间分辨率不高;统计方法需要较多的历史数据,通过统计学习的方法识别历史数据所体现的风速特征来预测对未来某个时刻风速。

近年来,随着人工智能的发展,各种深度学习算法不断出现。Wang等[3]提出了经验模态分解(Empirical Mode Decomposition,EMD)算法应用于风速预测模型;Jiang等[4]提出了通过SA算法优化BP神经网络的训练参数来提高BP神经网络的预测性能的模拟退火算法(Simulated Annealing,SA)和BP神经网络的混合预测模型得到了比单个预测模型更好的效果。

本文基于集合经验模态分解EEMD与长短期记忆神经网络LSTM相结合的风速预测模型,优化了EMD分解法的模态混叠带来的误差,与LSTM预测模型相结合,改善了LSTM预测模型的滞后性,同时能够有效降低预测误差。

2  风速数据采集与预处理(Wind speed data acquisition and preprocessing)

本文研究数据来自江苏省海事局提供的长江流域南京段某一地面气象观测站,采用2018年3月1日至2019年2月28日的观测数据作为实验数据。该数据为每日逐秒的风速、风向特征数据,采样数据与预测数据的时间分辨率均为10s。

由于实际观测过程中会存在一些缺失及冗余数据,无法构成逐秒的连续完整序列,因此,本文将分辨率调至10s,对原始数据进行预处理,以保证可提供逐10s的连续完整序列。

其中,预处理方式选为10s平均,即对每个10s内的数据取平均值。第一个10s为2018年3月1日00时00分00秒至2018年3月1日00时00分10秒,以此往下,对每个10s内的数据进行取平均值,构成逐10s的风速序列。

3   方法优化(Method optimization)

3.1   EMD

EMD是由Huang[5]提出的一种对信号的自适应分析方法。它将复杂的序列分解为若干不同尺度的固有模态分量IMF(Intrinsic Mode Function)和一个剩余分量,从而获得平稳序列,非常适合用于风速这种波动性较大序列的处理。其中,IMF分量需满足下面两个条件[6]:

(1)序列零点个数与极值点个数最多相差一个;

(2)在任意点,由局部极小值和局部极大值点定义的包络线均值为0。

EMD具体分解步骤如下:

步骤1:求出序列的所有极值点;

步骤2:用插值法拟合出序列的上下包络线、;

步骤3:计算上下包络线中心位置;

步骤4:令 ,若其不满足IMF分量的两个充分条件,则重复步骤1—步骤3,直至k次迭代后满足两个条件;

步骤5:IMF1分量为,剩余分量为;

步骤6:将剩余分量作为原始序列重复上述步骤进行分解,最终得到n个IMF分量和一个剩余分量;

步骤7:经过EMD分解后的序列为:

3.2   EEMD

风速观测数据在采集过程中不可避免设备故障及噪声干扰问题,这样在EMD分解过程中容易出现模态混叠现象,从而降低预测精度。目前解决该问题较好的方法是EEMD。其改进步骤如下:

步骤1:在序列x(t)中加入如从正态分布的白噪声[7];

步骤2:对新形成的序列作EMD分解,求出n个IMF分量和一个剩余分量;

步骤3:重复r次步骤1和步骤2,每次加入新的白噪声序列;

步骤4:求r次分解后的IMF分量的整体平均,作为序列x(t)的IMF分量。

3.3   LSTM

LSTM是一种特殊的RNN类型,是由Hochreither & Schmidhuber提出的长短期记忆神经网络,采用记忆单元代替RNN隐含层的神经单元,用于解决RNN梯度消失的问题[8]。当前,LSTM在时序数据分析、语言翻译,以及情感分类等诸多领域得到深入研究和应用[9]。记忆单元的内部结构如图1所示,包含输入门(Input gate)、输出门(Output gate)、遗忘门(Forget gate)和记忆细胞(Memory cell)。

图1中,xt、ht分别为t时刻网络的输入和输出。LSTM记忆单元通过公式迭代计算输出:

式中,ft、it、ot、Ct分别为遗忘门、输入门、输出门和记忆细胞的输出;Wf、Wi、Wo、WC分别为遗忘门、输入门、输出门和记忆细胞的权重矩阵;bf、bi、bo、bC分别为遗忘门、输入门、输出门和记忆细胞的偏置;为sigmoid函数。

4  基于EEMD和LSTM的短期风速预测模型(Short term wind speed prediction model based on EEMD and LSTM)

自然界风速的特征表现为波动范围大,其非平稳性严重制约风速预测模型的建立,并对预测精度的提高有着很大的影响。本文搭建的风速预测模型基于集合经验模态分解EEMD与长短期记忆神经网络LSTM相结合的风俗预测模型,较好地保留了原始数据的性质,优化了EMD分解法的模态混叠带来的误差,有效改善了基于LSTM预测模型的滞后性问题。图2为风速预测模型的框架结构图。

具体建模流程如下:

(1)将预处理后的逐10s的风速序列进行集合经验模态分解EEMD,得到n个不同尺度的且较为平稳的固有模态函数IMF1-IMFn分量及一个剩余残差Res分量;

(2)确定时间尺度TIME_STEPS,对分解后的IMF分量及误差res进行重构,归一化统一量纲,确定训练集和测试集;

(3)对各个训练集和测试集分别建立长短期记忆神经网络LSTM预测模型,预测风速子序列;

(4)将不同尺度下的风速预测分量反归一化后进行叠加,得到最终风速预测的结果。

4.1   風速序列集合经验模态分解

本文选取某气象站2018年9月29日的风速较大的逐秒数据,对每个10s内的数据求平均值,预处理后形成分辨率为10s的风速序列,其风速的波动区间为0—14m/s。图3为预处理后的逐10s的风速数据。

采用EEMD对处理后的风速序列进行分解,得到频域稳定的10个固有模态分量IMF1—IMF10和一个剩余分量Res的波形图。图4为EEMD分解后的结果。图中的signal为原始逐10s风速序列,与图3一致。

由图4可见,分解后分量图与原风速序列相比,子序列的波动变化较为平稳,频谱特征由分量从高频到低频依次表征出来。该方法将原有不平稳的风速序列分解成了多个平稳子序列,同时又保存了风速序列的特征,为后续的建模预测打下了很好的基础。

4.2   风速序列重构

风速序列经过EEMD分解后得到较为平稳的10个子序列和一个误差序列,为避免不同量纲带来的影响,对每个分量都进行归一化处理,再对每个分量序列进行重构,得到重构序列为:

重构后将原始序列扩展成N个样本,其中时间尺度TIME_STEPS的选择直接影响预测结果,时间尺度TIME_STEPS过小,会导致信息重合,时间尺度TIME_STEPS过大会增加计算量。因此需要确定合适的参数。

4.3   LSTM模型预测

本文采用LSTM建立短期风速预测模型,由上述重构后的样本确定训练样本为:

利用LSTM构建了短期风速预测模型如图5所示。该网络模型包含一个LSTM层。在t时刻网络的输入为历史风速序列,输出为下一时刻的预测值。经过隐含层运算后得到该隐含层的输出。网络的输出为:

式中,为隐含层和输出层之间的权重矩阵,b为输出层的偏置量。本文采用当前时刻之前的TIME_STEPS个历史数据作为LSTM网络的输入进行训练和预测。历史数据信息通过LSTM网络的循环迭代更新记忆单元的状态,从而通过历史数据对当前时刻的影响实现风速预测。

5  实验结果与分析(Experimental results and analysis)

5.1   LSTM网络超参数对比实验

本次实验采用江苏省海事局提供的长江流域南京段某一地面气象观测站2018年9月29日风速数据,仅采用LSTM进行风速预报,对LSTM网络设置不同的超参数进行实验。各对比实验的超参数设置及实验结果如表1所示。其中,超参数TIME_STEPS为时间尺度,代表用当前时刻的前TIME_STEPS个历史数据作为网络输入。EPOCH代表所以训练样本重复训练次数。

各超参数对应的实验结果如图6(1)—图6(20)所示,其中,图标与表格中的图标相对应,图中横坐标表示逐10s,单位为s;纵坐标表示风速,单位为m/s。红色线条为观测数据,蓝色线条为预测数据。

结合图表对比结果可以看出,当TIME_STEPS不变,EPOCH增大,预报误差减小,预报时间增加,且随着EPOCH增大到一定程度,预报误差减小缓慢,但时间增加并不减少。当EPOCH不变,TIME_STEPS增大,預报误差先减小后增大,预报时间增加。两者相比,一定程度上增加EPOCH的效果比增加TIME_STEPS的效果好,且时间少。经总体对比,选取TIME_STEPS为10,EPOCH为500作为网络的超参数。

5.2   不同预报方法对比实验

实验数据为江苏省海事局提供的长江流域南京段某一地面气象观测站2018年9月29日风速数据,分别采用四种方法进行风速预报,分别是基于LSTM的短期风速预测、基于EMD和LSTM的短期风速预测、基于EEMD和LSTM的短期风速预测,以及基于CEEMDAN和LSTM的短期风速预测。采用5.1中实验结果设置LSTM网络的超参数。各实验结果如图7—图9所示。其中,图片的横坐标表示时间,单位为s;纵坐标表示风速,单位为m/s。每个图的左图为480个每10s的结果,合约1.3小时逐10s的结果;右图为左图的前200个结果的放大显示,合约0.5小时逐10s结果。

从图7—图9的右侧图可看出:仅采用基于LSTM网络的短期风速预测方法的预测结果存在较为明显的延迟性,虽然预报的峰值和谷值较为相近,但由于延迟的原因误差相差较大。随后,采用基于EMD和LSTM相结合的短期风速预测方法的预测结果较为明显地改善了上述的延迟性,但是峰值和谷值的预测不是很理想,考虑可能是EMD分解时模态混叠的问题。于是,采用基于EEMD和LSTM相结合的方法进行短期风速预测。由于EEMD改善了EMD分解时模态混叠的问题,由图9右图可明显看出在峰值和谷值的预测上有较大改善,其总体风速预测的效果最好。

但从图片角度来看,难以看出各个方法的具体改善效果,表2给出了三种方法的评价指标对比结果,其评价指标与4.1中一致。

从表1可清晰看出,从三个指标的纵向对比来看,采用EMD和LSTM相结合的方法预测比仅用LSTM方法预测分别降低了0.2596m/s、0.3092m/s和4.36%。采用EEMD和LSTM相结合的方法预测比EMD和LSTM相结合的方法预测分别降低了0.1902m/s、0.2433m/s和3.2%。由此可见,采用EEMD与LSTM相结合的方法进行短期风速预测,能较好地模拟出未来近80分钟逐10s的风速情况,降低了预测误差。

6   结论(Conclusion)

风速的阵性、非平稳性和非线性的特点使得对其做出精准预测存在较大的技术困难。在传统气象统计预报方法和人工智能预报方法的基础上,提出一种基于EEMD和LSTM相结合的短期风速预测模型,并通过实验得出以下结论:

(1)基于EEMD和LSTM相结合的短期风速预测模型能够较好地拟合实际风速序列,验证了方法的有效性。

(2)基于EEMD和LSTM相结合的短期风速预测模型,改善了LSTM模型的滞后性,消除了EMD算法模态混叠现象对于风速预测的不利影响,预测结果更接近实际风速值,具有更小的误差,有较高的应用价值。

(3)由于风速序列的随即不确定性,导致风速的峰值和谷值的预测还不够准确,在进一步的研究中,考虑加入风速的空间特性及其影响因子。

参考文献(References)

[1] 张珂铨.风速预测中人工智能方法的应用研究[D].兰州大学,2018.

[2] 魏昱洲,许西宁.基于LSTM长短期记忆网络的超短期风速预测[J].电子测量与仪器学报,2019,33(02):64-71.

[3] Jujie Wang,Wenyu Zhang,Yaning Li,et al.Forecasting wind speed using empirical mode decomposition and Elman neural network[J].Applied Soft Computing Journal,2014(23):452-459.

[4] Ping Jiang,Yingjie Ge,Chen Wang.Research and application of a hybrid forecasting model based on simulated annealing algorithm:A case study of wind speed forecasting[J].Journal of Renewable and Sustainable Energy,2016,8(1):015501.

[5] 雷若冰,徐箭,孙辉,等.基于相关性分析的风电场群风速分布预测方法[J].电力自动化设备,2016,36(05):134-140.

[6] Tong Wang,Mingcai Zhang,Qihao Yu,et al.Comparing the applications of EMD and EEMD on time–frequency analysis of seismic signal[J].Journal of Applied Geophysics,2012(83):29-34.

[7] 程启明,陈路,程尹曼,等.基于EEMD和LS-SVM模型的风电功率短期预测方法[J].电力自动化设备,2018,38(05):27-35.

[8] 白博,李益华,苏盛,等.基于LSTM风速区间预测的风力发电机再切入控制[J].电力学报,2018,33(03):183-189.

[9] 成璐.基于注意力机制的双向LSTM模型在中文商品评论情感分类中的研究[J].软件工程,2017,20(11):4-6;3.

作者简介:

陆冰鉴(1994-),女,硕士,工程师.研究领域:智慧气象.

周  鹏(1994-),男,本科,工程师.研究领域:遥感与地理信息系统应用.

王  兴(1983-),男,博士,高级工程师.研究领域:AI气象信息技术,智能计算.

周  可(1983-),女,硕士生.研究领域:智慧交通.

猜你喜欢
经验模态分解
基于EMD的电弧反射电缆故障测距脉冲信号提取方法
基于经验模态分解的信号去噪
网络被入侵后的信号检测系统设计与优化
网络不稳定节点的动态特征挖掘模型
HHT和HMM在血细胞信号识别中的应用
基于联合采用EMD与高通低通滤波的信号分析
Hilbert—Huang变换提取齿轮箱故障特征方法研究
自适应最稀疏时频分析方法的分解能力研究
矿山动态轻轨衡系统称重信号处理的研究
基于EMD的运动想象脑电特征提取与识别