基于经验模态分解与Elman神经网络的月径流预测

2017-03-22 08:14席东洁赵雪花张永波郑秀清祝雪萍
中国农村水利水电 2017年7期
关键词:水文站径流分量

席东洁,赵雪花,张永波,郑秀清,祝雪萍,王 燕

(太原理工大学水利学院,太原 030024)

0 引 言

径流过程高度复杂。径流演变过程受多种因素影响,降雨、气温、太阳活动、恩索循环、人类活动、下垫面因素的改变都直接或间接地引起径流发生改变。影响径流的因素众多,各种因素错综复杂、相互影响从而导致径流波动的不确定性,给径流预报带来了困难。但研究径流变化规律以及预测径流变化趋势对各种水利工程规模、水工建筑物尺寸的选择有着重要意义;对水土保持规划有一定影响;为水资源合理开发、规划利用提供依据;在防洪、抗旱、旅游、发电、航运、国防建设等领域有广泛的应用。研究径流预报十分必要[1]。

径流预测法分为过程驱动法和数据驱动法,过程驱动分析法是基于径流形成过程,产汇流机制而建立的模型,是径流预测的一个发展方向。但由于径流形成过程的复杂性和影响径流量因素的多样性,使用该方法进行水文预报十分困难[1]。数据驱动法包括传统方法和人工智能方法。传统方法包括周期分析方法、平稳时间序列法、主成分分析法等。人工智能法分为模糊数学方法,人工神经网络方法,灰色系统理论法,混沌动力学及分形理论法,小波分析法,粗糙集理论法,支持向量机法,组合预测法[2]。其中神经网络是揭示水文现象变化规律的一种有效手段,它包括BP,Elman,RBF,GRNN等[3],常用BP等方法进行水文预报。但BP学习收敛速度慢,易陷入局部极值不足,对径流预测的精度有很大影响[5]。而Elman神经网络[4]是动态网络,可以很好地和非稳定的径流数据匹配[7]。随着径流预测多元化发展,组合预测越来越多地被用到径流预报中。

将经验模态分解(empirical mode decomposition,EMD)与Elman神经网络进行组合分析,已经应用于经济、化学、矿业安全等领域,但很少应用于径流预测中[6-8]。本文将其应用于水文径流预报中。

黄河历史悠久,覆盖着中国西北以及华北的大部分地区。黄河源区以唐乃亥水文站断面为界,研究唐乃亥水文站的水文特性,为黄河水资源统筹规划、优化调度、防汛抗旱提供基本水文依据[9]。

1 理论方法

1.1 经验模态分解

经验模态分解是由HUANG[10]等提出的一种数据分析方法,它的特征是对信号进行平稳化作用,提取出不同频率的波动。分解出来的数据序列就称为固有模态函数(intrinsic mode function,IMF)。

经验模态分解的步骤如下:

步骤1:求原序列的上包络线值xmax(t),下包络线值xmin(t)。

步骤2:求平均包络线m(t):

(1)

步骤3:求原序列x(t)与平均包络线m(t)之差h(t):

h(t)=x(t)-m(t)

(2)

h(t)如果满足极值点和过零点的数目相等或者最多差一个,并且各个瞬时平均值为零,则h(t)为IMF分量。否则把h(t)当作原序列,重复以上步骤,直到满足前两个条件,得到IMF。

步骤4:当求出第一个固有模态函数I1(t)后,用原序列减去I1(t),得余序列r1(t):

r1(t)=x(t)-I1(t)

(3)

然后把r1(t)看作一个新的原序列,按照以上步骤,依次分解。直到rn(t)变成一个单调趋势序列。

步骤5:原始序列等于分解出所有分量与趋势项之和[11]。

(4)

1.2 Elman神经网络方法介绍

Elman神经网络是Elman在1990年提出的,该神经网络Elman神经网络分为输入层,隐含层,输出层和承接层四层。一般情况下,输入层单元传输信号,输出层单元线性加权,隐含层单元的传递函数可以采用线性或非线性函数,承接层用来记忆隐含层前一时刻的输出值[12]。

Elman神经网络的非线性空间表达式为:

y(k)=g(w3x(k))

x(k)=f(w1xc(k-1)+w2u(k-1))

xc(k)=x(k-1)

(5)

式中:y、x、u、xc分别表示m维输出的节点向量、n维隐含层节点单元向量、r维输入向量和n维反馈状态向量;w3、w2、w1分别代表隐含层到输出层、输入层到隐含层、承接层到隐含层的连接权值;g(·)为输出神经元的传递函数,是隐含层输出的线性组合;f(·)为隐含层神经元的传递函数,常用S函数[13]。

2 实例分析

2.1 唐乃亥月径流资料分析

唐乃亥水文站,其经纬度为100°09′E,35°30′N,黄河源区地处青藏高原东部边缘,以唐乃亥水文站断面为界,源区流域面积占黄河流域面积的16.2%,多年平均来水量占黄河多年平均来水量的34.5%。唐乃亥水文站是黄河源区的门户。唐乃亥水文站位于青海省兴海县唐乃亥乡,是黄河上游的重要控制站,控制流域面积121 972 km2,控制断面以上河长1 553 km,占全河的28.4%,是龙羊峡的入库站,至河口距离3 911 km。其径流变化过程如图1所示。

选取1979-2009年的唐乃亥水文站月径流资料。实测资料的序列越长,其代表性越好。唐乃亥水文站共31年的径流资料,即372个月径流数据,该序列包括足够的丰、平、枯水年及其组合,资料精度较高,该资料的代表性能够得到保证。其中断面最大流量为3 550 m3/s,断面最小流量为89 m3/s,断面平均流量为634 m3/s,标准差可以很好地刻画径流序列对均值的偏离情况,其标准差为528 m3/s。离势系数为0.83,大于北方的平均离势系数,表明其径流数据变化剧烈。偏度可以用来描述分布不对称的程度,其偏度为1.66,分布为正偏,峰度刻画了分布密度曲线的峰形阔狭特征,其峰度为3.62。

2.2 唐乃亥水文站月径流资料EMD分解

径流的中长期预测大多数都在时间序列平稳的假定下完成的。EMD分解的本质是对信号的平稳化处理,本文利用EMD方法对径流序列进行平稳化处理,分解之后重构的序列进行Elman建模,这样可以减小预测误差,提高模拟精度。唐乃亥水文站月径流资料EMD的处理结果如图2所示,原序列分解获得5个IMF和1个趋势项,IMF分量相对于原始序列,既包含了原始序列的所有信息,又分别突出了原始序列的不同特征,使对原始序列影响较弱的序列特征显现出来,体现了原始序列的多尺度性。随着阶数的增加,IMF的频率由高到低,周期由短到长;时间尺度由小到大;IMF分量的幅值不断减少,对原始序列的影响程度也减少。从趋势线可以看出,该水文站月径流变化趋势是先减少后缓慢增大。使用经验模态方法把月径流资料不同频率,不同峰值的序列分解出来,根据不同序列情况建立不同模型,提高精度。

图2 EMD分解结果Fig.2 EMD decomposition results

2.3 基于EMD与Elman神经网络的预测模型

本文提出的基于EMD-Elman神经网络的思路(具体流程如图3所示)是:首先利用EMD处理月径流数据,该方法可以将径流序列按其内部特征分解为频率不同的多个IMF和趋势项Res,若逐个进行建模预测,则会带来较大的工作量和误差,因此本文将波动频率和波动振幅相近的EMD分解项进行重构,将这重构后的分量作为Elman神经网络的训练和测试数据,进行多次训练,然后将各个Elman模型预测结果进行叠加,结果为最终预测值,最后进行误差分析。由于水文时间序列变化是动态、随机的过程,表现出复杂的非线性特征。而Elman神经网络具有较强的动态信息处理能力。EMD-Elman神经网络组合预测法适用于数据资料长,弱相关,随机的径流过程。具体建模及其计算步骤如下:

步骤1 :通过对径流序列的经验模态分解,得到若干个IMF分量和趋势项。

唐乃亥水文站1979-2009年月径流资料EMD分解为5个固有模态函数和1个残余项。

步骤2 : 将波动频率相近的序列进行重组,得到高频、低频、趋势项。

IMF1,IMF2,IMF3组合得到高频项,将IMF4,IMF5相加得到低频项,剩下的为趋势项。

步骤3 :将处理后的各分量分别进行Elman神经网络训练,得到最优Elman模型。

选择1979-2007年的月径流资料和2008年上半年的月径流数据模拟和训练模型,选取剩下18个月的月径流数据来预测建模情况。通过对各个分量输入层和隐含层权值的调整,直到很好地拟合径流变化过程,误差达到最小,得到最优模型。

步骤4:比较误差大小,预测结果评价。

通过使用3个误差指标,计算月径流实测值和EMD-Elman神经网络预测值之间的误差,并与单独使用Elman神经网络预测模型进行对比分析。

图3 EMD-Elman神经网络预测模型Fig.3 Forecasting model based on EMD-Elman neural network

2.4 误差评定与预测结果分析

本文共372个月径流数据,选择其中354个月径流数据来建立Elman模型训练,选取剩下18个月的月径流数据来检验模型。

为了更加准确地观察数据处理情况,本文选用以下3个经常使用的误差评价指标,即平均绝对误差(MAE)、平均绝对百分比误差(MAPE)以及均方根误差(RMSE)。

(8)

本文为了获取合适的模型参数值,分别对高频项,低频项,趋势项进行Elman神经网络多次分析,各个子序列的Elman模型参数和误差如表1所示。经过多次训练,高频分量输入层个数为18,隐含层个数为24;低频分量输入层个数为18,隐含层个数为25;趋势项输入层个数为24,隐含层个数为24。分别对高频分量、低频分量、趋势项进行Elman模型训练,其误差都小于单独使用Elman模型的误差。高频分量的平均绝对误差减少了52%,平均绝对百分比误差减少了89%,均方根误差减少了59%;低频分量的平均绝对误差减少了96%,平均绝对百分比误差减少了82%,均方根误差减少了97%;趋势项的平均绝对误差减少了81%,平均绝对百分比误差减少了70%,均方根误差减少了87%。通过对比发现,低频分量Elman模型的3个误差都比较小,说明Elman模型更加适合分析低频分量。低频分量和趋势项的Elman模拟误差比较小,使得该方法总的模拟误差减小。

表1 各分量预测模型参数及误差Tab.1 The component prediction model parameters and errors

为了更加直观地观察组合模型的模拟情况,作出直接使用Elman法的模拟图和EMD-Elman法模拟图,建模情况如图4所示。由图4可以看出,组合预测模型的预测径流序列和实测径流序列比较拟合。

图4 Elman预测结果与EMD-Elman预测结果Fig.4 The predicting results of Elman neural network and EMD-Elman neural network

表2对比了Elman模型和EMD-Elman模型的误差,发现EMD-Elman神经网络预测模型的3个误差指标都比较小,EMD-Elman模型的平均绝对误差减少了55%,平均绝对百分比误差减少了28%,均方根误差减少了61%。说明该组合模型预测是行之有效的,预测结果比较可靠。EMD分解之后径流序列变为平稳过程,使分解之后重构的序列与Elman 神经网络耦合情况良好,因此EMD-Elman神经网络的误差比Elman神经网络误差要小。

表2 模型性能指标Tab.2 Model performance index

3 结 语

本文为了得到更加满意的预测结果,先用EMD法对径流数据进行平稳化处理,分量重构建立Elman模型,将EMD与Elman神经网络进行组合预测,得到结论如下:

(1)EMD-Elman神经网络模型,相对于Elman模型,平均绝对误差减少了55%,平均绝对百分比误差减少了28%,均方根误差减少了61%。该方法减少了非平稳性对误差的影响,提高了模拟精度。

(2)与Elman单独处理径流序列的相比,将EMD和Elman结合的模型应用到径流预报中取得了良好效果,在误差降低方面有明显优势,将这两种方法组合预测,在径流的中长期预测中是可行的,具有应用前景。

(3)单一方法预测精度低,不适合变化复杂,随机的水文预测,将多种方法进行组合预测可以分别利用各种方法的优势,这将是水文预报的一个趋势。

[1] 黄 强,赵雪花.河川径流时间序列分析预测[M].郑州:黄河水利出版社,2008.

[2] 朱永英. 水库中长期径流预报及兴利调度方式研究[D]. 辽宁大连:大连理工大学, 2008.

[3] 崔东文. 多重组合神经网络模型在年径流预测中的应用[J]. 水利水电科技进展,2014,34(2):59-63.

[4] ELMAN J L.Finding structure in time[J].Cognitive Science,1990,14(2):179-211.

[5] 李 佳,王 黎,马光文,等.LS-SVM在径流预测中的应用[J].中国农村水利水电,2008,(5):8-14.

[6] 宋菁华,杨春节,周 哲,等.改进型EMD-Elman神经网络在铁水硅含量预测中的应用[J].化工学报,2016,67(3):729-735.

[7] 李润求,施式亮,伍爱友,等.采煤工作面瓦斯涌出预测的EMD-Elman方法及应用[J].中国安全科学学报,2016,24(6):51-56.

[8] 谢 赤,郑林林,孙 柏,等.基于EMD和Elman网络的人名币汇率时间序列预测[J].湖南大学学报,2009,36(6):89-92.

[9] 丁小谨,高晓清,汤懋苍,等. 唐乃亥水文站径流量与黄河源区拍涡的关系[J]. 高原气象, 2014,33(3): 861-867.

[10] Huang N E.et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis [J]. Proceedings of Royal Society London.1998,454:903-995.

[11] 赵雪花,陈 旭,袁旭琦. 基于EMD的数据驱动模型在径流预测中的应用[J]. 系统工程,2014,32(9):150-154.

[12] 崔东文.改进Elman神经网络在径流预测中的应用[J].水利水运工程学报,2013,(2):71-77.

[13] 张秋余,朱学明. 基于GA-Elman神经网络的交通流短时预测方法[J]. 兰州理工大学学报, 2013,39(3): 94-98.

[14] 胡海鹏,方兆本. 股市波动性预测模型改进研究[J]. 数理统计与管理,2004,23(5):40-47.

猜你喜欢
水文站径流分量
格陵兰岛积雪区地表径流增加研究
基于SWAT模型的布尔哈通河流域径流模拟研究
金沙江坝下水文站中泓浮标系数稳定性分析
雅鲁藏布江河川径流变化的季节性规律探索
SL流量计在特殊河段的应用——以河源水文站为例
西双版纳州水文站网合理布设及测验方法探析
长江干流沙市水文站汛期流量变化趋势分析
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
近40年来蒲河流域径流变化及影响因素分析