尤成,于福江,原野
(国家海洋环境预报中心国家海洋局海洋灾害预报技术研究重点实验室,北京100081)
基于相空间重构的神经网络风暴潮增水预测方法
尤成,于福江,原野
(国家海洋环境预报中心国家海洋局海洋灾害预报技术研究重点实验室,北京100081)
摘要:风暴潮增水的准确预测对于国民生产、防灾减灾有重大意义。本文提出一种基于相空间重构的神经网络风暴潮增水预测方法,即使用单站风暴潮增水数据重构出与之相关的相空间,然后使用BP神经网络模型拟合该相空间的空间结构。将该模型用于库克斯港风暴潮增水预测,结果表明:该模型应用在风暴潮增水时间序列的预测中是合理、可行的,并具有较高的精度。此外,使用db10小波函数对原始余水位数据进行降噪处理可以显著地提高模型的预测精度。
关键词:相空间重构;BP神经网络;风暴潮增水预测;小波降噪
Packard等[1]提出了重构相空间的思想。随后Takens等[2]提出嵌入定理,建立起观测资料与动力系统空间特征之间的桥梁,使得深入分析时间序列的背景和动力学机制成为可能。Lyapunov指数、G-P关联维算法、虚假近邻法、Cao方法、自相关法、互信息法、C-C方法等对各种参数的计算,使得相空间重构技术日趋成熟。Farmer等[3]第一次提出使用相空间重构的方法预测时间序列。这个方法后来被称作k-NN方法。许多学者讨论K-NN方法中权重系数ωi该如何取值[4-6]。为了尽量避免k的选取引起预测误差,Yankov等[7]以一组k取值不同的k-NN方法为成员,进行集合预报,发现预报效果有一定的改进。此外,人们在天气预报、水文预报等方面应用相空间重构的理论进行了研究取得了相当的成果。张颖超和刘玉珠[8]研究表明:基于相空间重构的神经网络短期气候预测方法有合理的精度,可以为短期气候预测提供参考。Solomatine等[9]使用单变量局域方法预测风暴潮,结果表明其预报精度明显好于AR、ARIMA等线性模型。Velickov[10]进一步使用多变量局域方法来预测风暴潮,结果表明这种预测方法短期预报结果可以信赖。Siek等[11]使用PCA方法降低数据维度,提高了预报精度。Siek等[12]比较单变量k-NN方法、多变量k-NN方法以及神经网络模型的预报风暴潮增水的效果,结果表明:k-NN方法与神经网络模型有相当的预报精度,但k-NN方法预报极端事件的能力更强,此外与单变量k-NN方法相比,多变量k-NN方法在预报精度上并没有明显的改进。但是K-NN方法在寻找临近点时,经常把相空间中临近时刻的点当作临近点,使得预报结果精度降低。为了规避K-NN方法的这一缺陷,本文使用相空间重构与BP神经网络相结合的方法来预测风暴潮增水,并给出了该方法的最大预测期限。
2.1相空间重构
根据Takens的嵌入定理[2],在无噪声情况下,观察到的时间序列{xn}以向量
Xn=(xn,xn-τ,…,xn-(m-1)τ)(1)
的形式形成m维空间,只要嵌入维数m≥2d+1,动力系统的几何结构可以完全打开,其中d是吸引子的分形维数,τ是延迟时间间隔。条件m≥2d+1是动力系统重构的充分不必要条件。状态空间Rm中吸引子的几何特征与原动力系统的几何特征等价,并且状态空间中Xn→Xn+1的演化反映了原动力系统的演化特征。类似于Takens的嵌入定理,只要嵌入维数充分大,存在映射G:Rm→Rm使得
Xn+1=G(Xn)[13](2)
本文使用BP神经网络来拟合G(·)。
2.2 BP神经网络的基本原理
BP神经网络全称是误差反向传播神经网络(Back Propagation)。它具有结构简单、工作状态稳定、易于硬件实现等优点。BP算法通过输入、输出数据样本集,根据误差反向传递的原理对网络进行训练。其学习过程包括信号的正向传播和误差的反向传播两个阶段。
正向传播中输入信息从输入层经隐层逐层计算各单位输出值:
对输出层:
对隐藏层:
式中:xi表示输入层节点,σk是隐藏层节点,yj表示输出层节点,vij是输出层到隐藏层之间的权重,ωjk是隐藏层到输出层之间的权重。
反向传播过程中输出误差的同时,逐层向前算出隐层各个单元的误差,并以此误差修正前层的值。直到误差达到要求,网络学习过程结束。
2.3相空间重构与BP神经网络相结合的风暴潮增
水预测方法
相空间重构理论和神经网络有2个结合点[8],首先它们都适合处理非线性复杂系统问题;其次,根据相空间重构预测模型式(3),可以发挥神经网络自适应、自学习的特点,选择训练样本训练神经网络,模拟G(·),从而进行预测。具体步骤如下:
第一步:收集验潮站的潮位数据并减去潮汐部分,得到逐小时的余水位数据{xi, i=1,2,...,n};
第二步:使用db10小波对余水位数据进行降噪;
第四步:建立神经网络,每个输入数据之间时间相差τ个时间点,即将xn,xn-τ,…,xn-(m-1)τ作为神经网络的输入。输出为预测时间点的预测值,即xn+1;
第五步:训练神经网络,在确定网格的输入输出结构后,选择学习样本构成训练集,对网格进行训练,直到达到误差要求为止;
第六步:网络训练成功后,选取预测时间点,应用前面建立的模型进行预测。
北海地区,尤其是荷兰、丹麦以及德国北部沿海地区特别容易受到风暴潮的侵袭。库克斯港位于黑尔戈兰湾内,易北河河口处,是一座重要的渔业港口。本文选取库克斯港1981年1月1日—1983 年12月20日的逐小时潮位数据进行相空间重构以及神经网络训练,使用1983年12月21日—1984年1月23日的逐小时潮位数据进行验证。冬季是北海地区风暴潮频发的季节,仅1983年12月21日—1984年1月23日就有6次增水超过1 m的风暴潮过程,以及一次较强的减水过程。其中最剧烈的一次风暴潮过程引起了将近2 m的增水。
3.1数据处理
首先使用t_tide潮汐分析工具包从库克斯港潮位数据中提取潮汐信号,然后从潮位数据中减去潮汐部分得到逐小时的余水位时间序列。根据史珍等[14]研究表明:数值较大的高频噪音对混沌系统的可预报性有显著的影响。所以本文使用db10小波函数对余水位数据进行降噪处理。图1表明降噪之后的余水位数据基本上保留了原始余水位中风暴潮增水的信息。
3.2风暴潮增水时间序列的相空间重构
相空间重构的关键是参数的选择,Fraser等[15]提出利用互信息函数的第一极小值来确定延迟时间t。本文使用杨志安等[16]提出的等间距分格子法来计算互信息函数并以此确定延迟时间。计算结果见图1。从图1中可以看出无论把时间序列的值域等分成300份、400份、500份或600份,互信息都在t=7处取得第一最小值。本文采用Cao[17]提出的方法计算嵌入维数m,计算结果见图2。从图2中可以看出当嵌入维数m大于或等于9时,E1没有显著变化。于是取m=9。
3.3 BP网络设计
采用BP神经网络进行预测时,网络输入层神经元为10个,输出层神经元为10个。为了避免因为数据间数量级差别而造成网络预测误差较大,首先对输入输出数据进行归一化处理,将数据转化为[0,1]区间的值,这里采用如下归一化公式:
图1 1981年10月3日—12月7日逐小时余水位数据及其降噪之后的数据
图2 将时间序列的值域分别等分成300份(线a)、400份(线b)、500份(线c)以及600份(线d),求得的互信息与延迟时间的函数图
图3 E1与维度的函数图
3.4预测结果分析
本文选取库克斯港1981年1月1日—1983年12月20日降噪之后逐小时余水位数据进行相空间重构以及神经网络训练。图4给出了库克斯港1983年12月21日—1984年1月23日余水位3 h预报值,及其预测误差。从图中可以看出:预测值与观测值对应得很好,并且预测误差基本上控制在± 6 cm以内。由此可见:基于相空间重构的BP神经网络模型能较好地反映该序列内在的运动机理,揭示动力系统复杂的运动规律和非线性特征。此外,从表1可以看出:使用降噪之后的数据,可以明显提高该模型的预测精度。
图4 1983年12月21日—1984年1月23日库克斯港逐小时余水位数据与误差
表1 基于原始和降噪之后的余水位数据模型,1983年12月21日—1984年1月23日库克斯港预报值对应的平均绝对误差
3.5模型最大预测时限估计
为了定量地估计该方法的最大预测时限,本文根据Chen等[18]提出的具体算法来计算非线性Lyapunov指数(NLLE)。1 h预测值xi与其对应的真实值x'i的差的绝对值为,t时刻之后绝对误差为,大量平均计算得到的NLLE为,绝对误差。根据丁瑞强等[19]的研究表明:当t达到一定时刻,误差达到饱和,系统的初始信息丢失,预测失去意义,于是最大预测期限可以定量地确定。实际操作时,把ln(err(t))达到饱和值的98%时的t当作相空间的最大预测期限。
计算结果(见图5)表明基于相空间重构的神经网络风暴潮增水预测方法在库克斯港站的最大预测期限是26 h。
图5 预测误差的自然对数与预测时间的函数图(水平虚线:误差饱和值的98%)
本研究使用单站风暴潮增水数据重构出与之相关的相空间,并使用BP神经网络模型拟合该相空间的空间结构以便用于余水位预测研究。结果表明:
(1)基于相空间重构的BP神经网络模型在风暴潮增水的短期预测中表现出良好的预测能力,这表明该模型能较好地反映该序列内在的运动机理,揭示动力系统复杂的运动规律和非线性特性;
(2)使用db10小波对原始余水位数据降噪之后可以显著地提高模型的预测精度;
(3)利用非线性Lyapunov指数计算出基于相空间重构的神经网络风暴潮增水预测方法在库克斯港站的最大预测期限是26 h。
参考文献:
[1] Packard N H, Crutchfield J P, Farmer J D, et al. Geometry from a time series[J]. Physical Review Letters, 1980, 45(9): 712-716.
[2] Takens F. Detecting strange attractors in turbulence[M]//Rand D, Young L S. Dynamical Systems and Turbulence, Warwick. Berlin Heidelberg: Springer, 1981: 366-381.
[3] Farmer J D, Sidorowich J J. Predicting chaotic time series[J]. Physical Review Letters, 1987, 59(8): 845-848.
[4]吴耿锋,周佩玲,储阅春,等.基于相空间重构的预测方法及其在天气预报中的应用[J].自然杂志, 1999, 21(2): 107-110.
[5] McNames J, Suykens J A K, Vandewalle J. Winning entry of the K. U. Leuven time-series prediction competition[J]. International Journal of Bifurcation and Chaos, 1999, 9(8): 1485-1500.
[6]向小东,郭耀煌.基于混沌吸引子的时间序列预测方法及其应用[J].西南交通大学学报, 2001, 36(5): 472-475.
[7] Yankov D, DeCoste D, Keogh E. Ensembles of nearest neighbor forecasts[M]//Fürnkranz J, Scheffer T, Spiliopoulou M. Machine Learning: ECML 2006. Berlin Heidelberg: Springer, 2006: 545-556.
[8]张颖超,刘玉珠.基于相空间重构的神经网络月降水量预测方法[J].计算机仿真, 2014, 31(1): 352-355.
[9] Solomatine D P, Rojas C J, Velickov S, et al. Chaos theory in predicting surge water levels in the North Sea[C]//Proceedings of the 4th International Conference on Hydroinformatics. Iowa, USA, 2000.
[10] Velickov S. Nonlinear dynamics and chaos with applications to hydrodynamics and hydrological modelling[M]. CRC Press, 2004.
[11] Siek M, Solomatine D, Velickov S. Multivariate chaotic models vs neural networks in predicting storm surge dynamics[C]// Proceedings of IEEE International Joint Conference on Neural Networks, 2008. IJCNN 2008. Hong Kong: IEEE, 2008: 2112-2119.
[12] Siek M, Solomatine D P. Nonlinear chaotic model for predicting storm surges[J]. Nonlinear Processes in Geophysics, 2010, 17(5): 405-420.
[13]王海燕,卢山.非线性时间序列分析及其应用[M].北京:科学出版社, 2006.
[14]史珍,丁瑞强,李建平.随机误差对混沌系统可预报性的影响[J].大气科学, 2012, 36(3): 458-470.
[15] Fraser A M, Swinney H L. Independent coordinates for strange attractors from mutual information[J]. Physical Review A, 1986, 33(2): 1134-1140.
[16]杨志安,王光瑞,陈式刚.用等间距分格子法计算互信息函数确定延迟时间[J].计算物理, 1995, 12(4): 442-448.
[17] Cao L Y. Practical method for determining the minimum embedding dimension of a scalar time series[J]. Physica D: Nonlinear Phenomena, 1997, 110(1-2): 43-50.
[18] Chen B H, Li J P, Ding R Q. Nonlinear local Lyapunov exponent and atmospheric predictability research[J]. Science in China Series D: Earth Sciences, 2006, 49(10): 1111-1120.
[19]丁瑞强,李建平.误差非线性的增长理论及可预报性研究[J].大气科学, 2007, 31(4): 571-576.
Storm surge prediction method of neural network based on phase space reconstruction
YOU Cheng, YU Fu-jiang, YUAN Ye
(Key Laboratory of Research on Marine Hazards Forecasting, National Marine Environmental Forecasting Center, Beijing 100081 China)
Abstract:Accurate prediction of storm surge is significantly meaningful to the national production and disaster prevention and mitigation. The storm surge prediction model of BP neural network based on phase space was purposed in this paper, through combining reconstruction phase space with BP neural network. A phase space is reconstructed with the storm surge data and fitted with BP neural network model. The model is used to predict storm surge in Cuxhaven. The result of calculation shows the model is feasible, reasonable and highly precise. The prediction accuracy can been markedly improved through data de-noising.
Key words:phase space reconstruction; BP neural network; storm surge prediction; wavelet de-noising
作者简介:尤成(1990-),男,硕士,主要从事基于相空间重构的预测方法研究。E-mail: puguan@yeah.net
基金项目:杭州湾海洋灾害精细化预报系统(2013BAB04B02)。
收稿日期:2015-01-16
中图分类号:P731.23
文献标识码:A
文章编号:1003-0239(2016)01-0059-06