孙 文,王庆宾,周 睿,朱志大,杜伟超
(1. 信息工程大学 地理空间信息学院,河南 郑州 450052; 2. 65015部队,辽宁 大连 116023)
海平面变化主要由三方面因素引起:陆地和冰山水系的补充、海水温度的变更及海底构造的变化,这些因素将造成海平面高度呈区域性周期振荡及全球性上涨的趋势。海平面异常(sea level anomaly,SLA)是由实时海平面扣除平均海平面得到,而对其进行精确预报能够为海洋气候变化预测提供重要参考。现有的预报算法主要有:时间序列分析方法、神经网络算法、支持向量机方法,以及这些方法的组合等。文献[1]基于遗传算法利用验潮站数据对澳大利亚西部海域的海平面进行了预报研究,并与神经网络算法进行了比较分析;文献[2-3]探讨了遗传算法在预报海洋表面温度和海洋风速场方面的应用;文献[4-5]基于AR模型对全球平均海平面和格网海平面异常进行了预报,并重点研究了该模型在预报厄尔尼诺和拉尼娜现象方面的应用效果。国内的研究热点主要集中在海面温度及风速场的预报[6-9],对于SLA预报研究的相关文献与论述较少。为此,本文在总结多种时间序列预报方法的基础上,对各种方法在SLA预报方面的实际应用效果作了比较分析,以期能够为SLA预报研究提供有益参考。
人工神经网络(artificial neural network,ANN)是通过模拟生物神经元的非线性映射功能对实际问题进行处理的一种方法,具有超强的适应能力和学习能力。其中,BP神经网络是目前应用较为成熟的神经网络。典型的BP神经网络由输入层、隐含层和输出层构成。其中,设输入层有M个节点,隐含层有K个节点,输出层有N个节点,如第i个神经元的输入为xi,则隐含层各节点的输入表示为
(1)
(2)
式中,ωik、ωkj为各层之间的连接权值。当uj与实际输入信号xi误差达到足够小时,则认为该网络收敛,完成训练。
支持向量机(support vector machine,SVM)回归的基本原理是将输入矢量通过非线性的映像函数映射到一个高维的特征矢量,然后再在这个空间内做线性回归。设样本集为(xi,yi),在高维特征空间构造其线性回归模型为
f(x)=〈ω,φ(x)〉+b
(3)
式中,ω、b分别为待求参数。根据SVM理论,上述线性回归问题可以转化为如下约束优化问题
(4)
式中,εi=yi-f(xi);C>0为惩罚因子。
最终,SVM回归模型可以表示为
(5)
式中,K(x,xi)为核函数,常用的核函数为径向基函数(RBF)
(6)
若平稳序列{Xt}满足
(7)
式中,a0=b0=1,εt:N(0,σ2)为白噪声序列,则称其为自回归滑动平均序列(auto-regressive and moving average,ARMA),简称为ARMA(p,q)序列,式(7)称为ARMA(p,q)模型。p为AR模型的阶数,q为MA模型的阶数。应用ARMA模型的关键在于其阶数(p,q)的确定,文献[12-13]对此有详细论述,不再赘述。确定了模型阶数,即可根据式(7)对序列进行回归分析。
摆动灰色模型(undulating grey model,UGM)可以表示为
(8)
式中,a、b分别称为灰作用量与发展系数,可依据最小二乘准则求出;x0(k)为原始序列;c、d为待定系数;ωi为信号中包含的频率参数;z0(k)为均值序列,其中
z0(k)=x0(k+1)+x0(k)/2,k>1
(9)
利用UGM理论对原始序列的累加求和序列进行估值
(10)
算例中的数据采用法国AVISO中心发布的DT SLA数据,其中包括TP、Jason-1及Jason-2共992个周期卫星测高数据,时间跨度从1992年10月至2011年10月。试验区域选择北太平洋,包括0°—40°N、100°E—160°E之间的区域。数据的详细编辑准则参见文献[16]。将所有的SLA数据取空间平均,得到该区域SLA时间序列如图1所示。
图1 海平面异常时间序列
(11)
(12)
(13)
将图1中的时间序列分为两个部分:一部分数据作为预报算法的输入数据,另一部分数据用来检核预报结果的精度。文献[17]的成果表明,预报海平面异常的输入数据时间范围应不小于162个TP周期,约为4.4年。下面以图1中的前1至165个周期作为输入数据,用上述4种预报算法对两年时间内(约等于72个TP周期)该区域的SLA进行预报。
对于不同的算法,采用不同的参数值,所得到的预报结果可能不尽相同。表1列出了上述算法中部分重要参数的取值(其中SVM惩罚因子通过交叉验证的方法得到)。
表1 各方法主要参数设置
值得说明的是,由于UGM方法的累加求和序列必须满足单调增的条件,因此说明该方法只能对正值作预测,故需要在预测之前对数据进行归一化处理,然后将得到的预报值再进行反归一化,此即最终的预报值。将数据{x}归一化到[0,1]区间值{y}的方法为
y=(x-xmin)/(xmax-xmin)
(14)
将归一化后的数据作为输入数据,采用表1中的参数值,最终各方法的预报结果、绝对误差及相对误差示意图分别如图2、图3和图4所示。
图2 各方法预报值与真值比较图
图3 各方法预报值的绝对误差
图4 各方法预报值的相对误差
表2列出了4种方法的预报精度统计结果。
表2 预报值精度统计
由图2、图3、图4及表2可以看出,相比另外3种方法,人工神经网络方法的预报结果精度较高,无论是最大误差或均方根值,均有较大优势,这充分说明了该方法具有良好的适应性和泛化能力,但ANN方法存在的缺点是其运算耗时较大,若预报的实时性要求较高,则不能采用。另外,表2中的平均相对误差统计结果表明,SVM方法效果最好,这说明该方法预报结果与真值的相对接近程度是最优的,这从图2中也可以得出相同结论。
另外,UGM方法的优势在于少量数据的建模与预测[13],且由于其运算大多为多项式运算,计算量较小,但当数据量较大时其劣势表现得较为明显:需已知信号中包含的频率参数且精度相对较低。这说明该方法泛化能力较弱,当数据量足够时,不宜采用。而ARMA预报结果与真值相比偏大,精度略高于UGM方法,当精度要求较低时可以采用。
本文总结了多种时间序列预报方法,并利用太平洋地区SLA数据对这些方法的实际预报效果进行了比较与分析。结果表明,人工神经网络方法具有较好的适应性和泛化能力,其预报结果相对于其他3种算法精度较高;从图2中可以看出,当预报时间长度较短时(如半年以下),4种方法的结果差别较小,均能够以亚厘米级精度对SLA作出预报;而当预报时间较长时,应根据精度与效率的要求采用更高精度和效率的算法。
参考文献:
[1] MOHAMMAD A G, RAHMAN K, ALI A, et al. Sea Water Level Forecasting Using Genetic Programming and Comparing the Performance with Artificial Neural Networks[J]. Computers & Geosciences, 2010, 36(5):620-627.
[2] ALVAREZ A, LOPEZ C, RIERA M, et al. Forecasting the SST Space-time Variability of the Alboran Sea with Genetic Algorithms[J]. Geophysics Research Letter, 2000, 27(17): 2709-2712.
[3] RASHMI S, ABHIJIT S, NEERAJ A, et al. A New Technique for Forecasting Surface Wind Field from Scatterometer Observations: A Case Study for the Arabian Sea[J]. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(3): 613-620.
[4] NIEDZIELSKI T, KOSEK W. Multivariate Stochastic Prediction of the Global Mean Sea Level Anomalies Based on TOPEX/Poseidon Satellite Altimetry[J]. Artificial Satellite, 2005, 40(3): 185-198.
[5] NIEDZIELSKI T, KOSEK W. Forecasting Sea Level Anomalies from TOPEX/Poseidon and Jason-1 Satellite Altimetry[J]. Journal of Geodesy, 2009, 83(5):469-476.
[6] 李祚泳,邓新民. 人工神经网络在台风预报中的应用初探[J]. 自然灾害学报, 1995, 4(2): 86-90.
[7] 冯利华. ANN在海洋预报中的应用[J]. 海洋预报, 2000, 17(2): 49-55.
[8] 陈璇,游小宝,周广庆,等. 基于权重调整的BP神经网络在Nino区海温预报中的应用[J]. 海洋预报, 2011, 28(5): 61-68.
[9] 顾锦荣,刘华强,刘向陪,等. 基于遗传算法-支持向量机模型在热带气旋强度预报中的应用[J]. 海洋预报, 2011, 28(3): 8-14.
[10] 郭文斌, 朱自强, 鲁光银. 重力异常的BP神经网络三维物性反演[J]. 地球物理学进展, 2012, 27(2): 409-414.
[11] 李恩颖, 王琥, 李光耀. 基于支持向量机回归的材料参数反求方法[J]. 机械工程学报, 2012, 48(6): 90-95.
[12] BROERSEN P M T.Automatic Autocorrelation and Spectral Analysis[M].London:Springer-Verlag,2006.
[13] BROERSEN P M T. Automatic Spectral Analysis with Time Series Models[J]. IEEE Transactions on Instrumentation and Measurement, 2002, 51(2), 211-216.
[14] CUI Y D, ZHANG D, SUN H L. UGM Based Internet Traffic Prediction[C]∥Proceedings of IC-BNMT.Beijing:[s.n.],2009.
[15] 邓聚龙. 灰色系统基本方法[M]. 武汉: 华中科技大学出版社, 2005.
[16] WEINTRIT A. Advances in Marine Navigation and Safety of Sea Transportation[M].Polana:Gdynia Maritime University, 2007:367-371.