基于遥感卫星组网观测的海洋环境预报技术

2021-08-10 08:27王际朝耿逍懿丁效华刘官厅史振威
关键词:风暴潮海浪台风

王际朝, 耿逍懿, 丁效华, 王 晶, 刘官厅, 史振威

(1.中国石油大学(华东) 理学院,山东 青岛 266580; 2.北京航空航天大学 宇航学院图像处理中心,北京 100083;3.哈尔滨工业大学(威海) 理学院,山东 威海 264209; 4.中国海洋大学 信息科学与工程学院,山东 青岛 266100; 5.内蒙古师范大学 应用数学中心,内蒙古 呼和浩特 010022;6.内蒙古师范大学 数学科学学院,内蒙古 呼和浩特010022)

海洋环境预报技术是指对台风、风暴潮、海浪、海流和内波传播等海洋环境要素的发展和变化进行预报。台风对经济发展和民众安全危害极大。减轻台风灾害影响的关键在于台风预报能力的提升[1]。风暴潮具有数小时至数天的周期,而风浪、涌浪具有数秒或十几秒的周期,三者结合引起的沿岸海水暴涨常酿成巨大灾害,称为风暴潮灾害或潮灾[2]。海浪不仅在航海运输、防灾减灾等领域中具有重要地位,而且在海气相互作用和海洋动力环境等研究热点中亦发挥着举足轻重的作用。海洋内孤立波在传播过程中会产生强烈的垂向剪切力,对海上交通运输以及石油平台、电缆等海洋建筑工程产生巨大威胁。对这些海洋环境要素的发展和变化进行预报,能极大减少人员伤害和经济损失,具有重要的现实意义。此外,我国80%以上的对外贸易和90%以上的石油等物资均须通过海峡通道和需求支点运输和转运,其建设直接关乎国家利益,牵动国际格局的发展。因此,针对海峡通道和支点的海浪和海流数据同化精细预报具有重要意义。

现代天气预报是以数值预报模式为基础的综合预报,台风预报同样主要依靠数值预报模式[3]。然而,随着庞大的数据和统计建模的快速发展,台风数值预报模式性能没有得到提升,但提供了从数据层面驱动台风预报发展的可能性[4],因此各类神经网络也开始应用于台风预报。1991年,Pickle[5]首次使用神经网络进行台风路径预报,随后,遗传神经网络、模糊神经网络等结构也被用于解决台风预报问题[6-8]。自Elman[9]提出循环神经网络(RNN)以来,深度学习领域出现了解决时序问题的网络结构,神经网络预报台风的方法也更加倾向于充分利用台风时序信息。Gao等[10]提出使用长短时记忆神经网络(LSTM)预报台风路径。

风暴潮预报方法主要分为统计预报方法和数值预报方法。统计预报方法简单实用,但必须依赖预报站长期的验潮资料、增水资料和相应的气象资料,否则就不能建立稳定可靠的经验关系。我国科学家于20世纪80至90年代引进并建立了以飓风风暴潮数值预报模式为基础的风暴潮预报业务系统。然而,基于主观经验和数值的传统预报操作复杂难懂,通常需要研究员对风暴潮的动力学规律进行深入研究。随着计算机技术的发展和大数据时代的到来,雷森等[11]将基于海量数据的机器学习方法用于风暴潮预报中; Lee[12]将风速、风向等要素作为输入,利用前馈神经网络进行预测; Rajasekaran等[13]使用支持向量回归对其进行预报。

完整的海洋环境预报模式主要由数值模式、资料同化方法以及观测数据组成。海洋数值模式在全球海洋动力环境预报中发挥重要作用。WAMDI小组于1988年建立了第一个业务化的第三代海浪模式WAM。袁业立等[14]在控制方程中考虑了浪流相互作用,发展了LAGFD-WAM海浪模式; 杨永增等[15]在LAGFD-WAM的基础上,发展了MUSNUM数值模式; Tolman等[16]基于WAM模式发展了WAVEWATCH III (WW3)模式,对全球及区域海洋进行海浪模拟和预报。海流数值模式较好的应用于海洋领域的基础研究并向精确预测方向发展。POM(princeton ocean model)是一个三维斜压原始方程数值海洋模式,被广泛应用于河口、近岸海洋模式[17]。FVCOM(the unstructured grid finite volume coastal ocean model)结合了有限元方法的自由几何拟合特性和有限差分的离散结构,具有简单且计算高效的特性,在研究数值收敛和确定模型区域时需要最小空间分辨率[18]。

本文以LSTM、堆叠自编码器等深度学习方法,学习台风、风暴潮与灾害性海浪的历史数据,构造相应的大数据预报技术,并基于MITgcm模式建立安达曼海内孤立波数值计算模型。以霍尔木兹、马六甲和斯里兰卡为三个示范区域,利用卫星组网联合志愿船系统获取的高时空分辨率海表面风场、海浪、水深和岸线数据,采用WW3海浪模式和EnOI同化方法构建海域的海浪同化精细化预报模式,利用FVCOM模式构建海域海流同化精细预报技术,从而为海峡通道和支点的海洋环境提供安全保障,支持我国的海洋强国和参与全球海洋治理的国家政策。

1 预报技术

1.1 大数据预报技术

在深度学习领域,常用于解决时序预测问题的网络结构是RNN及其改进变体。它将隐层之间的节点相互连接,使得隐层的输入与当前时刻输入层的输出和上一时刻隐层的输出有关。

ht=f(WTxt+UTht-1+bh),

(1)

其中:W和U表示相应层之间的连接权重;bh为偏置;xt和ht分别表示t时刻的输入和隐层输出;ht-1为t-1时刻隐层的输出。激活函数f一般是双曲正切函数或者Relu函数。若隐层包含m个神经元,则隐层之间权重矩阵的维数为m×m。模型在反向传递时,误差将不断乘以权重W,如果W<1(W>1),则在后续的迭代更新中将得到一个接近于零(无穷)的误差,从而造成梯度消失(梯度爆炸)导致RNN无法记住长时间信息。

为了拟合长期时序数据,LSTM结构被提出。差异在于RNN的循环模块非常简单,隐层中只有隐含状态ht用来储存所有的信息,而LSTM的循环结构则是通过门控装置(遗忘门ft、输入门it和输出门ot)选择性的存储信息,从而实现长期记忆。LSTM内部结构信息的传递是依据输入层的输出和上一时刻隐层的输出决定信息的保留和遗忘。在每一时刻从输入层输入的信息将首先经过输入门it,判断是否会有信息输入记忆单元ct-1,随后ft将确认ct-1里的值是否被遗忘,最后ot决定是否有信息从ct-1输出。

编解码结构一般指Seq2seq模型。从概率的角度看,该模型实际上是在学习输入序列情况下,输出序列的条件概率,其中输入与输出的序列长度可以是不同的。对于编码器,其隐状态更新为ht=f(ht-1,xt),在读完整个输入序列{x1,x2,…,xT}后,就可得到序列编码c。对于解码器,其隐状态更新不仅依赖于上一时刻的隐状态,还取决于输入序列编码c及上一时刻的解码输出yt-1,其状态更新为ht=f(ht-1,yt-1,c)。值得注意的是,在本文中,编解码结构单元均采用LSTM结构,用于缓解梯度消失现象。

1.2 同化预报技术

1.2.1 海浪数值模式 WAVEWATCH-III (WW3)是全谱空间上的第三代海浪模式,它的控制方程中包括了因平均水深和平均流场(潮、巨涌等)的时空变化而导致的海浪场的折射和变形,也包含了由于非线性相互作用、风应力、耗散和底摩擦等所导致的波浪成长和消衰。在WW3模式中,波的传播考虑为线性的,相关的非线性效应则被包含在源函数项中,而且此模式包含了一个完整的非线性相互作用选项,对“Garden Sprinkler”效应也进行了处理。此外,此模式用标准FORTRAN 90编写,完全模块化,易于实现并行计算,同时用一阶精度(一阶迎风格式)和三阶精度(ULTIMATE QUICKEST)的数值方案来描述波浪的传播。

在WW3模式中,真正参与计算的是由波数方向谱F(k,θ)转换得到的波作用密度谱N(k,θ)≡F(k,θ)/σ。这样,海浪传播的控制方程为

DN/Dt=S/σ,

(2)

其中: D/Dt表示全导数;S表示与海浪谱F有关的源和汇的净效应。

WW3模式的源函数项为

S=Sln+Sin+Snl+Sds+Sbot+Sdb+Str+Ssc+Sxx,

(3)

等式右端依次表示为线性输入项Sln、风-浪相互作用项(输入项)Sin、波-波非线性相互作用项Snl、耗散项Sds、底摩擦项Sbot、浅水情况下的水深致波浪破碎项Sdb、浅水情况下的Str、底散射项Ssc和一个自由项Sxx。

1.2.2 海洋数值模式 FVCOM是一个集海洋预报、无结构三角形网格架构、有限体积、自由表面、三维原始方程海洋数值模式,用Mellor-Yamada 2.5阶垂向湍流闭合模型及Smagorinsky水平湍流闭合模型对方程组进行闭合。主要控制方程包括[20]动量方程

(4)

(5)

动力方程

(6)

连续方程

(7)

温度扩散方程

(8)

盐度扩散方程

(9)

状态方程

ρ=ρ(T,S)。

(10)

其中:x、y、z分别为Cartesian直角坐标系的东、北和垂直方向的坐标;u、v、w分别为x、y、z方向上的速度分量;T为海水温度;S为海水盐度;ρ为海水密度;P为压强;f为科氏力系数;g为重力加速度;Km为垂直涡旋粘性系数;Kh为垂直热力扩散系数;Fu和Fv为水平动量,FT和FS分别为热力和盐度扩散项。

FVCOM模型在垂向上适用坐标系或通用垂向坐标系对不规则底部地形进行拟合,在水平上利用无结构三角形网格对水平计算区域进行空间离散,可以拟合复杂的边界与进行局部加密。该模型能更好地保证复杂几何结构的河口海湾及海洋计算中的质量、动量、盐度、温度及热量的守恒性[21]。FVCOM包含了多种物理、水质、生态计算模块,基于Fortran 90/95标准,可以在共享内存及分布式内存多计算节点的高性能计算机上实现并行快速模拟。

1.2.3 数据同化方法 海洋中的数据同化方法主要包括最优插值、集合卡尔曼滤波、三维/四维变分及其各类变种方法。本文在进行海浪同化模式构建时采用了一种简单高效、复杂度低的数据同化方法,即集合最优插值(EnOI)方法。

最优插值方法(OI)是一种顺序同化方法,自20世纪60年代开始就广泛应用在大气模式和海浪模式中。OI方法历经几十年的发展,在大气和海洋的数据同化中仍然具有非常强的生命力。卡尔曼滤波最早由Kalman于1960年提出,该方法是以分析误差的最小方差为最优标准,在假设系统是线性的,噪音是白色、高斯型的条件下的一种递归资料处理方法。它的基本思想是: 首先进行模式状态的预报; 接着引入观测资料; 然后根据观测资料对模式状态进行重新分析。

集合最优插值(EnOI)方法是最优插值方法的改进,是集合卡尔曼滤波方法的简化,其特点在于背景误差协方差矩阵由静态样本计算得到,在应用中较为简单,可大大降低计算量,从而提高同化效率。EnOI同化方法的分析方程为

xa=xb+K(xo-Hxb),

(11)

K=BHT(HBHT+R)-1。

(12)

其中:xa,xb分别为有效波高的分析场和背景场;K为增益矩阵;xo为观测值;H为观测算子;B为背景误差协方差矩阵;R为观测误差协方差矩阵。集合静态样本的构建,可采用逐日24 h预报和72 h预报场之差作为样本集合,并以此作为背景场的最佳估计[22-24]。集合样本的采样方式决定了背景误差协方差矩阵的构造,进而影响同化的效果。

2 预报结果与分析

利用LSTM方法,基于北印度洋台风最佳路径数据集和中心气象预报再分析数据集,分别直接和间接(通过预报移动速度)预报台风路径,并集成两者预报结果,实现时效为24 h的台风路径预报。本文选用1979-2010年间141个台风作为训练数据,2011-2014年间19个台风作为验证数据,2015-2018年间16个台风作为测试数据。结果显示集成预报的误差总是小于单一模型预报误差,说明了本预报方法的有效性。

针对西北太平洋台风时序数据与环境场空间再分析数据,设计了时序-气压场联合编码网络。在编码部分,使用LSTM模块对持续性因子进行时序编码,并采用3D卷积对气旋周围位势高度进行时空编码。在解码部分,设计另一个LSTM模块实现对未来多个时效的迭代预测。本文选用1979-2008年间723个台风作为训练数据,2009-2013年间104个台风作为验证数据,2014-2018年间113个台风作为测试数据。如果仅考虑强热带风暴及以上级别的样本,则24 h预报时效下的平均距离误差可以降至106.96 km。

针对风暴潮的预报,本文提出了深度LSTM预报技术,选取山东潍坊水站2008-2013年记录的31个增水过程作为训练数据,2014年记录的5个增水过程作为测试数据。以3 h预测结果为例,相比于前馈神经网络,深度LSTM的预测结果更加接近真实的观测值且相对平滑。

以安达曼海南部(6.08°N,94.6°~97.1°E)作为研究对象,将地形、温度、盐度和潮汐等数据输入到MITgcm模式中,运用全球潮汐模式TPXO 7.2模拟计算得到了11 328条内孤立波,其中75%为训练数据,25%为检验数据。运用支持向量机和LSTM方法对到达时间,位置和振幅进行预测。支持向量机方法对于时间和位置的预测效果较好,而对于振幅预测,LSTM表现更佳。

基于WW3海浪模式和EnOI同化方法构建了海浪同化精细化预报模式。海浪模式采用三层嵌套,最外层采用矩形经纬度网格,经纬度范围为35°~120°E、35°S~35°N,模式分辨率为0.5°×0.5°; 中间层亦采用矩形经纬度网格,经纬度范围为45°~111°E、10°S~30.5°N,模式分辨率为0.125°×0.125°; 内层为三个独立的示范区域,分别是霍尔木兹、斯里兰卡和马六甲海峡,经纬度范围分别为95°~105°E、0°~7°N,76.5°~84°E、3.5°~12°N和47°~62°E、22°~30.5°N。采用WRF提供的空间分辨率为0.25°×0.25°、时间分辨率为1 h的预报海表面风场作为模式的强迫场。本文以Jason-3、Sentinel-3和CFOSAT高度计有效波高数据为同化数据源,采用EnOI数据同化方法,建立了海峡通道和需求支点海域的高精度、高分辨率的海浪同化预报模式,三个示范区采用非结构网格,网格空间分辨率优于1′,预报时效达72 h,有效波高12 h预报的均方根误差相比于浮标数据为0.43 m。同时基于FVCOM海洋模式建立了三个示范区的海流精细化同化预报模式,制作了高精度、高分辨率的海流预报产品。

3 结论与讨论

本文针对海峡通道和支点的海洋环境安全保障对台风、风暴潮、海浪、海流和内波传播等海洋环境精细预报需求,分别展开了基于大数据技术的台风、风暴潮与灾害性海浪、内波传播预报技术和基于数值预报模式的海浪和海流同化精细预报技术的研究。基于海洋大数据,诸如支持向量机、LSTM、堆叠自编码器等深度学习方法具备台风、风暴潮与灾害性海浪等海洋动力环境的预报能力。基于海洋数值预报模式和数据同化方法,联合卫星组网观测的海洋动力环境数据,可对海峡通道和需求支点的海浪、海流等海洋动力要素进行精细化预报,获得高精度、高分辨率、高时效的预报产品。基于大数据的预报技术和基于数值模式的预报技术均可为海洋环境安全保障提供技术支持,为海洋防灾减灾、海上航行安全等提供预报产品的数据支撑。

猜你喜欢
风暴潮海浪台风
台风过韩
风暴潮灾害风险制图研究
丫丫和小海浪
海浪
沧州沿岸风暴潮变化特征分析
樊应举
台风来了
海底预言家
飓风的杀手锏
台风天外出小心