一种基于深度学习的热带气旋路径集成预报方法

2022-03-23 11:31耿逍懿史振威

海洋科学 2022年2期

耿逍懿, 郝坤, 史振威

耿逍懿, 郝坤, 史振威

(北京航空航天大学宇航学院图像处理中心, 北京 100083)

本文提出了一种基于深度学习的热带气旋(tropical cyclone, TC)路径集成预报方法。该方法以长短期记忆深度网络为模型构架, 利用前4个时刻(24 h, 间隔6 h)及当前时刻的TC路径记录, 以及由不同环境因素所计算的方向预报因子作为输入, 分别直接预报和间接(通过预报移动速度)预报路径, 集成两者预报结果实现时效为24 h的TC路径预报。试验部分使用不同环境因素所对应方向预报因子进行预报, 进而探究在该模型中影响TC路径预报的环境因素。结果表明, 经纬向风场所计算的方向预报因子对模型预报性能提升较为明显, 而海表温度、高度的方向预报因子对性能提升相对较小。此外, 将不同方向预报因子的预报模型进一步集成, 可以提升预报精度。上述结果验证了本文所提出的方向预报因子、集成方法在TC路径预报问题中的有效性。

热带气旋路径; 集成预报; 深度学习; 长短期记忆网络; 方向预报因子

热带气旋(tropic cyclone, TC)是一种发生于热带和副热带洋面上的中尺度天气系统, 常伴随着巨浪、风暴潮、强风及暴雨等灾害现象, 具有强破坏性, 且影响范围广泛, 是地球上最严重的气象灾害之一[1]。北印度洋泛指印度洋的北半球部分, 平均每年约有9个TC在其洋面上生成[2]。北印度洋连接太平洋和大西洋, 是“海上丝绸之路”的关键通道, 具有重要的地理位置和政治地位。此外, 北印度洋TC也常对我国造成影响[3]。因此, 研究北印度洋TC, 减轻其灾害影响, 重点关注“海上丝绸之路”战略通道的海洋环境安全, 具有重要的实际意义。

减轻TC影响及危害的关键问题在于预报能力的提升[4]。TC预报主要包括三个方面: 路径预报、强度预报以及风雨预报。TC路径预报是强度、风雨等预报的基础[5], 准确的路径预报可以有效提升预报服务水平, 协助受影响地区政府及民众做好防范措施, 有效减少经济损失和人员伤亡。近年来, TC数值模式不断完善, 集合预报和多模式集成预报技术逐步发展, TC路径预报精度得到了大幅提升[6-7]。其中, 集成预报技术综合集成多种预报模式, 可以有效提高预报准确率[8-9], 是未来预报技术的主要发展方向之一。

随着气象观测技术的发展, TC记录及各类气象资料构成了庞大的数据源, 为了从海量数据中挖掘TC发展机制、探索新的预报方法, 将深度学习方法应用于TC预报逐渐成为专家学者们关注的热点[10-11]。1991年, Pickle[12]首次使用神经网络解决TC路径预报问题。随后, 混合径向基网络、循环神经网络等结构也被应用于TC预报问题[13-18]。考虑到预报因子对TC发展演变的重要作用, 如动力学因子等, Giffard- Roisin等[19]、郝坤等[20]等使用卷积神经网络对台风周围风场等环境场提取特征, 结合TC历史记录, 实现TC路径、强度的预报。此外, 由于集成预报在数值预报中逐步推广应用, 基于深度学习的TC集成预报也逐渐受到关注[21]。黄小燕等[22]基于主成分分析和进化遗传神经网络, 建立了TC路径集成预报模型; 朱雷[23]提出了基于贝叶斯神经网络结合Bagging委员会的TC路径集成预报模型。研究表明, 基于深度学习的集成预报方法相较于单个神经网络预报个体可以取得更好更稳定的预报效果。

前人的研究开拓了基于深度学习的集成预报方法在TC预报问题中的应用。本文在前述研究基础上, 聚焦于北印度洋TC的路径预报, 提出了一种深度学习TC路径集成预报方法。鉴于长短期记忆神经网络(Long Short-Term Memory, LSTM)在时序数据预测问题中的优异表现, 本文以LSTM为基础网络结构。整体方法以前4个时刻(24 h, 间隔6 h)及当前时刻(共计5个时刻)的TC路径记录为数据驱动, 结合方向预报因子作为模型输入。方向预报因子的计算过程是首先将TC附近一定范围内各类环境场划分不同的方向区域, 再分别求取其各区域的对应环境影响因子。因此, 在预报模型中输入上述方向预报因子相当于在预报过程中结合环境影响因子, 从而可以利用环境因素辅助预报。考虑到在本方法中对环境因子的使用是按照不同方向划分区域后分别计算, 再输入预报模型, 故称之为方向预报因子。最后, 本文借鉴集成预报的思路, 分别对TC路径直接预报, 以及通过预报TC移动速度间接预报路径, 将二者集成得到最终预报结果, 实现预报时效为24小时的路径预报，并通过试验验证了上述方向预报因子、集成方法在TC路径预报问题中的有效性。

1 数据与处理

1.1 数据来源

本文所研究范围为北印度洋TC, 使用了以下两个数据集:

a) 联合台风警报中心(Joint Typhoon Warning Center, JTWC)所记录整理的北印度洋台风最佳路径(North Indian Ocean - Best Track, NIO-BST)数据集[24];

b) 美国国家环境预报中心(National Centers for Environmental Prediction, NCEP)所提供的气象预报再分析(Climate Forecast System Reanalysis, CFSR)数据集[25-26]的客观分析场资料。

NIO-BST数据集记录了从1971年至今, 北印度洋TC的最佳路径数据。数据内容包括记录的时间点、TC中心经纬度、TC强度等。该数据集时间分辨率为6 h, 即每天的0时、6时、12时和18时; 其空间分辨率为0.1°×0.1°, 即经纬度坐标值精度为0.1。

CFSR数据集记录了1979年至今, 全球范围内与气象相关的物理量, 如经纬度方向风速、温度等。CFSR数据是GRIB2格点数据, 其空间分辨率为0.05°× 0.05°。该数据集时间分辨率和记录时刻与NIO-BST数据集相同, 这方便了后续处理中的时序配准。

对于热带气旋, CFSR数据集可以提供TC附近一定空间范围内的物理量场, 即环境因素, 如不同等压面的风场、位势高度场等。如图1所示, 是北印度洋区域中关键通道——马六甲海峡于1979年1月1日0时850 hPa等压面下的风矢量图。

图1 1979年1月1日0时马六甲海峡风矢量图(850 hPa)

1.2 数据筛选与时空匹配

NIO-BST数据集与CFSR数据集在时间、空间范围上有所不同, 需要将二者在时空上进行匹配。本文选用了1979年至2018年间, 北印度洋TC最佳路径及CFSR数据。

NIO-BST数据需要进行筛选。由于观测和分析的技术限制, 较弱TC的记录精度较低[27], 且其发展时间一般较短, 因此, 对NIO-BST数据记录长度进行筛选, 删除发展时间较短的TC(少于3 d, 对应13个记录点)。此外, NIO-BST数据中包含有时间间隔为3 h的记录, 为了保持时间步长一致性, 删除相应记录。根据筛选后NIO-BST数据中的TC记录, 整理CFSR数据中所对应的时间点, 实现两类数据的时间匹配。

本文使用CFSR数据来描述TC周围的环境因素。TC的发展过程十分复杂, 其路径发展不仅取决于TC内部动力因素, 还受其周围环境因素的影响[28]。描述环境因素需要确定合适的空间范围, 范围过大影响模型的计算效率, 过小则导致所包含信息不足。本文选择的空间范围为经纬度40°E×40°N, 具体选取方式如图2所示, 蓝色曲线为TC路径, 以当前时刻TC风眼(橙色点)为中心, 划定窗口(实线红色矩形区域)即为所选取的当前TC对应的环境范围。通过上述操作实现了两类数据的空间匹配。

图2 TC背景环境的划分示意图

注: D0、D1、D2、D3和D4分别代表TC所在区域、东北方向区域、西北方向区域、西南方向区域和东南方向区域

1.3 适配LSTM的样本数据整理

本文中所用到的深度网络以LSTM为基本架构, 因此需要将TC数据整理为LSTM所适配的输入形式, 即时序样本和标签, 样本为当前时刻之前4个时刻(24 h, 间隔6 h)及当前时刻的TC数据, 标签为当前时刻24 h后的TC路径记录。

对于NIO-BST数据集中的每条TC记录, 定义其BST数据为:

其中, 下标代表时间点,为TC长度。NIO-BST数据为多元时序数据, 所包含变量分别为年份()、月份()、日期()、时刻(), TC中心的纬度(Lat)、经度(Long)以及强度(), 如下所示:

对于CFSR数据集, 对应BST的各时间点, 有如下定义:

其中,代表不同等压面的经纬度风、位势高度或海平面温度等物理量, 试验部分会展示选用不同物理量的预报结果。

图3 时刻t的输入样本和标签

对于数据集中选用的所有TC, 使用上述方法构造样本和标签, 得到全部样本标签的集合。

2 TC路径的集成预报

2.1 基于LSTM的深度学习方法

使用深度学习方法预报TC路径, 其关键在于, 根据TC历史记录和环境因素, 得到拟合TC路径演变的深度网络模型, 并据此进行趋势外推, 最终得到路径预报结果, 其本质是时序预测问题。深度学习领域, 常用于解决时序预测问题的网络结构是循环神经网络及其改进变体。

Elman[29]于1990年第一次提出循环神经网络(Recurrent Neural Networks, RNN), 其循环模块是RNN区别于其他神经网络的本质, 也是其适用于时序预测问题的关键[30], 如图4所示。

为了拟合长期时序数据, Hochreiter等[31]以RNN为基础进行改进, 提出了LSTM结构。LSTM与RNN的区别在于循环模块的结构。RNN的循环模块非常简单, 而LSTM的循环结构则复杂得多, 如图5所示, 通过遗忘门、输入门和输出门控制记忆状态和隐含状态的更新, 从而实现长期记忆。

图4 RNN网络结构

图5 LSTM循环结构

考虑到LSTM适合于长期时序数据的处理, 以及其优异的性能表现, 本文选用LSTM作为TC路径预报模型的基本网络结构, 输入TC数据得到LSTM的记忆状态和隐层状态, 再通过2层全连接层(Fully Connected Layer, FC)进行计算得到预报结果。

2.2 LSTM中方向预报因子的计算

上述基于LSTM的TC路径预报方法仅使用BST, t作为输入, 尚未使用到TC的环境信息CFSR,t。由于CFSR, t与BST, t的数据形式、维度不同, 无法将二者直接串联输入LSTM。因此, 为了充分利用环境信息, 本文引入了方向预报因子以辅助TC路径的预报。

首先, 将TC的背景环境(图2中虚线所示)划分为不同区域。图中D0代表TC所在区域, 考虑到发展成熟的TC, 其7级风圈半径一般为300 km左右, 最大能达到近800 km[32], 因此将D0的范围大小设为经纬度10°E×10°N。如前所述, 图中红色实线的区域大小为经纬度40°E×40°N, 其余的主要区域分别命名为东北方向区域(D1)、西北方向区域(D2)、西南方向区域(D3)、东南方向区域(D4)。考虑到D1至D4区域面积大于其间矩形区域的面积, 且认为北方向区域一定程度上可以由东北方向区域和西北方向区域表示, 以此类推; 以及模型输入维度和模型复杂度、计算量的正相关性, 因此为简化模型及减少计算量, 本文中仅选用D1—D4区域计算方向预报因子, 即对各区域的环境因素(不同等压面的经纬度风速、位势高度值等资料, 具体内容请见试验设计部分)数值分别求取平均值, 即为方向预报因子, 针对不同的环境因素, 可以分别求得对应的方向预报因子, 如850 hPa经向风D1方向预报因子、850 hPa经向风D2方向预报因子等等。

对应每个时刻, 计算得到的方向预报因子是一个向量, 将其与BST, t串联, 一起输入TC路径预报网络, 使得在路径预报的过程中可以利用到TC背景范围内的环境信息。

中的方向预报因子, t将背景环境划分为不同的方向,, t中各元素的值与TC移动方向有着直接关联, 如风场的方向预报因子所代表的不同方向引导风流对TC移动方向起着关键性作用。因此, 方向预报因子可以为TC路径预报, 提供关于TC运动方向的更明确的指导信息。

最后, 将组织为网络输入的时序样本形式, 由–至时刻的组成, 即:

综上所述, 本文将CFSR中各物理量的背景环境划分为不同方向的区域, 并求取其方向预报因子, 从而给TC路径预报提供了充分的背景环境信息以及较为明确的预报方向信息。Giffard-Roisin等[19]、郝坤等[20]使用卷积神经网络(Convolutional Neural Network, CNN)提取环境信息的方法, 其得到的环境信息具体含义较为模糊, 不包含确切的方向信息; 而本文的方法既提供了明确的方向信息指导, 又节省了CNN的推理时间, 大大提升了计算效率。

2.3 联合移动速度预报的集成预报

在TC路径预报的工作中, 不论是数值预报还是深度学习方法, 大多数方法都是根据环境信息或历史数据直接预报未来路径, 这样的方法忽略了TC移动过程中速度具有时间连续性的先验信息。本文基于这样的考虑, 使用深度学习方法对TC移动速度进行预报, 再通过预报的移动速度计算, 得到预报路径。

集成预报方法是目前数值预报的主流发展方向[33-34]。TC的集成预报是采用多种数值预报模式, 建立集合成员共同预报TC[35]。借鉴这种集成预报的思想, 本文联合TC路径预报模型(TC-track)和TC移动速度预报模型(TC-velocity), 共同实现TC的路径集成预报。

TC-track的实现细节如前文所述, TC-velocity与TC-track的主体框架和数据处理方式是一致的, 区别在于TC-velocity的输入输出不是TC的路径位置, 而是相邻时间TC路径经纬度之差, 可以称之为速度。用公式表达如下所示:

TC-track和TC-velocity集成的预报模型示意图如图6所示。网络通过对TC的移动速度进行预报, 引入了移动速度时间连续性的先验信息, 再与TC路径预报结果集成, 有助于TC路径预报精度的提升。

2.4 TC路径集成预报的实施流程

整体来说, 本文的使用深度学习网络——LSTM对TC路径进行预报, 并使用方向预报因子为TC路径提供背景环境信息和方向指导信息, 通过预报移动速度引入了速度连续性的先验信息, 最后将TC-track和TC-velocity集成起来, 提升预报效果。每间隔6 h实现一次时效为24 h的TC路径预报。

表1展示了本文所提出的路径预报方法的整体流程。

表1 TC路径集成预报实施流程

3 TC路径集成预报试验

3.1 试验设计

CFSR数据包括与气象相关的各种物理量, 为了对比其不同环境场对本文集成预报模型预报性能的提升作用, 并从中选出最优模型, 本文筛选了与TC路径相关的部分环境场, 分别为850 hPa、700 hPa、500 hPa以及200 hPa等压面下的纬向风场(u-component of wind,Wind)、经向风场(v-component of wind,Wind)、位势高度场(geopotential height,Geo), 以及海面温度场(sea surface temperature,SS)、海平面高度场(sea surface heigh,SS)。其中, 考虑到风场由Wind和Wind共同描述, 将二者视为一类变量, 简写为Wind。

图7所展示的是, 1997年9月26日6时, 以强烈气旋风暴BOB 07风眼为中心, 经纬度40°E×40°N范围内, 不同等压面下的纬向风速大小。

利用前述的样本数据整理方式和方向预报因子计算方式, 整理NIO-BST数据集中所筛选出的TC及其对应时刻、对应位置的CFSR数据, 并对其中CFSR环境场分别计算对应的方向预报因子, 如风场(Wind)方向预报因子、海表温度(SST)方向预报因子等, 最终得到TC数据样本和标签的集合。

此外, 深度网络的训练需要将样本集合划分为三个独立的数据集, 即训练集、验证集、测试集, 三者比例常为8︰1︰1。考虑到TC具有时间属性, 且预报性能的评估常以年为单位[36], 因此按照年份划分, 具体情况如表2所示。

使用训练集的样本和标签对搭建好的TC-track和TC-velocity模型分别训练, 具体来说, 样本作为模型输入, 经过模型参数计算后得到模型输出, 即预报得到的24 h后TC路径, 计算其与标签之间的误差, 然后通过时间反向传播多次迭代训练优化模型参数。在训练过程中, 将验证集样本输入, 通过计算模型预报值和标签的差距以评估训练进程, 并挑选出最优模型作为预报模型。得到训练完成的模型后, 将TC-track和TC-velocity两模型集成, 输入测试集样本, 得到24 h后的路径预报结果, 与测试集标签对比, 评定模型性能。

图7 不同等压面纬向风速

表2 TC数据样本划分

模型评定所采用的指标为路径平均距离误差(mean distance error,MD),pred、real,pred、real分别是预测与真实的纬度、经度, 计算公式如下所示:

对应每个样本均有预报路径和标签(真实路径), 即可计算相应的路径预报误差。对测试集所有样本(2015—2018年北印度洋TC, 共计16个TC, 整理为280个样本)的预报误差求取统计值, 包括平均值、均方根误差、四分位数等, 并绘制箱型图, 对比评估所构建模型的性能。此外, 针对路径预报难点, 与外推法相比较进行模型预报结果分析; 使用稳定度指标[37]进行模型检验评估; 并与业务化预报的精度相对比。

本文中的TC路径预报模型使用python 3.6编程语言、PyTorch学习库搭建, 并使用GPU(Nvidia GeForce GTX 1080)加速训练。

3.2 试验结果

预报试验中所对比的方向预报因子及其对应的TC-track模型、TC-velocity模型以及集成模型在测试集上的24 h路径预报误差如表3所示, 其中, 预报误差使用两类统计量表示, 为测试集所有样本24 h路径预报误差的平均值和均方根, 简写为“平均值±均方根”的形式。预报误差平均值代表预报模型的总体精度, 数值越小表示预报精度越高; 均方根代表模型的预报稳定性, 数值越小表示对于不同的预报样本, 模型的预报性能越稳定; 预报精度和稳定性共同描述了模型的预报性能。序号1表示仅使用NIO-BST数据(即路径记录)作为输入而不使用方向预报因子的预报模型性能, 序号2—5分别表示使用了由不同环境场所计算得到的方向预报因子以及NIO- BST数据作为输入的预报模型性能。表格中对各方向预报因子中所用到的CFSR环境场进行了简写, 如850 hPa等压面的经纬度风场简写为Wind850, 以此类推。

表3 各环境因素方向预报因子的预报结果

从表3中可以看出, 各类方向预报因子对路径预报模型的性能提升有一定的作用。Wind方向预报因子对性能的提升较为明显, 即表中2号对应的预报误差最小,Geo方向预报因子次之, 而SS方向预报因子和SS方向预报因子对模型性能提升相对较小。不论对于何种方向预报因子, 集成预报的平均误差总是小于其对应的TC-track模型和TC-velocity模型预报误差, 这说明了集成预报方法的有效性, 可以提高模型的路径预报能力。为了更加直观地表示不同方向预报因子和集成方法对预报性能的提升, 用箱型图展示表3中各模型的统计量, 如图8所示。从图中可以看出, 使用不同方向预报因子的模型相较于第一组(未使用方向预报因子)均显示出一定的性能提升, 具体表现在预报误差上限降低、箱型位置靠下(大部分样本预报误差降低); 对于每组方向预报因子模型, 集成预报模型相较于TC-track和TC-velocity也有一定的提升。但是, 预报模型对部分样本存在误差较大的情况, 在图8中体现为误差最大值较大, 将会在后文章节3.3中进一步分析。

图8 各环境因素方向预报因子的预报结果箱型图

此外, 为了充分利用多种环境因素的方向预报因子, 本文以表3中的试验结果为参考, 将上述多种物理变量的TC- track和TC-velocity预报模型进行集成。

由于在表3中,Wind方向预报因子的集成模型取得了最好的预报结果, 因此, 在使用多个方向预报因子模型的过程中, 首先以Wind集成模型为基础, 集成其他方向预报因子的不同预报模型, 随后又组合其他方向预报因子的模型进行集成, 各集成模型的24 h路径预报误差如表4所示。

表4 多环境因素方向预报因子的预报结果

序号2至13对应模型的预报结果相较于无方向预报因子的模型(序号1, baseline)预报结果在预报精度、预报稳定性上均有一定的提升。其中, 序号3 (Wind的集成模型与Geo的TC-track模型相集成)取得了最优的预报结果。而一些方向预报因子模型的集成, 如序号12、13对应的模型, 其预报性能较baseline及表3中单个方向预报因子的模型提升较小, 这说明方向预报因子不能随意组合, 需要根据先验知识或试验验证进行合理的筛选。

3.3 验证分析

本章节进一步对本文方法的路径预报结果进一步分析。首先考虑到路径预报的难点所在: 移动速度的变化和移动方向的变化[38]。因此, 主要探究了预报误差与对应时刻的移动速度、移动方向变化情况之间的关联。

首先, 本文利用NIO-BST数据对TC移动方向和移动速度的变化做了简单计算。假定当前时刻为, 上一时刻(6 h前)为1, 预报时刻为24 h, 移动速度变化情况Δ和移动方向变化情况Δ计算公式如下所示:

为直观展示预报误差与对应时刻的移动速度、移动方向变化情况之间的相关性, 将移动速度变化和移动方向变化分别作为坐标轴, 使用不同的颜色代表预报误差大小, 展示测试集中2015—2018年的TC(共计16个TC, 整理为280个样本)预报结果, 如图9(a)所示。考虑到外推预报法认为TC相近时刻的移动速度和方向不发生改变, 可以明显展示出TC预报难度与移动速度、方向变化情况的相关性; 且外推法常作为基准方法检验预报方法的有效性, 因此, 同样对外推法的预报结果进行展示作为对比,如图9(b)所示。

图9 预报结果与移动速度、方向变化的相关性

从结果中可以看出, 对于外推法的预报结果, 不同预报误差的分布情况具有明显的分层现象, 即移动速度和移动方向变化越快, 预报难度越大; 而对于基于深度学习的集成预报方法, 蓝色点(预报误差小于等于80 km)的分布更加广泛, 红色点(预报误差大于200 km)的数量更少。结果说明相较于外推法这种简单的基准方法, 本文方法是有效的, 但是在移动速度或方向发生较大变化时[Δ>0.4(°)/6 h, Δ>20°], 即预报难度较大时, 仍存在预报误差较大的现象。

此外, 引入稳定度指标, 包括距离稳定度和方向稳定度对本文方法进行检验评估。距离稳定度表示预报误差小于规定的距离误差上限的预报次数与总预报次数的比例, 距离误差上限选择有两个, 分别为表4中号3最优集成模型的平均误差110 km和图9中较大误差范围的界限200 km; 方向预报误差表示预报方向与实际方向一致的预报次数所占比例。经过对测试集预报结果的统计, 本方法对应上限为110 km和200 km的距离稳定度分别为0.56和0.91, 方向稳定度为0.81。总体来看, 大部分预报次数的预报距离和方向都是较为稳定可信的。

由于本文的所研究的TC范围为北印度洋TC, 负责北印度洋TC业务预报的专业机构为印度气象局(India Meteorological Department, IMD)。因此, 将本文方法的24 h路径预报结果与IMD所发布的预报结果[39]相对比。其中, IMD仅提供了年度平均误差, 未提供TC个数或预报次数, 因此, 表5中仅对比了两种方法的年平均预报误差, 其中的TC个数和预报次数为本文方法的相关数值。从结果中可以看出, 在部分年份(2015年)本文方法的预报性能接近于IMD的业务预报性能; 但是部分年份(2017年、2018年), 本文方法相较于业务化预报的精度具有一定的差距, 还有相当的发展空间。

表5 本文方法与IMD业务预报精度对比

最后, 从测试集中挑选TC个例进行结果展示, 如图10所示, 为2018年5月发生的特强气旋风暴“梅库纳”的预报结果, 各预报时刻的24 h路径预报平均误差为86.86 km。本方法起报时刻为2018年5月22日12时, 每间隔6 h预报一次, 预报时效为24 h, 如图10a, 红色曲线代表真实路径, 白色虚线两端连接预报时刻真实路径和预报路径(时效24 h), 点颜色代表预报误差(与图9相同)。由于图10a预报点数过多不易观察, 从起报时刻开始, 每隔24 h绘制一次预报结果, 展示在图10b。从结果中可以看出,本文预报方法在TC转向处存在反应滞后的现象, 如2018年5月24日12时的预报结果, 这与前述的分析是相符合的。但总体来说, 预报结果与真实路径的总体趋势相吻合, 预报路径具有一定的可信性, 说明了本文方法的有效性。

图10 TC“梅库纳”的真实路径与预报路径

4 结论

针对北印度洋TC路径预报, 本文提出了一种基于深度学习的TC路径集成预报方法, 使用前4个时刻(24 h, 间隔6 h)的TC路径记录和本文所提出的方向预报因子作为输入, 使用LSTM网络作为模型结构, 实现时效为24 h的路径预报。其主要动机及优势在于: 1) 对环境因素计算方向预报因子, 简单高效的提取TC的背景信息, 可以显式地利用环境因素的方向信息, 2) 使用TC移动速度预报模型, 将其与TC路径预报模型集成得到最终预报结果, 从而利用了TC速度变化具有时间连续性的先验信息, 从而提升预报精度。

本文方法使用1979—2010年以及2011—2014年的TC进行训练验证, 使用2015—2018年的TC(共计16个TC, 整理为280个样本)测试性能。从试验结果分析中得到以下结论:

1) 各类方向预报因子对路径预报模型的性能均有提升作用,Wind方向预报因子对性能的提升较为明显,Geo方向预报因子次之, 而SS方向预报因子和SSH方向预报因子对性能提升相对较小;

2) 不论对于何种方向预报因子, 集成预报的平均误差均小于其对应的TC-track模型和TC-velocity模型预报误差, 说明在本方法中集成预报的有效性;

3) 对多种方向预报因子模型进行集成时,Wind的集成模型与Geo的TC-track模型相集成的模型取得了最优的预报结果, 方向预报因子的组合需要根据先验知识或试验验证进行合理的筛选;

4) 本文方法一定程度上缓解了路径预报难点(移动速度、移动方向的变化), 但在移动速度或方向发生较大变化时[Δ>0.4(°)/6 h, Δ>20°], 仍然存在部分预报误差较大的现象。

上述结论验证了本文所提出的方向预报因子、集成方法在TC路径预报问题中的有效性。但在与业务化预报的对比中, 本文方法的预报精度尚未占优, 仍有相当的发展空间。下一步将对本文方法中误差较大的样本深入分析, 挖掘预报难点, 如TC强度、下垫面变化等可能的影响因素, 并相应改进本文的TC路径集成预报模型, 进一步提升预报性能。

[1] 陈联寿, 丁一汇. 西太平洋台风概论[M]. 北京: 科学出版社, 1979: 1-10.

CHEN Lianshou, DING Yihui. Introduction to Western Pacific typhoon[M]. Beijing: Science Press, 1979: 1-10.

[2] 梁梅, 林卉娇, 徐建军, 等. 1990—2018年北印度洋热带气旋统计特征[J]. 广东海洋大学学报, 2020, 40(4): 51-59.

LIANG Mei, LIN Huijiao, XU Jianjun, et al. Statistical analysis on the characteristics of tropical cyclone in the Northern Indian Ocean from 1990 to 2018[J]. Journal of Guangdong Ocean University, 2020, 40(4): 51-59.

[3] 张霏. 北印度洋热带气旋对中国降水的影响[D]. 南京: 南京信息工程大学, 2015.

ZHANG Fei. The influence of North Indian Ocean tropical cyclone on precipitation in China[D]. Nanjing: Nanjing University of Information Science & Technology, 2015.

[4] 黄伟, 端义宏, 薛纪善, 等. 热带气旋路径数值模式业务试验性能分析[J]. 气象学报, 2007, 65(4): 578-587.

HUANG Wei, DUAN Yihong, XUE Jishan, et al. Operational experiments and its performance analysis of the tropical cyclone numerical model (GRAPE-TCM)[J]. Acta Meteorologica Sinica, 2007, 65(4): 578-587.

[5] 郭蓉, 余晖, 漆梁波, 等. 台风路径多模式集成预报技术研究[J]. 气象科学, 2019, 39(6): 839-846.

GUO Rong, YU Hui, QI liangbo, et al. A study on multi- model ensemble forecast technique for Typhoon track[J]. Journal of the Meteorological Sciences, 2019, 39(6): 839-846.

[6] 马鹏辉, 杨燕军, 刘铁军. 台风数值预报技术研究进展[J]. 海洋气象学报, 2015, 35(1): 12-17.

MA Penghui, YANG Yanjun, LIU Tiejun. Research progress of typhoon numerical prediction technology[J]. Journal of Marine Meteorology, 2015, 35(1): 12-17.

[7] 危国飞, 刘会军, 潘宁, 等. 台风路径数值预报实时订正技术及其集成应用[J]. 大气科学, 2021, 45(1): 195-204.

WEI Guofei, LIU Huijun, PAN Ning, et al. Real-time correction method for numerically modeled typhoon tracks and its integrated application[J]. Chinese Journal of Atmospheric Science, 2021, 45(1): 195-204.

[8] 江应境, 高山红. 一种动态权重的台风集成预报方法[J].海岸工程, 2018, 37(3): 1-13.

JIANG Yingjing, GAO Shanhong. A Consensus forecast method for typhoon based on dynamic weights[J]. Coastal Engineering, 2018, 37(3): 1-13.

[9] 张守峰, 高拴柱, 李月安. 集成方法在热带气旋路径和强度预报中的应用[J]. 气象科技, 2007, 35(2): 161- 165.

ZHANG Shoufeng, GAO Shuanzhu, LI Yuean. Application of consensus method to forecast of tropical cyclones[J]. Meteorological Science and Technology, 2007, 35(2): 161-165.

[10] 金龙, 黄颖, 姚才, 等. 人工智能技术的热带气旋预报综述(之一)——BP神经网络和集成方法的热带气旋预报研究和业务应用[J]. 气象研究与应用, 2020, 41(2): 1-6.

JIN Long, HUANG Ying, YAO Cai, et al. A review of tropical cyclone forecast based on artificial intelligence (part 1)——BP neural network and ensemble method for tropical cyclone forecast research and operational application[J]. Journal of Meteorological Research and Application, 2020, 41(2): 1-6.

[11] REICHSTEIN M, CAMPS-VALLS G, STEVENS B, et al. Deep learning and process understanding for data- driven Earth system science[J]. Nature, 2019, 566(7743): 195-204.

[12] PICKLE J. Forecasting short-term movement and intensification of tropical cyclones using pattern-recognition techniques[R]. Phillips Lab Hanscom AFB MA, 1991.

[13] 李祚泳, 邓新民. 人工神经网络在台风预报中的应用初探[J]. 自然灾害学报, 1995(2): 86-90.

LI Zuoyong, DENG Xinmin. A primary study on the application of artificial neural network to the forecasting of typhoon[J]. Journal of Natural Disasters, 1995(2): 86-90.

[14] LEE R S T, LIU J N K. Tropical cyclone identification and tracking system using integrated neural oscillatory elastic graph matching and hybrid RBF network track mining techniques[J]. IEEE Transactions on Neural Networks, 2000, 11(3): 680-689.

[15] YANG Y Q, WANG J Z. An integrated decision method for prediction of tropical cyclone movement by using genetic algorithm[J]. Science in China Series D, 2005, 48(3): 429-440.

[16] 张广平, 张晨晓, 谢忠. 基于T-S模糊神经网络的模型在台风灾情预测中的应用——以海南为例[J]. 灾害学, 2013, 28(2): 86-89.

ZHANG Guangping, ZHANG Chenxiao, XIE Zhong. Typhoon disaster prediction model based on T-S fuzzy neural network and its application—A case study of Hainan Island[J]. Journal of Catastrophology, 2013, 28(2): 86-89.

[17] GAO S, ZHAO P, PAN B, et al. A nowcasting model for the prediction of typhoon tracks based on a long short term memory neural network[J]. Acta Oceanologica Sinica, 2018, 37(5): 12-16.

[18] PAN B, XU X, SHI Z W. Tropical cyclone intensity prediction based on recurrent neural networks[J]. Electronics Letters, 2019, 55(7): 413-415.

[19] GIFFARD-ROISIN S, YANG M, CHARPIAT G, et al. Tropical cyclone track forecasting using fused deep learning from aligned reanalysis data[J]. Frontiers in Big Data, 2020, 3: 1.

[20] 郝坤, 张天坤, 史振威. 基于时空特征的热带气旋强度预测方法[J]. 南京师范大学学报(工程技术版), 2019, 19(3): 1-7.

HAO Kun, ZHANG Tiankun, SHI Zhenwei. A tropical cyclone intensity prediction method based on spatial-temporal features[J]. Journal of Nanjing Normal University (Engineering Technology Edition), 2019, 19(3): 1-7.

[21] JIN L, YAO C, HUANG X Y. A Nonlinear artificial intelligence ensemble prediction model for typhoon intensity[J]. Monthly Weather Review, 2008, 136(12): 4541-4545, 4547-4548, 4550, 4552-4554.

[22] 黄小燕, 金龙. 基于主成分分析的人工智能台风路径预报模型[J]. 大气科学, 2013, 37(5): 1154-1164.

HUANG Xiaoyan, JIN Long. An artificial intelligence prediction model based on principal component analysis for typhoon tracks[J]. Chinese Journal of Atmospheric Sciences, 2013, 37(5): 1154-1164.

[23] 朱雷. 基于神经网络委员会机器的南中国海台风路径预报模型研究[D]. 上海: 华东师范大学, 2017.

ZHU Lei. A study on neural network-based committee machines for typhoon track forecast model in the South China Sea[D]. Shanghai: East China Normal University, 2017.

[24] CHU J H, LEVINE A, DAIDA S, et al. North Indian Ocean best track data[EB/OL]. https://www.metoc.navy. mil/jtwc/jtwc.html?north-indian-ocean.

[25] SAHA S, MOORTHI S, PAN H L, et al. The NCEP climate forecast system reanalysis[J]. Bulletin of the American Meteorological Society, 2010, 91(8): 1015- 1058.

[26] SAHA S, MOORTHI S, WU X R, et al. NCEP Climate Forecast System Version 2 (CFSv2) 6-hourly products. Research data archive at the National Center for Atmospheric Research, Computational and Information Systems Laboratory[EB/OL]. https://rda.ucar.edu/datasets/ds094.0/

[27] 王维建. 台风预警发布系统的设计与实现[D]. 成都: 电子科技大学, 2013.

WANG Weijian. Design and implementation of optical network information management system[D]. Chengdu: University of Electronic Science and Technology of China, 2013.

[28] 马雷鸣. 国内台风数值预报模式及其关键技术研究进展[J]. 地球物理学进展, 2014, 29(3): 1013-1022.

MA Leiming. Research progress of China typhoon numerical prediction models and associated major techniques[J]. Progress in Geophysics, 2014, 29(3): 1013- 1022.

[29] ELMAN J L. Finding structure in time[J]. Cognitive science, 1990, 14(2): 179-211.

[30] SCHMIDHUBER J. Deep learning in neural networks: An overview[J]. Neural Networks, 2015, 61: 85-117.

[31] HOCHREITER S, SCHMIDHUBER J. Long Short-Term Memory[J]. Neural Computation, 1997, 9(8): 1735-1780.

[32] 郭春迓, 程正泉, 李泳泽, 等. 热带气旋风圈统计及业务应用[J]. 广东气象, 2020, 42(4): 56-59.

GUO Chunfu, CHENG Zhengquan, LI Yongze, et al. Tropical cyclone wind circle statistics and operational application[J]. Guangdong Meteorology, 2020, 42(4): 56-59.

[33] RICHARDSON D S. Skill and relative economic value of the ECMWF ensemble prediction system[J]. Quarterly Journal of the Royal Meteorological Society, 2010, 126(563): 649-667.

[34] PALMER T N. The economic value of ensemble forecasts as a tool for risk assessment: From days to decades[J]. Quarterly Journal of the Royal Meteorological Society, 2002, 128(581): 747-774.

[35] 沈越婷, 钱传海. 全球热带气旋集合预报技术综述[C]// 中国气象学会. 创新驱动发展提高气象灾害防御能力——S13热带海洋气象, 2013: 9.

SHEN Yueting, QIAN Chuanhai. Overview of global tropical cyclone ensemble forecasting technology[C]// Chinese Meteorological Society. Innovation driven development to improve meteorological disaster prevention capability - S13 Tropical Marine Meteorology, 2013: 9.

[36] 陈国民, 张喜平, 白莉娜, 等. 2017年西北太平洋和南海热带气旋预报精度评定[J]. 气象, 2019, 45(4): 577-586.

CHEN Guomin, ZHANG Xiping, BAI Lina, et al. Verification on forecasts of tropical cyclones over Western North Pacific and South China Sea in 2017[J]. Meteorological Monthly, 2019, 45(4): 577-586.

[37] 马雷鸣, 李佳, 黄伟, 等. 2007年国内台风模式路径预报效果评估[J]. 气象, 2008, 34(10): 74-80.

MA Leiming, LI Jia, HUANG Wei, et al. Verification on typhoon track forecast by operational typhoon numerical models of China in 2007[J]. Meteorological Monthly, 2008, 34(10): 74-80.

[38] 杨琼琼, 吴立广. 中国24h台风路径预报难点及其大尺度环流分析[J]. 气象科学, 2015, 35(4): 389-397.

YANG Qiongqiong, WU Liguang. Analysis on difficulty of 24 h typhoon track forecast in China and associated large-scale circulation[J]. Journal of the Meteorological Sciences, 2015. 35(4): 389-397.

[39] MOHAPATRA M, SHARMA M. Cyclone warning services in India during recent years: A review[J]. Mausam, 2019, 70(4): 637.

Consensus forecast method for a tropical cyclone track based on deep learning

GENG Xiao-yi, HAO Kun, SHI Zhen-wei

(Image Processing Center, School of Astronautics, Beihang University, Beijing 100083, China)

This paper proposes a tropical cyclone (TC) track forecast method based on Long Short-Term Memory (LSTM) networks as the backbone. Inputs include the TC historical data (24 h, 6 h interval) and the current track, as well as the direction predictors (DP) calculated by different environmental factors. The model TC-track forecasts the track directly, while the model TC-velocity forecasts the track indirectly by the velocity. The models are integrated based on the consensus model, which forecasts the TC track after 24 hours. Through experiments, this paper compares the models driven by different DPs to explore the influence of the environmental factors on the TC track. The results reveal that the DP of the wind field has a more obvious effect on the forecast model performance, while DPs of the temperature and height fields at the sea surface have a relatively small effect. Moreover, the forecast accuracy can be further improved by integrating the selected forecast models of different DPs. The above results verify the feasibility and effectiveness of the proposed DP and consensus forecast method for the TC track forecast.

tropical cyclone track; consensus forecasts; deep learning; long short-term memory; direction predictor

Feb. 20, 2021

TP391; P71

1000-3096(2022)02-0074-13

10.11759/hykx20210220003

2021-02-20;

2021-05-06

国家重点研发计划项目(2017YFC1405605)

[National Key Research and Development Project of China, No. 2017YFC1405605]

耿逍懿(1997—), 女, 硕士研究生, 研究方向为图像处理与机器学习, E-mail: gxy0809@buaa.edu.cn; 郝坤(1995—), 女, 共同第一作者, 硕士研究生, 研究方向为图像处理与机器学习, E-mail: 14151035@buaa.edu.cn; 史振威(1977—),通信作者, 教授/博士生导师, 研究方向: 图像处理与机器学习, Email: shizhenwei@buaa.edu.cn

(本文编辑: 赵卫红)