基于时间卷积神经网络的台风路径预测

2021-05-18 02:12寇凯淇杜思静王梦巧刘欣宇仲万桐乔百友
科教导刊·电子版 2021年9期
关键词:残差台风卷积

寇凯淇 杜思静 王梦巧 刘欣宇 仲万桐 乔百友

(东北大学计算机科学与工程学院 辽宁·沈阳 110819)

0 引言

在全球气候变暖的背景下,各类极端自然灾害频发。台风作为气象灾害中最具破坏性的天气现象之一,严重制约着沿海地区的经济发展和人类社会的生命财产安全。准确预测台风的移动路径对于有效降低台风灾害带来的损失至关重要。传统的台风预测方法主要采用数值计算方法,计算代价大,预测耗时比较长,而且需要人工不断地矫正,因此需要积极探索新的台风路径预测方法。

近年来,随着大数据和人工智能技术的发展,人们开始积极探索基于数据驱动的方法来预测,期望能够更加准确高效地预测台风移动路径。为此提出了一系列的预测方法,如基于BP神经网络预测方法,基于卷积神经网络的集合预报方法等。由于神经网络在预测问题中仅需要较少的人工干预,已经广泛用于各个研究领域当中。因此,相比于以往利用动力学参数和统计学方法等需要大量人工测算的台风路径预测方法相比,可有更加快速地拟合真实的台风路径。

时间卷积神经网络模型(Temporal Convolution Networks,TCN)在时间序列问题的处理上要优于一般的卷积神经网络方法。台风本身是一种时序过程,台风路径的预测本身就是一种复杂的时间序列预测问题,非常适合TCN模型,为此本文提出了一种基于 TCN的台风路径预测方法。该方法首先整合海洋、大气数据和历史台风路径数据建立可用于训练的特征集,之后将其输入到TCN模型中进行训练,从而建立数据与路径经纬度间的序列映射关系,最终实现台风移动路径预测。一系列的实验结果表明所提出基于 TCN的预测方法能够较准确地拟合真实台风移动路径。

1 台风移动路径预测

1.1 数据预处理

本文数据来自中国台风中心,南海区域海洋大气数据和台风数据,数据时间范围从1949年-2018年共计1170场台风,提取了台风到达前和台风经过的经纬度、气压、风速、时间、海表信息、气候信息数据和该区域内的台风路径数据,每条数据包含268个特征。为了降低数据维度,避免数据分析与处理对系统资源的大量消耗,本文采用皮尔逊相关系数对输入特征向量进行特征选择。皮尔逊系数(Pearson correlation coefficient)常用于衡量两个变量之间的线性相关程度,计算公式如下:

皮尔逊相关系数的结果r的值介于-1与1之间。r值的绝对值越大,说明两个变量的线性相关性越强。当r值的绝对值介于0.8-1.0之间时,通常称两个变量具有极强相关性。当r值为正时,两个变量呈正线性相关,当r值为负时,两个变量为负线性相关。根据已知的台风路径数据特征信息,可通过皮尔逊相关系数计算变量之间的相关性,并用于特征的选择。每组数据经过预处理后包含经纬度、气压、风速、时间、海表面温度、高度以及24小时经纬度变化量等107个比较相关性的特征。

1.2 预测模型

本文采用时间卷积网络TCN来实现对台风路径的预测。TCN是一种特殊的卷积神经网络,能够较好地拟合时间序列的预测问题。以往时序问题的处理上,通常选用LTSM网络预测或者CNN卷积神经网络。TCN网络结合了时域卷积网络,融合了时域上的建模能力,具有较强的低参数量下的特征提取能力,在一系列应用中优于LSTM和CNN网络。故本文选用TCN网络来预测台风路径。基于TCN的台风路径预测模型如图1所示。

图1:基于TCN的台风路径预测模型

从图中可以看出,原始海洋、大气和台风数据经过预处理后,采用皮尔逊相关系数进行特征选择,之后利用滑动窗口进行切分,形成训练数据,输入TCN网络模型,进行模型训练和预测。本文提出的 TCN台风路径预测模型由8层残差块与1层全连接层组成。整个网络模型的输入数据维度为107,包含大气、海洋和台风路径数据,模型窗口设置为1,每个残差块的神经元个数设置为128个,全连接层神经网络神经元个数为64。预测时间步长为4,输出维度为2维,即预测的经纬度数据。

残差模块也是TCN网络的重要组成结构,其结构如图中所示。每个残差模块由两个卷积组成,并且添加了跨层连接恒等映射,加快了网络的反馈与收敛速度,防止梯度爆炸与梯度消失。TCN网络使用因果卷积来保证未来信息不泄露,通过增加信息量来提高了模型的预测精度,但同时增加了模型的复杂度。为此TCN使用扩张卷积来增加网络的感受野,使网络可以看到更久远的信息。扩张卷积的感受范围取决于卷积核的大小K或扩张系数d,扩张系数d通常取1,2,4,8。设第 i个卷积层中卷积核的感受野为Fi,卷积步长为sn,则扩张卷积感受野的计算公式为:

2 实验结果

2.1 实验数据及参数设定

考虑网络模型的训练需求与数据集情况,本文主要对24小时台风路径的变化进行预测。用于模型训练的数据集来自于南海,主要由1170组台风数据和对应的海洋、大气数据组成,共22128条数据。其中10%数据作为验证集数据。整个模型训练100轮次,学习率为0.001。

TCN网络采用ReLU函数作为激活函数,采用Adam优化算法对模型进行优化。在多次的训练以及参数调整中,选取在验证集中误差最小的参数模型。表1为模型参数设定对比实验。从对照实验组1和2发现,适当增加残差层数可以提高网络预测的精度。对照实验组1和3发现,适当增加单层网络的神经元个数可以有效提高网络的精度。对照实验组1和4发现,增加时间步长可以提高网络模型的预测经度。对照实验组1和5发现,过少的特征个数虽然可以降低系统资源的消耗,但会使得网络模型感受的信息降低,训练经度不佳。通过整体的实验对比,发现适当加深神经网络的深度,可以在一定程度上提高本文模型的预测经度,但过于深层的模型往往容易导致模型训练所消耗的时间开销大,所需数据量高,因此本实验中采用8层残差结构。

表1:模型参数对比

2.2 对比实验分析

在完成对模型参数设定后,本文采用TCN模型对24H台风预测路径进行了预测,并与基于GRU的模型和基于LSTM的台风路径预测进行了对比,表2为三种模型的实验结果。

表2:模型精度对比

从表2中可以看出,在三个模型中TCN模型的纬度平均误差是最低的,而经度误差在GRU和LSTM中间,综合平均误差是三种方法中最低的,这也体现出了TCN模型的先进性。当然由于实验训练数据比较小,另外模型仅仅训练了100次,因此误差还是偏大,后续还需要进一步改进和测试。

图2为其中一场台风的TCN模型预测结果的展示,蓝色为实际台风路线,红色为预测值,可以看出预测路径趋势基本能够拟合真实路径。

图2:路径预测图

3 结论

本文提出了一种新的台风路径预测模型。该模型通过对海洋、气象数据和台风路径数据的分析学习,选取更适用于解决时间序列问题的时间卷积神经网络 TCN模型来解决台风移动路径的预测问题,并利用南海台风数据对基于TCN的台风预测模型进行了训练和测试。初步实验结果表明基于TCN的台风路径预测模型具有较好的预测精度,后续将进一步进行深入研究,从模型结构、特征选择等多方面进行优化,以进一步提高模型的预测精度。从而为我国台风路径的准确预测提供支持。

猜你喜欢
残差台风卷积
台风过韩
基于双向GRU与残差拟合的车辆跟驰建模
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于残差学习的自适应无人机目标跟踪算法
台风来了
基于递归残差网络的图像超分辨率重建
从滤波器理解卷积
台风爱捣乱
基于傅里叶域卷积表示的目标跟踪算法
平稳自相关过程的残差累积和控制图