基于主从时空预测网络的闪电临近预警方法

2022-04-14 09:19郑黎明耿阳李敖周心源吕伟涛李清勇
郑州大学学报(理学版) 2022年3期
关键词:解码编码时空

郑黎明,耿阳李敖,姚 雯,郑 栋,周心源,吕伟涛,李清勇

(1.北京交通大学 交通数据分析与挖掘北京重点实验室 北京 100044;2.中国气象科学研究院 灾害天气国家重点实验室 北京 100044)

0 引言

闪电作为云与地之间或云体之间的一种强烈放电现象,是一种典型的恶劣天气,会对人类产生非常大的威胁[1]。作为应对闪电灾害的有效手段之一,闪电邻近预警受到研究者的广泛关注。文献[2-3]对闪电的成因进行了研究,文献[4-6]揭示了闪电活动与雷达回波数据之间的潜在联系,为闪电预警提供了理论依据。早期预警工作多采用外推方法,如单体质心法[7]、交叉相关法[8]等,这些外推方法通过观测历史天气系统得到其变化趋势,并将这种趋势施加在当前时刻的观测结果上,得到对未来闪电的预警结果。然而,考虑到雷暴活动较强的不稳定性,这类方法的性能随着预警时间增长会严重退化。最近研究者提出了数据驱动的闪电预警模型[9-10]。典型的方法如LightningNet[11],以经典的SegNet为基础,将多种观测数据堆叠作为模型输入,实现对未来1小时的闪电预警。

从数据科学角度来看,闪电临近预警可以形式化为一个时空序列预测问题,一些主流的时空序列预测方法也非常值得借鉴。文献[12]基于长短期记忆(long short-term memory,LSTM)网络提出了卷积长短期记忆(convolutional LSTM,ConvLSTM)网络用于降水预测。由于其优良的时空数据建模能力,ConvLSTM成为了后续很多模型的基础模块。PredRNN[13]在ConvLSTM的基础上增加了一套记忆单元,在雷达高值区域的形变预测上获得了更好的表现。TrajGRU[14]加入了可变感受野结构,对降水区域的旋转和形变拥有更好的预测能力。PredCNN[15]设计了新的时序信息抽取单元CMU,使用较少的历史帧进行时空序列预测,缓解了梯度消失问题。StepDeep[16]设计了时间敏感和空间敏感的卷积核,对序列时间维度和空间维度上的特征分别进行挖掘。LightNet[17]利用ConvLSTM构建了双编码网络模型,在较粗的时空分辨率下实现对闪电的长时预报。此外还存在一些方法利用注意力机制对时空序列数据的特征选取过程进行指导[18-19]。

上述方法在模型层面为本文提供了借鉴,然而这些方法要么面向通用时空序列数据处理问题,要么对闪电临近预警中闪电观测数据和雷达回波数据的综合应用还不够充分。为此,本文提出了一个主、从时空预测网络模型(master-slave spatiotemporal prediction network,MSTNet),实现了在精细时空分辨率(2 km×2 km,12 min)下对未来两小时内闪电是否出现及强度同时进行预测。模型的输入包括两种时空数据:历史闪电观测与雷达回波。MSTNet利用主、从时空预测网络分别对两种数据特有的时空规律进行挖掘:主预测网络用于建模历史闪电与未来闪电之间的强时序关系;从预测网络则负责推演发展相对稳定的雷达回波,为预测未来闪电提供间接支撑。主、从预测网络提取得到的特征通过一个融合模块实现信息互补,基于融合特征获得闪电预警结果。在我国华南地区真实采集的实际数据集上进行了实验,结果表明MSTNet与几种先进的时空序列天气预报模型相比具有显著优势。

综上所述,本文的主要贡献包括:1)提出了一个端到端的闪电临近预警模型,通过预测雷达回波辅助闪电预测,挖掘两种数据的互补优势实现对未来闪电的预警;2)针对闪电和雷达两种异质时空数据设计了主、从时空编码的处理方式,预测效果明显优于两种数据的直接拼接获得的结果;3)模型可以同时预测闪电是否出现及强弱,并在评价指标上均取得了最优结果;4)所提模型在我国华南地区的真实数据集上与其他主流方法进行对比,实验结果明显优于对比方法。

1 任务数据分析与问题形式化

1.1 基于闪电雷达双源数据的临近预警

在引言里介绍的天气预测方法大多使用单一数据源进行预测[12,14],这种单源数据模式对于闪电预测存在一些不足。以本文使用的闪电与雷达回波的历史观测为例。如果仅使用闪电历史观测数据作为输入,对于在预报开始时刻刚形成的雷暴天气,过去一段时间内不存在对应的闪电观测,意味着输入全部为无闪电,导致模型预测失效;另一方面,如果仅使用雷达回波观测数据作为输入,虽然其与雷暴活动具有潜在的联系,但两者关系并非相互确定,相似的雷达回波可能会对应不同的闪电分布,仅使用雷达数据可能造成过多的虚警或漏报。文献[11]中的方法虽然使用多源数据进行了闪电预警,但其只是将多源数据简单地堆叠拼接在一起,没有对不同源数据各自的特点与规律进行挖掘利用。本文针对闪电观测和雷达回波双源输入,设计了不同的编码、解码模块,分别挖掘两者特有的时空规律,更有效地发挥了双源时空数据的优势。

对于本文使用的双源输入而言,历史观测闪电输入与未来闪电具有强的时序关系,对雷暴未来的移动方向具有较强的指示性,然而受限于闪电发生的随机性与空间离散性,使用该输入难以对雷暴的形态与生消趋势进行精准估计;而雷达数据在时空维度上具有良好的连续性,利于机器学习模型的模拟预测,且其与闪电之间存在紧密联系[4-6],能够为雷暴形态与生消趋势估计提供潜在支撑。两种输入提供的信息对闪电预警任务具有互补性。基于上述分析,本文提出了双源数据预测模式。

1.2 数据介绍

论文使用的数据分为闪电观测数据和雷达回波数据两种,均为目标区域上的网格化的时空序列数据。首先将目标区域依照经纬度均分成W×D的二维网格,W和D分别为网格的行数与列数。闪电数据是一种二维时空序列数据,每一帧可表示为Lt={lij}W×D,代表第t帧的闪电分布情况,其中lij代表目标区域二维网格中(i,j)格点所对应的地理区域内发生的闪电次数。雷达数据是一种三维的时空序列数据,与闪电数据类似,每一帧可表示为Rt={rhij}H×W×D,代表第t帧的雷达回波数据,其中rhij代表高度为h,经纬度格点坐标为(i,j)所对应的三维空间网格中的雷达回波强度。

1.3 问题形式化

其中:g为通过历史雷达预测未来雷达数据的模块;f为使用未来雷达数据和历史闪电数据预测未来闪电数据的模块,两个模块都使用神经网络进行建模。损失函数由两部分构成,分别为闪电部分的损失以及雷达部分的损失,由系数wrad控制权重,其具体形式在后续章节详细阐述。整个学习过程采用端到端的方式来实现。

2 主、从时空预测网络模型

本章介绍所提模型MSTNet及其损失函数和训练细节。MSTNet由一个主时空预测网络和一个从时空预测网络构成。其中从时空预测网络(图 1模块Ⅰ)接受历史雷达数据作为输入,输出未来的雷达预测用于辅助未来闪电的预测。主时空预测网络又可以细分为闪电编码模块和融合解码模块:其中闪电编码模块(图1模块Ⅱ)负责对历史闪电观测进行时空特征编码;融合解码模块(图 1模块Ⅲ)接受闪电特征编码和雷达预测特征作为输入,按时序对它们进行融合,并解码出闪电预测结果。上述三个模块都使用ConvLSTM[13]作为基础单元,因此我们首先对ConvLSTM进行介绍,然后分别对三个模块进行描述。

图1 MSTNet模型图Figure 1 The model diagram of MSTNet

2.1 ConvLSTM

ConvLSTM[13]是基于FC-LSTM提出的一种时空序列预测模型,弥补了FC-LSTM没有考虑数据空间结构特性的缺陷。ConvLSTM使用卷积操作代替了FC-LSTM中的全连接操作,使模型可以直接接收二维数据,对其进行时空编码和特征提取。作为时序模型,ConvLSTM在t时刻接收上一时刻的隐状态Ht-1、记忆单元Ct-1以及当前时刻的输入Xt,经过处理后产生当前时刻的隐状态Ht和记忆单元Ct。ConvLSTM已被证明是处理时空数据的有力工具,本文将其作为基本单元进行模型的构建。

2.2 雷达数据的编解码模块

2.3 闪电编码模块

本节内容对应图 1中的模块Ⅱ。与模块Ⅰ类似,闪电数据编码模块使用2D-ConvLSTM作为基础组件,提取过去s个时刻的闪电数据特征,并将特征送入融合解码模块中作为初始状态进行未来时刻的闪电预测。具体来说,模型将2D-ConvLSTM堆叠起来处理每个时间步的闪电数据,不同时间步共享权重。与模块Ⅰ不同的是,闪电数据编码模块和解码模块具有不同的结构。该模块第l层2D-ConvLSTM形式化为

2.4 融合解码模块

2.5 损失函数

损失函数分为两部分,针对雷达数据预测结果的损失函数以及针对闪电数据预测结果的损失函数。其中雷达部分的损失为均方误差,目的是使雷达模块的输出尽量接近未来h个时刻的真实雷达数据,

闪电部分的损失函数是使用正样本权重控制的均方误差,目的是闪电模块的预测结果尽量接近未来h个时刻的真实闪电结果。考虑到均方误差对闪电是否出现不敏感,故使用正样本权重控制,

其中σ代表sigmoid函数。结合上述两部分损失函数,构建总的损失函数公式为

loss=lossL+wradlossR。

由于雷达编码、解码模块是融合解码模块的前置部分,模型使用两阶段训练法,在前32个epoch中赋予wrad更大的权重(2.0),使模型更加偏向于雷达编码、解码模块进行梯度下降,在后续200个epoch中将wrad调小(0.2),使模型最终专注于对未来闪电数据的预测。相比于单阶段训练方法,双阶段训练模型在对比实验中取得了更优秀的结果。模型使用Adam优化器,学习率设置为0.000 1,batchsize设置为32。所有模块中ConvLSTM的堆叠层数NL都设为4。

3 实验

3.1 数据集与实验设置

为了验证模型的效果,采用了华南地区2015—2018年的真实闪电与雷达数据进行了实验(数据与代码参见 https:∥github.com/MrMirotic/MSTNet),设定空间分辨率为2 km×2 km,时间分辨率为12 min,网格尺寸为64×64,通过历史的10帧闪电与雷达数据对未来10帧闪电数据进行预测,并与其他主流方法对比。实验环境为64位Ubuntu 16.04服务器,服务器拥有18块Intel 2.68 GHz CPU,256 GB内存,以及8块NVIDIA TITAN X GPU。

对比实验分为两部分:与ConvLSTM[12]、LightningNet[11]、StepDeep[16]、PredCNN[15]、PredRNN[13]的对比实验;MSTNet自身的3个消融实验(仅使用闪电数据的MSTNet-L、仅使用雷达数据的MSTNet-R、使用单阶段训练法的MSTNet-S)。

为了检验模型的闪电临近预警能力,引入多个评估指标:TS评分[20]、ETS评分[20]、命中率(POD)、虚警率(FAR)以及闪电的正样本均方误差(PMSE)。前4个指标反映模型预测闪电是否出现的效果,PMSE是基于均方误差(MSE)的一种评估指标,仅计算正样本格点平方误差的平均值,反映模型对闪电强度的预测效果。TS、ETS、POD指标值越大越好,FAR、PMSE指标值越小越好。

3.2 实验结果对比与分析

表 1展示了MSTNet与5种机器学习模型及3个消融实验的结果。在用于对比的机器学习模型中,LightningNet的表现较差,原因是LightningNet针对的应用场景是较粗时空分辨率的闪电临近预警,预测帧的时空分辨率为1 h、5 km×5 km,且没有区分处理闪电数据和雷达数据,另由于该模型仅能预测闪电的有无,故没有PMSE值。其余4种对比模型中,ConvLSTM和PredCNN的结果稍差,StepDeep和PredRNN的结果稍好,后两者之所以优于前两者,要归功于StepDeep 中的时空敏感卷积核以及PredRNN中增加的一套空间敏感的记忆单元,这两种结构使得它们拥有更加强大的时空编码能力。

表1 所有模型在测试集上预测表现的量化评估Table 1 Quantitative evaluations for the prediction performance of all the models on the test set

虽然StepDeep和PredRNN在对比模型中表现出了优越的预测能力,但其性能仍弱于MSTNet。在表1展示的数据中,除FAR外的4种指标的最优值都体现在MSTNet上,且显著优于其他模型。而指标FAR的最优值在消融模型MSTNet-L上获得,虽然MSTNet的FAR值要稍高于对比模型,但其表现出的POD要远远优于对比模型,一般而言POD的提升往往伴随着FAR的提升,并且其TS评分与ETS评分也显著优于对比模型,这也侧面验证了“高POD-稍高FAR”预测模式的优越性,故我们认为其稍高的FAR是可以容忍的。

消融实验共有3个以MSTNet为基础的消融对比模型,其中MSTNet-L为仅使用闪电数据的对比模型,MSTNet-R为仅使用雷达数据的对比模型,MSTNet-S为使用单阶段训练的对比模型(即不修改wrad的值,与2.5中描述的两阶段训练法对比)。与这3个消融模型相比,MSTNet均取得了更好的表现,这说明了双源数据在闪电临近预警中各自提供了有用信息,体现了两阶段训练法的优越性。

对于未来10帧闪电分布的预测结果,我们还分析了不同模型在每一帧上的表现,由图2可以看出,MSTNet模型的3种评测指标在不同时间帧上均优于或持平其余对比模型,并且随着时间的推移,这种优势越来越明显,这证明了MSTNet拥有良好的较长时闪电临近预警能力。

图2 评价指标在不同模型上随预测时帧变化曲线Figure 2 The curves of the evaluation metrics with prediction frames on different models

4 总结

本文提出了一种端到端的闪电临近预警模型MSTNet,利用历史闪电观测与雷达回波作为双源输入,能够同时对未来两小时内闪电是否出现及其强度做出预测。借助主、从时空预测网络设计,模型既可以从历史闪电数据中挖掘闪电的时空变化趋势,又可以从雷达数据中发现闪电的新生与消亡的先兆特征,融合两种互补信息实现对未来闪电的临近预警。我们在华南地区的闪电与雷达真实数据集上进行了实验,结果表明,MSTNet与主流时空序列预测模型相比取得了明显优势。未来我们将从三个角度对现有工作继续研究:一是从结构与损失函数入手进一步提升模型在后几个时段的预警性能;二是参考现有的一些序列图像修复方式[21],对低海拔和缺失帧的雷达回波图像进行补全;三是将模型进行工程化并部署到中国气象科学研究院雷暴灾害预警系统中,服务社会。

猜你喜欢
解码编码时空
HEVC对偶编码单元划分优化算法
跨越时空的相遇
住院病案首页ICD编码质量在DRG付费中的应用
解码 四十五度仰望天空
文化解码
文化 解码
文明 解码
玩一次时空大“穿越”
时空守护者之宇宙空间站
时空之门