基于深度学习的多普勒气象雷达回波外推短临预报对比研究

2022-08-05 01:38龚勋胡嘉骏徐年平邱盼赵晖

中国军转民 2022年13期

龚勋胡嘉骏徐年平邱盼赵晖

目前主流的短临降水预报的方法有数值天气预测模式、外推方法、神经网络方法。数值模式预报是基于降水的物理形成机制的一种预报方法，需要大量的数据以及复杂的计算量，因此需要大型计算机来支撑，并且对初始条件非常敏感[1-2]。本研究运用采取了5 种较前沿的算法，分别是传统算法中半拉格朗日光流法和基于深度学习的PredRNN++、MIM、CrevNet 以及PhyDNet 模型，对中部某城市的2012-2019 年的降水过程进行训练和外推预报评估，检验传统算法与机器学习算法的优劣以及几种算法在中部某城市的适用程度。

1 研究区域降水气候概况

实验研究区域为以中部某城市为中心的城市圈区域，面积为256KM×256KM，分辨率为1KM×1KM，经度从108°30′E到118°E，纬度从18°12′36 ′′N 到27°N 的区域。中部某城市属北亚热带季风性（湿润）气候，具有常年雨量丰沛、热量充足、雨热同季、光热同季、冬冷夏热、四季分明等特点；年平均气温15.8℃-17.5℃，年日照总时数1810-2100 小时，年降水量1150-1450 毫米，降雨集中在每年6-8月，约占全年降雨量的40%左右。

2 数据和方法

2.1 数据来源与选取

研究数据由中部某城市气象局提供，为2012 年6 月至2019 年4 月的中部某城市SWAN 拼图产品。本次研究以雷达组合反射率产品为研究对象。

2.1.1 时间选择

因自动雨量站在冬季降雪天气过程中可能对真实降水量的测量存在误差，因而首先剔除了每年的1 月份、2 月份和12 月份的数据，来去掉此测量误差对本次研究可能造成的偏差影响；

2.1.2 范围选择

以中部某城市雷达观测站为中心，截取256KM*256KM 范围，以1KM*1KM 为分辨率，最终形成256*256 像素的雷达回波组合反射率的灰度图片，像素值为向下取整后的dBZ 值。

2.1.3 样本选择

通过分析同期降水数据，我们提取了日降水量大于等于10mm（中雨）、时刻降水量大于等于0.6mm，每30 张连续无间断的雷达回波图为一组数据。通过筛选所有的雷达回波资料，我们最终获得了3122 组数据，将其中的80%（2490组）作为训练集，20%（622 组）作为验证集。

2.2 几种外推算法的基本原理与特点

2.2.1 半拉格朗日光流法的基本原理

光流法是目前运动图像分析中广泛应用的方法之一，其光流计算方法大致可以分为四类：基于梯度的方法、基于匹配的方法、基于能量的方法以及基于相位的方法[3]。由于基于相位的光流法和基于能量的光流法的需要复杂的计算和严格的时空整合要求，不宜用来进行雷达图像处理。而基于匹配的交叉相关法虽然对变化平缓的层状云降水系统比较有效，但对变化较快的强对流降水系统，交叉相关法跟踪失败的情况会显著增加，所给出的运动矢量场的质量会降低。因此半拉格朗日外推法采用的是基于梯度的L-K 光流算法来计算雷达图像的光流场。

目前在数值天气预报方面，采用半拉格朗日方法的研究较多，但在短时临近预报中采用半拉格朗日方法的研究还较少。研究发现，半拉格朗日方法在临近预报中预报效果较好，优于SWAN 系统中的交叉相关法（韩雷、曹春燕、Bechini）和线性外推[4-5]。因此本次研究选取了半拉格朗日外推方法作为各种机器学习算法的外推效果的对比基准。

本方法的原理是首先运用L-K 光流法计算连续的两张雷达图像的运动矢量场，进而用半拉格朗日外推预报方法对雷达回波进行外推。线性外推是在雷达图像矢量场的基础上直线外推预报，而半拉格朗日外推方法是在雷达图像矢量场的基础上根据雷达回波运动矢量的运动轨迹外推，可以实现曲线外推，这对于风场有旋转情况的风暴天气的预报有重要的意义。

老道看王祥一脸阴郁，隐约猜到了王祥的心思，接口说：“小伙子你也别灰心，卖古董，全凭一张嘴，只要你把这桩生意交给我，保管死的也给你说成活的。”

2.2.2 PredRNN++的基本原理

PredRNN++是一种用于时空预测学习的递归网络。为了获得强大的短期视频动态建模能力，利用了一种“Causal LSTM”的递归结构和级联双存储器，使模型的网络更加及时。为了减轻深度预测模型中的梯度传播困难，模型中引入了“Gradient Highway Unit”信息高速公路单元，该单元结构可以为从输出返回到远程先前输入的梯度流提供了替代的快速路线。通过GHU 与Causal LSTM 的无缝协作，从而使PredRNN++模型能够自适应地捕获短期和长期视频依存关系[6-7]。

该模型的Causal LSTM 级联结构能够能够更多学习到短时的一些复杂的非线性变化，而GHU 结构能够有效的在非常深的网络中传递梯度，从而解决梯度消失的问题。在实际应用中的优势在于预测的图片更加清晰，有明显的轮廓，降低了一定的模糊程度。

2.2.3 MIM 的基本原理

该模型的核心思想在于将数据分为平稳信息与非平稳信息进行处理。平稳信息如大块区域的整体运动特征；低阶的非平稳信息如区域像素点的空间和时间的关系，即小块区域的时空变换，而高阶的变化如在气象中的雷达回波图中对应的数据的堆积、变形或耗散等。

MIM 模型的特点是可以更好的学习高阶非平稳特征信息中的规律。模型通过将图片信息分为平稳项和非平稳项，并引入差分，近似的将差分对应于非平稳项，上一时刻的memory cell对应于平稳项。MIM-N 提取出非平稳信息,之后传递给MIM-S，MIM-S 利用门控来选择是否忘记和记住多少的非平稳信息或者近似的平稳信息。将多层MIM blocks 进行层叠，通过不同的差分，使得非平稳项得阶次降低，从而更好的预测。

2.2.4 CrevNet 的基本原理

具有可逆架构的CrevNet，在理论上保证特征提取过程中信息不丢失的情况下，大大降低了内存消耗，提高了计算效率。模型轻量级的特性使得作者在使用3D 卷积的时候不需要考虑内存瓶颈，在一定程度上，提高了模型捕获长短期依赖关系的能力。此外，可逆架构由于其轻量级特性和可设计的信息保存特性而受到关注。

2.2.5 PhyDNet 的基本原理

主要思想是试图用深度网络构建物理约束模型，方法是用卷积模拟偏导，用moment loss 作监督，学到物理信息，从而对已有的网络进行信息补充。

2.3 评价指标定义

针对雷达回波外推的预报效果进行评估，通常把它看成一个二元事件。本次研究中我们的预报区域为256KM*256KM，每1KM*1KM 可看作256*256 像素灰度图上的一个像素点，而像素值为该区域的dBZ 值。在外推预报中，如某点的预报值与该点的实际观测值落在同一区间（比如均大于20dbz，且小于30dbz），则为hit（命中）；否则为loss（未命中）。

本文引用了水文气象研究中比较常用的命中率（POD）、误报率（FAR）、临界成功指数（CSI）以及图片预测中常用的均方差（MSE）及结构相似度（SSIM）等共五个指标来评价雷达回波外推预报的效果。

分回波强度的评分：

整体误差和形状的评估：

3 结果分析

3.1 整体检验评估

如表1 所示，上述四种机器学习算法无论是MES、SSIM，还是POD、FAR 和CSI 都明显好于光流法，各种指数的提升幅度约在20%左右（FAR 达到40%）。

在初始的30 分钟以内，AI 模型和光流法的预报能力比较接近，都表现出MSE、FAR 的缓慢上升以及SSIM、POD、CSI 的缓慢下降。30 分钟以后各种机器学习算法和光流法都随着预报时效的延长，预报能力迅速下降，但所有指标都显示机器学习模型较光流法下降得更加缓慢，尤其是60 分钟以后，光流法的降幅进一步增加，而机器模型降幅相对平稳，两者之间的差距随着预报时效的延长而显著增加。

3.2 分强度回波检验

如表2 所示，整体来看各算法随着回波强度的增加，CSI和POD 都迅速降低，FAR 则陡然上升，但各指标下降和上升最快的区间具有一定的差异：CSI 和POD 在20～30dbz 的区间下降最快，而光流法和CrevNet 的FAR 在20～30dbz 之间上升最快，MIM、PredRNN++和PhyDNet 则在40～50dbz 之间急剧上升。具体到每个指标来看，PredRNN++算法在所有强度上CSI 都表现最佳，MIM、PhyDNet 算法对40dbz 以上强度回波的预报较光流法好，而CrevNet 则对50dbz 以上强度回波的预报较光流法好；POD 方面10dbz 以上强度最高的是PhyDNet 算法，20dbz 以上～40dbz 以上强度最高的都是PredRNN++，50dbz 以上则是CrevNet算法；FAR方面10dbz 以上～30dbz 以上最低的都是MIM 算法，40dbz 以上最低为PhyDNet，50dbz 以上最低则为PredRNN++。

3.3 具体个例检验

如图1 所示，大面积回波强度无明显变化，大范围回波的移动，说明机器学习算法（AI 算法）对气象预测的准确性明显比光流法好(形状误差小)。

如图2 所示，回波有明显发展趋势：增强发展，面积变大/消散减弱；这说明机器学习算法对雷达回波生消和发展有较强的预报能力，而传统的光流法没有。

4 结论

本研究运用了中部某城市气象局的提供的2012 年6 月至2019 年4 月的SWAN 拼图组合反射率产品数据，对比检验了半拉格朗日光流法及PredRNN++、MIM、CrevNet、PhyDNet 深度神经网络模型对中部某城市的雷达回波外推短临预报能力（0-2 小时）。

由于大气发展变化的过程极其复杂，雷达回波的发展存在很多不确定因素，以至于雷达回波数据的质量以及神经网络训练过程中设置的各种参数，对雷达回波外推的效果均有着不同的影响。研究者运用已有的检验方法，从所做的实验结果来看，所有的深度神经网络模型的短临外推预报效果均好于传统的半拉格朗日光流法，且整体平均性能提升了20%；其中CrevNet 模型在实际业务应用中表现优秀，具有良好的图片清晰度和预报准确度，而mim 模型则较为均衡，对回波整体的形状预测较好，评分最高。

表1 几种气象预测方法的比较

表2 几种气象预测方法的算法评分比较

图1 机器学习算法与光流法对气象预测结果的比较

图2 机器学习算法与光流法对雷达回波生消和发展预报能力的比较

具体如下：

1) 对于面积较大的回波块，机器预报的移动方向和速度比光流法好，得分会偏高一些；

2) 如果区域内较大块的回波有比较明显的发展或减弱，那么机器大概率能预报出来，而且位置较为准确，这样的个例得分比光流法好很多；

3) 面积很小的分散性对流，如果后期有合并和发展的趋势，机器大概率也能正确预报，但由于面积很小，得分也只是好一点点；

4) 面积很小的分散性对流，无明显的移动和发展特征，机器和光流法都较差，得分都比较低。

由于本次采用的SWAN 数据质控效果不佳，掺杂了大量的噪音回波，而数据质量决定了神经网络预测的上限，因此也导致本文采用的4 种神经网络模型一定的性能下降，未来可以采用PUP 基数据进行质量控制后的数据进行训练，可进一步提升神经网络模型的预报效果。