循环神经网络在雷达临近预报中的应用

2019-01-18 10:29:38龙明盛李月安王建民

应用气象学报 2019年1期

韩丰龙明盛李月安薛峰王建民

1)(国家气象中心，北京 100081)2)(清华大学软件学院，北京 100084)

引言

雷达外推临近预报是气象临近预报业务中的重要手段[1-2]。目前，已经投入业务应用的此类方法主要有交叉相关(COTREC)法[3]和光流法[4-6]等。交叉相关法和光流法主要是在假设雷达反射率因子的运动满足拉格朗日守恒的基础上，通过分析前后两个时次的反射率因子分布，求解得到反射率因子的运动矢量，并将反射率因子按照该运动矢量的规律进行1～3 h外推。基于拉格朗日守恒的外推方法在稳定性降水预报中可以取得较好效果[7]，但在局地强对流天气中，回波发展演变较快，无法满足守恒条件，预报效果会随时间快速下降[8-9]。

深度学习的概念起源于人工神经网络，含有多层神经元，具有优异的特征学习能力，与传统的人工神经网络相比，可以通过组合低层特征形成更加抽象的高层特征表示属性或特征，以更好地发现数据的有效特征表示[10-11]。目前，人工智能技术在气象领域已取得一定应用成果。陆虹等[12]使用粒子群-神经网络构建非线性统计集合模型，显著提高严重低温雨雪过程的预报能力。卢新玉等[13]使用后向传播神经网络建立TRMM月降水产品在新疆地区的订正模型，取得较好的订正效果。

连续的雷达观测是一种时序数据。外推时要达到较好效果，需要充分考虑雷达反射率因子相邻时次的时序相关性，这在深度学习网络中正符合LSTM-RNN(long short-term memory-recurrent neural network，具有长短时记忆单元的循环神经网络)的基本特点。LSTM-RNN网络已在语音识别、自然语言翻译和手写识别等领域取得很好的应用效果[14]。

目前将LSTM-RNN应用于雷达外推预报的研究还处于起步阶段，Shi等[15]提出使用带有卷积层的LSTM单元(ConvLSTM)组成RNN，并将其应用到雷达外推预报中。通过与中国香港天文台研发的小涡旋系统(Short-range Warning of Intense Rain- storms in Localized System，SWIRLS)[16]中的光流外推算法(Real-time Optical flow by Variational method for Echoes of Radar，ROVER)的对比分析发现，对0.5 mm·h-1以上的降水,该方法预报准确率有明显提升,取得了不错的应用效果。

本文提出使用带有ST-LSTM(spatiotemporal LSTM)[17]单元组成的预测循环神经网络(PredRNN，简称预测网络)作为神经网络架构，选取北京大兴雷达和广州雷达作为试验对象，通过对长时序历史数据的建模，分别得到两个雷达站点组合反射率因子的演变模型，并基于该演变模型进行组合反射率因子的预报试验。最后将该方法和SWAN(Severe Weather Automatic Nowcasting,强对流天气短时临近预报)系统中的交叉相关法进行对比检验，给出长时间序列的独立检验结果和两个强对流天气个例检验。

1 方法

1.1 预测循环神经网络架构

雷达临近预报本质上是一个时序数据的预测问题，神经网络需要根据不同时次雷达反射率因子的分布规律，预测未来一段时间内反射率因子的位置。其中的关键点是使不同时次的神经网络能够获得部分前序神经网络的记忆，这是一个典型的循环神经网络(RNN)解决的问题。

目前，最成功的RNN架构是LSTM-RNN,由首先Hochreiter等[18]提出。相比常规的RNN单元，LSTM单元增加了3个控制门(遗忘门、输入门、输出门)，可以有效解决学习过程中的梯度膨胀或梯度消失问题，使神经网络学习到长期的依赖关系。该模型在语音识别、自然语言翻译和手写识别等场景中均取得了很好的应用效果[19-20]。

全场的雷达反射率因子临近预报，以格点作为最小预报单位，逐格点进行预测。在实际天气过程中，雷达反射率因子是在天气系统驱动下发展变化的，所以在进行预测时，不仅需要考虑该格点的反射率因子时间变化规律，还需要考虑该格点周围的天气形势，在雷达观测中表现为格点周围的反射率因子特征。这使得在构造RNN时，不仅需要考虑时间信息的记忆，还要考虑空间信息的记忆。

本文提出使用由ST-LSTM单元组成的预测网络进行雷达组合反射率因子临近预报试验。预测网络采用多层RNN架构，在时间记忆模块循环的基础上，增加了空间记忆模块的传播路线，强化了空间信息在不同层次和不同时间的神经元中的传播。在雷达临近预报中，该架构更有利于让模型学习不同尺度雷达反射率因子特征以及它们在时间线上的发展演变规律。

1.2 ST-LSTM单元

ST-LSTM单元是LSTM单元的一种扩展。在ST-LSTM单元中包含两种记忆模块，即时间记忆模块和空间记忆模块。其中，时间记忆模块是前n时刻同一层神经元的记忆累计，空间记忆模块是前n时刻不同层神经元的记忆累计。与LSTM类似，两个记忆模块分别有各自的3个控制门:遗忘门控制模块中需要被遗忘的记忆内容，输入门决定当前时刻的输入需要被模块记住的内容，输出门决定隐层输出内容。最后将两个记忆模块的内容融合成单元的隐层输出。

在雷达回波临近预报中，ST-LSTM单元和传统LSTM单元相比的优势主要体现在两点：①将状态累计和隐层输出的运算过程由前馈式计算替换为卷积形式。其核心本质与LSTM一致，将上一层的输出作为下一层的输入。不同之处在于加入卷积操作后，神经元不仅能够得到时序关系，还可以提取空间特征。②增加空间记忆模块，有助于不同维度的空间特征信息在RNN中传播。

2 数据

2.1 数据集

为了测试算法地域适用性，本文选择北京大兴SA波段雷达(39.809°N，116.472°E)和广州SA波段雷达(23.004°N，113.355°E)作为试验对象，分别构造学习数据集和独立检验数据集。两部雷达皆为多普勒天气雷达，采用VCP21观测方式，径向分辨率为1 km。数据集信息如表1所示。

表1 数据集信息Table 1 Information of dataset

2.2 雷达资料预处理

本文使用雷达组合反射率因子进行临近预报试验。雷达观测受大气环境和硬件性能等影响，观测结果中可能包含非气象目标物产生的噪声、大气湍流造成的回波脉动、干扰回波等，对预报结果影响较大。所以需要对雷达资料进行预处理，减小杂波的影响。预处理的主要内容如下：①构造奇异点滤波器和双边滤波器在值域和空间域进行滤波，在保留回波特性的前提下，可以有效消除脉动和杂波[21]；②构造反射率因子垂直递减率滤波器，过滤地物回波和部分超折射回波[22]；③计算年平均反射率因子分布，确定遮挡方位角，并进行线性内插填补；④构造高通滤波器去除15 dBZ以下的反射率因子，只保留与降水相关的反射率因子；⑤为了避免零度层亮带的干扰，在合成组合反射率因子产品时，只使用仰角为0.5°,1.5°,2.5°,3.4°和4.3°的反射率因子[23-24]。

图1给出的是组合反射率因子预处理结果。其中，图1a为原始组合反射率因子，图1b为预处理后的组合反射率因子，图中红圈处的杂波已得到有效抑制，雷达站西南方向的衰减径向也得到有效填补。同时，回波形态基本得到完整保留。

图1 雷达资料预处理(a)原始组合反射率因子,(b)预处理后的组合反射率因子Fig.1 Result of radar data pre-processing(a)original composite reflectivity,(b)composite reflectivity after processing

以预测网络为架构，开展循环神经网络在雷达临近预报中的应用研究。使用训练集数据，分别对广州和北京大兴雷达进行建模。其中一组试验输入包括10个连续时次的雷达观测，预测网络会给出未来10个连续时次的回波预测。采用监督学习的方式进行，试验的真值为后续10个时次的雷达观测。模型代价函数为全场逐格点的均方根误差。

3 检验

3.1 检验方法

本文设计了预测网络法和交叉相关法的对比试验，其中交叉相关法为在SWAN2.0中集成推广的算法[25]。选用命中率(POD)、虚警率(FAR)和临界成功指数(CSI)对预报结果进行量化评估，并以交叉相关法为基准，给出预测网络法的技巧评分(E)，E为预测网络法和交叉相关法的CSI之差。

在计算命中数、空报数和漏报数时，采用逐格点的计算方式，即选用同一个格点的预报值和观测值进行对比。在处理作为真值的观测数据时，使用和预报试验同样的数据预处理方法。

预报产品分辨率为0.01°×0.01°，预报时间步长为6 min，预报时效最长为60 min，即预报给出6 min，12 min，18 min，24 min，30 min，36 min，42 min，48 min，54 min和60 min之后的组合反射率因子的强度和位置。采用分预报时效和分阈值的检验方法，预报时效共10个，阈值分别为20 dBZ，30 dBZ和50 dBZ，检验组合反射率因子不小于阈值的格点，共30组检验结果。

3.2 长期检验结果

使用第2章介绍的独立检验集，对北京大兴和广州两个雷达站分别进行长时间序列独立检验。表2、表3分别给出北京大兴雷达和广州雷达30 min和60 min预报时效的3个反射率因子阈值检验结果。由表2、表3可知，预测网络法在两部雷达的试验中，在3个检验阈值CSI均高于交叉相关法；预测网络法在两部雷达的试验中，在3个检验阈值，POD均高于交叉相关法，FAR均低于交叉相关法；预测网络法和交叉相关法的预报能力随预报时间的延长而下降，具体表现为CSI和POD随时间下降，FAR随时间上升；预测网络法和交叉相关法预报能力随组合反射率因子上升而下降，对强度超过50 dBZ 的区域，预报能力都显得不足。

图2分别给出两个站技巧评分随预报时效的变化规律，技巧评分大于0，表示预测网络法的预报能力超过交叉相关法。由图2可知,预测网络法在两部雷达的试验中，在全部检验项目内，CSI均超过交叉相关法；在20 dBZ和30 dBZ检验项目内，技巧评分随预报时效的增长而上升，这说明在这两个反射率因子区间内，预测网络法的预报能力随预报时效的延长下降更慢；在50 dBZ检验项目内，技巧评分相对最低，但考虑到这一区间内的两种方法的CSI评分均较低，0.05的技巧也带来明显提升。

表2 北京大兴雷达检验集对比检验Table 2 Quantitative result of Daxing radar in Beijing

表3 广州雷达检验集对比检验Table 3 Quantitative result of Guangzhou radar

3.3 个例检验

3.3.1 飑线天气过程

2017年7月7日京津冀地区受东移南下的飑线影响，部分地区出现雷阵雨天气，并伴有雷暴大风、冰雹等灾害性天气，地面自动气象站观测瞬时风力达9级。图3a给出了7日22：54(北京时，下同)的组合反射率因子实况产品。图3b为预测网络法21：54起报的60 min临近预报。对比图3a和图3b可以看到，预测网络法60 min预报的组合反射率因子位置和分布与实况基本一致，正确预报出位于北京西部和天津东北部的两条强回波带。其中天津东北方向的强回波带中，两个强中心团得到分离，与实况基本一致。在强度变化方面，北京西部的强回波带范围有所扩大，强度略加强，说明模型学习到了组合反射率因子发展的规律，强度加强判断正确；但在河北西部偏南地区次强回波中心的预报中，预测网络法给出强度减弱的错误判断。这说明预测网络法可以根据不同的组合反射率因子特征，给出不同的强度变化预测。对比图3a和图3c可以看到，交叉相关法对于快速运动的飑线天气过程，出现外推结果明显失真问题。

图2 技巧评分Fig.2 Difference between CSI of two methods

图3 2017年7月7日飑线过程实况和预报对比(a)22：54北京大兴雷达组合反射率因子实况，(b)预测网络法21：54起报的60 min预报产品，(c)交叉相关法21：54起报的60 min预报产品Fig.3 Comparison between observation and forecast on 7 Jul 2017 (a)observation of composite reflectivity of Daxing radar in Beijing at 2254 BT,(b)60 min forecast at 2154 BT using PredRNN,(c)60 min forecast at 2154 BT using COTREC

表4给出了两种方法的客观检验结果。由表4可知，与长时间序列检验结果类似，预测网络法和交叉相关法相比，前者CSI高，POD高，FAR低，说明预测网络法在此次飑线天气过程中预报能力更强。

表4 2017年7月7日北京大兴雷达检验结果Table 4 Quantitative result of Daxing radar in Beijing on 7 Jul 2017

3.3.2 短时强降水天气过程

2017年8月22日广东受台风天鸽(1713)外围云系影响[26]，出现短时强降水天气过程，部分地区降水超过20 mm·h-1。图4a为22日21：30的广州雷达的组合反射率因子实况产品，图4b为预测网络法20：30起报的60 min临近预报，图4c为交叉相关法20：30起报的60 min临近预报。此次过程雷达强回波团在台风外围环流形势的影响下，向西南方向移动。对比图4a和图4b可以看到，预测网络法60 min预报的广东省内组合反射率因子形态完整，位置和实况基本一致，回波强度也与实况比较接近。其中，强回波中心分裂成两个相对独立的中心，与实况基本相符。在强度变化方面，广东省内的强回波范围略扩大，强度略加强和实况基本一致。但对于海上的回波，预测网络法给出了强度减弱的错误判断。对比图4a和图4c可以看到，根据交叉相关法预报结果，强回波中心已向西到达112°E附近，明显过快估计组合反射率因子的移动速度。

图4 2017年8月22日个例实况和预报对比(a)21：30广州雷达组合反射率因子，(b)预测网络法20：30起报的60 min预报产品，(c)交叉相关法20：30起报的60 min预报产品Fig.4 Comparison between observation and forecast on 22 Aug 2017 (a)observation of composite reflectivity at 2130 BT,(b)60 min forecast at 2030 BT using PredRNN, (c)60 min forecast at 2030 BT using COTREC

续图4

表5给出了两种方案的客观检验结果。同3.3.1 节客观检验结果相似，对比检验两种方法发现，预测网络法在全部检验项目中表现更佳，CSI高，POD高且FAR低。

表5 2017年8月22日广州雷达检验结果Table 5 Quantitative result of Guangzhou radar on 22 Aug 2017

4 小结

本文详细介绍了预测网络模型，并以该模型为基础，进行雷达临近预报试验，并与交叉相关法进行对比，得到以下主要结论：

1) 预测网络模型是传统LSTM-RNN的改进版。通过加入卷积计算和空间记忆模块，预测网络模型具有较好的空间特征提取能力，是一种适合雷达临近预报应用的RNN网络架构。

2) 对比试验表明：相比于交叉相关法，预测网络法在0～60 min的雷达临近预报中，对于20 dBZ和30 dBZ检验项目，CSI评分可以提升0.15～0.30，POD提高0.15～0.25，FAR降低0.15～0.20。

3) 个例检验表明，预测网络法对于组合反射率因子变化有一定的预报能力。

同时，预测网络法做为一种非线性统计模型，还存在以下局限性：①该模型建立在大量历史数据的拟合上，对历史数据的数量有一定要求。而冰雹、短时强降水、龙卷等强对流天气的历史个例不多。故该方法对于强对流天气的预报能力还需要进一步提高。②该方法的预报能力随预报时间的延长迅速下降，60 min的预报准确率下降明显，尤其是对于强回波中心的预报准确率不高。

今后需要对预测网络模型进行进一步优化。考虑在模型的输入中增加数值预报环境场，使模型对天气形势的认识更加丰富，提高模型在回波强度演变特征方面的预测精度。另外，考虑更新RNN的成本函数，使用与反射率因子强度成正比的带权重的代价函数，通过提高强回波在拟合过程中的权重，提高模型对于强回波区的预报能力。