基于GRU神经网络的雷州半岛近海岸能见度短临预报研究

2023-10-27 06:34:14殷美祥罗瑞婷陈荣泉刘显通
热带气象学报 2023年2期
关键词:海雾雷州半岛单站

殷美祥,罗瑞婷,陈荣泉,刘显通

(1. 广东省气象服务中心,广东 广州 510641;2. 广东省突发事件预警信息发布中心,广东 广州 510641;3. 肇庆市气象局,广东 肇庆 526000;4. 中国气象局广州热带海洋气象研究所,广东 广州 510641)

1 引言

大气能见度是表征大气透明程度的重要物理量,是基本气象观测项目之一。大气能见度受到水汽、降水、雾霾、风等的影响,其变化具有复杂的非线性和局地性特征,因此其精细化预报业务仍是气象预报业务中最具挑战的领域之一[1-4]。雷州半岛地区三面环海,是全国沿海地区四大海雾高发区域之一。湛江港是我国沿海主要港口之一,是“一带一路”倡议的战略支点港和西南沿海港口群的龙头港。冬春季雷州半岛常因低能见度事件导致港口航线停航,甚至导致海上交通事故,对港口生产和港口经济造成巨大损失。为了保证海上交通安全,减少低能见度天气下的灾害发生,亟需提高雷州半岛沿岸能见度短临预报能力[5-7]。

目前能见度预报主要是采用天气学诊断方法、传统统计方法和数值预报方法[8-11]。孙连强等[12]采用常规气象观测资料和卫星资料,研究了丹东附近海域海雾的变化规律和条件,研发了基于天气学预报方法的海雾预报方法。黄辉军等[13]基于海洋气象观测数据,分析海雾液态含水量的演变特征及其同期的天气学背景,表明更大范围的均压场,小的低空和地面风速,弱不稳定状态的低层大气,高湿度的近地层更容易造成海雾过程中低能见度的出现。王燕滨等[14]在对朝连岛海区海雾天气学特征总结后,建立海雾预报方程,用主成分分析方法对雾日数进行外延预报,其趋势预报准确率达到85%。高荣珍等[15]采用青岛地面观测资料和FNL 再分析资料,利用分类与回归树方法构建青岛沿海海雾决策树预报模型,结果表明72 h内海雾预报准确率达到70%~75%,可基本满足常规业务预报需求。黄辉军等[16]采用NCEP 再分析气象资料、台站观测资料和海雾野外试验的观测资料建立预报变量因子,利用GRAPES 模式得到变量因子,选取湛江、珠海、汕头3 站为代表,构建24 h 的广东沿海海雾判别预报,检验表明该海雾MOS 判别预报方法预报准确率为84%~90%。饶莉娟[17]基于WRF(Weather Research and Forecasting)模式,研究其不同边界层方案对黄海海雾的模拟效果,选取2次典型的海雾个例作为研究对象,利用卫星反演数据、再分析数据与常规观测数据,详细分析海雾演变特征、海雾天气形势与边界层特征,对比分析不同参数方案对海雾的模拟效果。史得道等[18]采用WRF 中尺度数值模式,基于循环三维变分数据同化方案,构建渤海海雾数值预报系统,经过20次海雾过程统计检验,预报准确率达到60%。崔驰潇等[19]利用WRF模式耦合不同闭合方式边界层参数化方案,对江苏地区的一次平流雾过程进行数值模拟,对比分析模拟结果与实测气象数据,评估了他们对此次平流雾模拟效果,分析边界层高度对此次平流雾的生成和发展的影响。姜昊宇等[20]利用WRF 模式,利用SLAB 方案与Noah 方案2 种陆面方案,对一次陆地雾和一次海雾个例进行模拟并进行对比分析,探究模拟效果迥异的原因。但是天气诊断方法需要大量人力成本,且难以做好精细化预报。线性回归、逐步回归等传统统计方法对能见度复杂非线性特征处理能力不足,难以达到精度的要求。海雾数值预报模式近年来取得了良好的业务应用效果,受到初始场限制和运算时间成本影响,难以根据实况进行快速运行迭代。

近年来,机器学习在雾天气和大气能见度预报等方面表现出了显著优势[21]。机器学习在理论上能以任意小的误差来近似任意的连续函数,能够根据大量的气象观测数据学习出能见度规律的数学表示[22-24],从而实现对能见度预测。相比传统的能见度预报数学模型,基于机器学习技术的能见度预测模型能根据气温、气压、风力和相对湿度等气象观测数据学习出特征表示,并学出气象观测数据与能见度的映射函数,从而应对了天气的瞬变性。韩婷婷[25]利用卷积神经网络和长短期记忆网络结合构建大雾短临预测模型,通过实验确定预测模型的最优参数,并证明了预测模型的有效性。郑成[26]基于时间卷积网络与迁移学习提出了一种能见度预报方法,先对源域能见度数据进行学习,优化模型参数,再对目标域的小数据集进行学习,证明了在小数据集条件下,迁移学习能够提升模型的预报性能。赵亚[27]利用深度学习构建预测能见度模型,并与传统的BP 神经网络对比,证明了深度学习模型预测能见度的效果要比传统的BP神经网络效果更好。

因气象观测数据少、能见度局地特征强、气象条件复杂多变等问题,目前基于深度学习的近海岸能见度预报研究不多。李昕蓓等[28]利用福州气象观测站地面观测数据,基于循环神经网络建立了福州单站能见度短临预报模型。检验表明,相比传统BP 神经网络,循环神经网络对能见度预报具有优势,其平均绝对值误差比传统BP 神经网络减小12.90%。胡海川等[29]基于BP 神经网络方法,利用地面常规气象观测数据及NCEP 再分析资料,构建环渤海沿海城市能见度预报模型,检验表明该方法对低能见度天气过程的能见度预报具有指示意义。可见,在雷州半岛地区基于深度学习的近海岸能见度预报研究几乎是空白的。本文以湛江市国家基本气象站作为主要参考站,将GRU神经网络应用于雷州半岛近海岸能见度短临预报模型构建,研究不同的模型结构对雷州半岛近海岸能见度的短临预报能力。

2 数据与方法

2.1 数据来源

本研究使用的数据包括广东省湛江、遂溪、吴川、雷州国家气象观测站(图1)2017 年1 月1 日—2020 年12 月31 日(北京时间,下同)气象观测历史数据。以上气象观测站每5 min采集一次数据,气象要素包括1 min 平均能见度、5 cm 地温、草面平均温度、小时内最高地表温度、小时内最低地表温度、气温、相对湿度、海平面气压、蒸发、水汽压、地表温度、露点温度、过去12 h 极大瞬时风速、过去3 h降水量、24 h变温、10 min平均风速等。

图1 雷州半岛沿岸代表站点分布

2.2 数据预处理

初始数据集在部分时段存在缺失值,本研究利用拉格朗日插值方法[30]对缺失值进行处理,形成完整的能见度实况数据集,共421 091 组数据。由于能见度实况数据与各变量的数据范围不同,为了减少误差,提高深度学习训练的速度,对能见度实况数据集各变量进行标准化(公式(1))处理,将各变量的值缩放至0~1区间内,

式中,X为某一气象因子原始值,Xmin表示其最小值,Xmax表示其最大值,X'表示X归一化后的值。完成归一标准化后,把能见度实况数据集按照7:3划分为训练集和测试集,其中训练集294 763组数据,测试集126 328组数据。利用前24 h的数据预报未来1 h 的能见度,形成适合训练GRU 模型的输入数据。为了保证测试样本的独立性,将测试样本进行随机排序。

为了保证输入预报模型的因子具有统计学意义,对能见度实况数据集进行person 相关性分析,p值设为0.05,如公式(2)所示,

其中,Xi为某一气象因子的第i个时间节点对应的数值为某一气象因子的平均值,Yi为第i个时间节点能见度值为能见度平均值,R为计算得到的相关系数。

2.3 相关性分析

能见度降低的主要因素是大气中悬浮粒子对可见光的散射和吸收造成的。除了大气污染物外,气象要素会通过直接或间接方式影响能见度的变化。将湛江站能见度与同时刻的各气象因子进行相关分析,研究其相互关系及影响机理,挑选出相关系数较大的22个因子,其p值都小于0.05,均具有统计学意义。

水汽主要是通过两种方式来影响能见度,一是本身对可见光的散射和吸收,二是使边界层中吸湿性气溶胶吸收更多水分,增加气溶胶的散射截面,改变气溶胶的光学性质,造成能见度降低。上述影响机理同样可解释相对湿度、水汽压、温度露点差等气象要素和能见度的关系。

边界层温度场通过影响大气层结稳定性,影响大气悬浮粒子的聚集或者散射,从而间接影响能见度的变化。

稳定的气压场,有利于边界层中气溶胶和水汽的聚集,从而降低能见度,反之不稳定的气压场容易提高能见度。

风对能见度的影响比较复杂,风速较低时,大气颗粒物不容易扩散,导致能见度下降;较大的风容易稀释大气颗粒物,从而提高能见度水平。

气温对能见度的影响是多方面的,由辐射而降温时,有利于能见度降低,由冷空气入侵而降温时,有利于能见度提高。

蒸发量受风、日照、温度等其它气象要素影响,表现为多种气象要素共同对能见度的影响,一般蒸发越大,能见度越好。

能见度有日变化特征,雾容易在凌晨形成,导致能见度降低。日出后,气温升高,相对湿度减小,大气层结不稳定度增加等因素,有利于能见度提升。海雾容易在冬春季生成,夏秋季较少,因此能见度也有月变化特征。

相比本站的气象要素,周边上下游的遂溪、雷州、坡头站能见度与本站的能见度相关系数更高,均超过0.5。因为影响雷州半岛近岸沿海能见度的雾主要是平流雾,此类雾特点是水平范围很广,这导致湛江站能见度变化与上下游观测站的能见度除了时间维度联系,在空间维度上也有联系。因此本文将同时引入周边上下游自动站能见度观测资料,包括遂溪、雷州、坡头站,用于构建短临能见度预报模型。

表1 湛江站能见度与各气象因子相关关系

2.4 模型构建方法

本文分别使用门限循环神经网络(GRU)和多元逐步回归方法进行模型的构建,对1 h后的能见度进行预报,从而实现逐5 min更新的高时间分辨率能见度短临预报。

2.4.1 门限循环神经网络(GRU)

门限循环神经网络(GRU)是2014 年提出的全新的神经网络结构(图2),它弥补了循环神经网络(RNN)无法学习长期依赖关系的不足,又比长短期记忆神经网络(LSTM)参数更少,结构更简单。在对门限循环神经网络(GRU)进行训练的过程中,需要计算更新门、重置门,这两个门的值都在0~1之间,代表对特征信息的过滤程度。门限循环神经网络(GRU)的前向传播如公式(3)~(6)所示,

图2 GRU神经网络结构示意图

其中,Zt为t时间步时更新门状态值,rt为t时间步时重置门状态值,σ为Sigmoid 激活函数,ht-1是t-1 时间步输出的状态信息,xt为当前时刻输入的能见度特征向量表示t时间步时状态信息候选值,ht是t时间步输出的状态信息,tanh为双曲正切激活函数。Wz、Wr、Wh͂为权重矩阵参数。

2.4.2 多元逐步回归方法

多元逐步回归预报方法是一种建立最优多元回归方程的统计方法。根据因子的显著性程度,从大到小依次逐个引入回归方程。每次引入新的因子后,都对回归方程中所有的因子逐个进行检验,并剔除方差贡献变得不显著的因子,直至既无显著变量可引入回归方程,又无不显著的变量留在回归方程中为止。

2.5 模型定量评估方法

本研究采用均方根误差RMSE、平均绝对误差MAE、决定系数R2来定量评价预报模型的精度。其中,RMSE、MAE 越小,说明模型精度越高,而R2越大,模型精度越高。各指标计算公式如公式(7)~(9):

式中,n为数据的数量为预报值,yj为真实值为真实值的平均值。

3 结果与分析

3.1 预报模型构建

为了测试不同建模方法和方案的效果,本研究数据资料分别使用单站和多站的气象观测数据,建模方法分别使用GRU 神经网络和多元逐步回归法,建立对应的预报模型,进行试预报检验,分析不同数据和方法的预报效果。

GRU神经网络隐藏层节点的设置会影响预报模型的准确性。通过大量的训练,对比不同变量因子组合方案,不断优化神经网络各项参数,挑选最优GRU 参数构建模型。最终采用两层GRU 隐藏层,其中,第一层GRU 隐藏层节点数为128,第二层GRU 隐藏层节点数为96,两层GRU 隐藏层后都设计一个dropout层,设置为0.2。在训练过程中,取训练集和测试集比例为7:3,采用SGD 更新方式,损失函数采用均方误差MSE,训练epoch 为100 次,batch 为32,学习率为0.001,采用早停机制避免过度拟合,耐心值patience 为20,形成能见度单站GRU 预报模型VisNetS 和能见度多站GRU预报模型VisNetM。

接着采用多元逐步回归方法建立预报方程。采用资料与神经网络一致,设定p值为0.05,经过对因子进行多次的引入和剔除,最后选取16 个因子参数建立能见度单站逐步回归预报模型VisMlrS,如公式(10);选取18 个因子参数建立能见度多站逐步回归预报模型VisMlrM,如公式(11)。

3.2 模型预报效果随机检验

基于测试集,采用均方根误差RMSE、平均绝对误差MAE、决定系数R2对比四个预报模型的定量化评价指标(表2)。从模型构建方法看,多站GRU 模型VisNetM 和单站GRU 模型VisNetS 平均绝对误差分别为4.10 km、4.76 km,均方根误差RMSE 分别为5.36 km、5.90 km,显著低于多元线性回归模型,决定系数R2评分分别为0.65、0.57,约为多元逐步回归模型的两倍,因此整体上GRU 模型预报准确率显著高于多元线性回归模型。

表2 各预报模型在测试样本中的预报效果

相比单站数据建模,增加上下游观测站数据,GRU 模型VisNetM 预报准确性得到显著提升,平均绝对误差、均方根误差数值分别减小了14%、9%,决定系数增加了13%。而同样情况下,基于逐步回归方法构建的模型,各类定量评价指标并没有因为引入了上下游观测站数据而得到显著性提高。可见相比逐步回归方法,GRU 模型能够更好地识别并表达出能见度在空间维度上变化特征,从而提升预报效果。

3.3 一次海雾过程的预报检验

选取2022年1月2—3日雷州半岛地区持续性雾天气作为案例,验证模型预报效果。2021 年12月下旬广东省受到寒潮的影响,2022年1月2日寒潮影响结束,冷高压主体逐渐东移入海,雷州半岛处于其后部,气压梯度较小,2 日晚上到3 日凌晨雷州半岛沿海一带转偏东风,此时陆地仍然是弱偏北风,近地面弱东风场将外海暖湿空气输送到陆地冷面(图3)。来自海上暖湿气流经过雷州半岛温度较低的陆面,冷却形成高压入海型的平流雾,自东向西影响雷州半岛。1 月2 日早晨和夜间雷州半岛及其沿海主要以轻雾为主。1月3日海雾逐渐加强,00 时50 分遂溪站首先观测到能见度为900 m,持续到1月3日08时转为轻雾,最低能见度250 m。雷州站于1月3日01时25分观测到雾出现(能见度800 m),并持续到3日09时30分才转为轻雾,期间雷州站出现20 m 左右最低能见度。湛江站在1 月2 日21 时开始出现轻雾,轻雾持续到3 日10时,期间最低能见度为2.3 km (图4)。

图3 2022年1月3日南海北部风场和气温场

图4 2022年1月3日雷州半岛最小能见度分布

四种预报模型都能预报出海雾能见度下降趋势(图5),但是拟合效果有显著区别。多站GRU模型VisNetM 模拟效果最佳,整个过程最契合实况,平均绝对误差MAE 和均方根误差RMSE 分别为1.83 km、2.44 km,决定系数R2达到0.81(表3)。但其对低能见度预报结果较观测偏大,这可能和训练数据中低能见度样本偏少有关。其次是多站逐步回归模型VisMlrM,平均绝对误差MAE 和均方根误差RMSE 分别为2.39 km、3.09 km,决定系数R2达到0.7,尤其是在低能见度时期预报值更接近实况,最低能见度出现的时间也比较接近观测情况。单站GRU 模型VisNetS 模拟效果和单站逐步回归模型VisMlrS效果稍差,二者决定系数R2均为0.62,但单站GRU模型VisNetS既没有预报出轻雾过程中能见度最低值出现的时间,对最低值的预报误差也是最大的。单站逐步回归模型VisMlrS对最低值的预报误差比VisNetS 模型更小。可见,多站GRU模型VisNetM能识别海雾上下游的气象时空特征,以此有效提高了预报准确性。多站逐步回归模型VisMlrM 也能识别上下游的海雾气象时空特征,但是效果稍弱。而单站GRU 模型VisNetS 和单站逐步回归模型VisMlrS 没法识别上下游的海雾气象时空特征,导致预报准确性最弱。另外,并非GRU 预报模型效果一定会比传统的统计模型效果更佳,这需要构建更加有效的模型结构,才能更好地发挥出GRU模型的拟合潜力。

表3 各预报模型在2022年1月2—3日海雾个例过程中的预报效果

图5 各预报模型在2022年1月2—3日海雾个例过程预报效果

4 结论

本文利用GRU 神经网络,采用广东省湛江市国家基本气象站及其上下游站点观测资料,构建湛江市国家基本气象站能见度短临预报的多站GRU 模型,并进行了随机样本测试和个例预报检验。同时,对比采用湛江市国家基本气象站观测数据构建的单站GRU 预报模型,以及采用多站和单站观测资料建立的逐步回归预报模型,研究不同的预报模型在雷州半岛近海岸能见度的短临预报能力,得到以下结论。

(1) GRU 模型预报结果与实际观测的变化趋势一致性较好,整体上预报准确性显著好于多元线性回归模型。在随机检验和个例检验中,多站GRU 模型平均绝对误差、均方根误差明显低于多元线性回归模型,决定系数评分明显高于多元线性回归模型。

(2) 合理的模型结构对能见度短临预报效果至关重要,将上下游的气象特征引入到能见度短临预报模型可显著提升预报效果。在个例检验中,多站GRU 模型较单站GRU 模型平均绝对误差、均方根误差下降了36%和29% ,决定系数提高了30%。相比传统的逐步回归方法,GRU 神经网络能更好地识别上下游能见度的时空变化特征,从而提高沿海近岸能见度临近预报的准确性。

(3) GRU 模型对低能见度预报结果较观测偏大,这可能和训练数据中低能见度样本偏少,高能见度样本占大多数有关。而传统的逐步回归模型并没有出现类似的不足。

本文只用了小部分代表站进行能见度预报模型的构建,还没有将基于GRU 神经网络的能见度的预报潜力完全发挥出来。为进一步提升预报模型性能,今后可进一步优化模型参数和结构,还可增加模型的训练数据,包括增加更长年份的历史数据,或者加入布设密度更大的气象区域自动站数据。今后还可将基于GRU 模型的试验结果与一般的机器学习方法,如随机森林、XGBoost 方法进行比较,对比不同的机器学习方法对近海岸能见度短临预报的能力。本文只使用了一次海雾过程作为预报试验,试验评估数据具有一定的局限性。今后将使用更多个例进行预报模型的检验。

猜你喜欢
海雾雷州半岛单站
基于LoRa的海雾监测系统在漳州的观测精度分析*
海峡科学(2022年8期)2022-10-14 02:55:42
雷州半岛崩岗区不同植被重建模式下林下植物多样性分析
桉树科技(2022年2期)2022-07-11 09:32:40
稳定的红牛有多强,维斯塔潘单站大满贯
——2022 F1意大利大奖赛
世界汽车(2022年5期)2022-06-10 10:18:36
单站优化,打造综合生态圈——专访中国石油辽宁沈阳销售分公司副总经理梁洪涛
基于方位角和匀速圆周运动的单站无源定位算法
雷达与对抗(2021年4期)2021-03-18 02:33:16
清代雷州半岛糖贸易及其规范化——以新发现的雷州花桥碑刻为例
广州文博(2020年0期)2020-06-09 05:14:34
基于FY-3B卫星资料的中国南海海区1—3月海雾时空分布特征研究
雷州半岛石狗文化旅游资源创新开发探析
雷州半岛水与火造就的中国遗世独立
一次黄海海雾的集合预报试验