基于卷积神经网络的长江流域夏季日最高温度延伸期预报方法研究

2022-12-18 06:25雷蕾徐邦琪高庆九谢洁宏

大气科学学报 2022年6期

雷蕾,徐邦琪*,高庆九,谢洁宏②

全球变暖的背景下,高温热浪加剧且频繁发生(Perkins-Kirkpatrick and Lewis,2020),严重影响经济生产、生态环境和人体健康(Horton et al.,2016)。在2016—2019年夏季,我国饱受持续性高温天气的影响,中暑患者增多;区域用电负荷增大,城乡供水出现困难,蔬果作物生长和公共建设等均受到影响,导致人民生命财产和生产生活的严重损失(中国气象局,2017,2018,2019,2020)。

灾害天气的有效预测和及时预警是防灾减灾的关键,但如何延长预报时效和提高预报准确率是当今业务面临的重大挑战。相比于短期天气预报,10～30 d延伸期预报提供了更充裕的决策时间窗口,有利于政府部门防灾减灾工作的开展。然而,相较于发展成熟的天气预报和气候预测,延伸期业务预报起步较晚,数值模式所提供的有效预报时长十分有限(章大全等,2019),难以满足极端事件频发背景下对更长时效预报的迫切需求。目前数值模式对热带季节内振荡模态具有较高的预报技巧(任宏利等,2015;Jie et al.,2017),但对于热带外的降水和气温的延伸期预报,多数模式仅能提供1～3周的有效预报。ECMWF和CMA等11家模式的降水回报试验结果显示(de Andrade et al.,2018),高预报技巧仅限于1周内,2～4周的预报技巧骤降。S2S模式对我国冬季气温的预报技巧可达3～4候(Zhou et al.,2019),而对夏季降水和气温的预报技巧为2～4候(李成程,2018)。Liang and Lin(2018)评估加拿大环境和气候变化部门的月预报系统发现,该系统对中国东部部分地区的气温预报时效高达4周,但仅能提前5～11 d有效预报降水。除了动力模式预报外,学者们考虑了大气低频振荡对天气系统的调控作用,基于统计方法研发了不同的延伸期统计预报模型,部分模型显示出良好的预测效果和应用前景(杨秋明,2018,2021;徐邦琪等,2020),有效地延长了降水和气温的延伸期预报时效。

近年来,由于气象观测和模式数据的大量增加,以及计算机效能的大幅提升,机器学习方法在气象研究和预报上的应用受到大量关注。机器学习方法众多,其中卷积神经网络(Convolutional Neural Network,CNN)因为具有强大的图像识别和非线性模拟能力,在气象预报领域受到广泛的应用。在短临预报方面,Shi et al.(2015)提出以CNN和长短时记忆网络(Long Short-Term Memory,LSTM)相结合的ConvLSTM方法,识别雷达回波图的时空演变特征,并进一步预报降水,预报效果超过了传统的光流法。在季节预报方面,Ham et al.(2019)和贺圣平等(2021)分别将CNN应用到ENSO和东亚冬季气温的预报中,通过CNN识别前期要素场的时空信号进行建模并预报,回报试验显示其预报效果超过了动力模式。另外,Weyn et al.(2020)采用CNN预报500 hPa位势高度和2 m气温,其2～14 d的中短期预报性能接近ECMWF预报系统;Weyn et al.(2021)又进一步提出基于CNN的次季节集合预报模型,其对未来2～6周的气温预报技巧已十分接近ECMWF集合预报。由此可见,CNN具有应用于天气气候预测的强大潜力,然而目前对CNN应用于10～30 d延伸期预报的研究较少。如何充分发挥其识别图像的优势性能,并在物理的基础上构建基于CNN的延伸期预报模型,是亟待开展的工作

科学家已指出大气季节内振荡是延伸期天气预报的主要可预报性来源(丁一汇和梁萍,2010),季节内振荡的周期变化和空间移动特征可为10～30 d延伸期预报提供前兆信号。但影响东亚天气气候的季节内振荡复杂多变,包括来自赤道地区的30～60 d季节内振荡、西太平洋的准双周振荡以及中高纬的低频信号(Chen et al.,2015;Yang and Li,2016;陈栋杰,2018;Li et al.,2020;杨双艳和李天明,2020),导致我国不同地区高温热浪的低频信号来源也不尽相同。Chen et al.(2018)指出华南地区高温热浪的发生和维持分别与热带西太平洋向西北传播的5～25 d和30～60 d振荡有关。Hsu et al.(2017)的研究表明长江流域高温热浪的发生概率受10～30 d的BSISO活动的影响,而2018年夏季东北亚的热浪和西太平洋暖池的MJO对流所激发的30～90 d扰动有关(Hsu et al.,2020)。Gao et al.(2018)发现长江流域大部分热浪事件是中高纬和西太平洋的准双周振荡活动相互作用的结果。高庆九和尤琦(2019)指出江南的极端高温可能和中纬度10～15 d及20～25 d波列的移动有关。有效辨识影响区域灾害天气的关键低频信号,并将其应用在延伸期预报方法中,是提高预报技巧的关键。

长江流域是高温热浪的多发区(Hsu et al.,2017;Gao et al.,2018),本研究聚焦长江流域夏季日最高温度变化机理和延伸期预报方法研究,通过观测数据明确影响长江流域夏季日最高温度的低频信号来源,并基于CNN方法客观辨识信号、建立延伸期统计预报模型,经由一系列预报试验和技巧检验,给出此新方法的预报能力和应用前景。

1 资料和方法

1.1 观测数据

为了研究高温热浪的统计特征和发生机制,我们采用来自美国气候预测中心(Climate Prediction Center,CPC)的全球逐日日最高气温(Tmax)资料(Pan et al.,2019),空间分辨率为0.5°×0.5°。大尺度对流和环流数据分别来自NOAA逐日OLR资料(Liebmann and Smith,1996)和NCEP/NCAR的逐日再分析数据(Kalnay et al.,1996),变量包含三维风场、高度场、气温场、地表辐射和热通量,空间分辨率为2.5°×2.5°。数据长度为1979—2019年,本研究主要关注夏季(5—9月,MJJAS)。

高温热浪事件通常指持续时间长的极端高温过程,采用百分位阈值和持续时间来定义局地事件强度。极端高温热浪事件的定义为Tmax超过该格点第95百分位阈值并持续3 d及以上;而中等强度但持续时间长的热浪事件定义为Tmax超过该格点第75百分位阈值并持续10 d及以上(Hsu et al.,2017)。

1.2 机器学习和卷积神经网络原理简介

在机器学习(或称训练)的过程中,卷积核的权重参数和网络各层之间的连接参数将据特定的优化算法自动更新,使得CNN的预测值和真实值的误差(“损失函数”)逼近最小值;一旦训练结束,CNN的各类参数锁定,可对未接触过的新数据进行预测(LeCun et al.,2015;贺圣平等,2021)。

1.3 温度诊断方程

为了明确局地气温变化的物理过程,采用三维温度方程和地表能量平衡方程进行诊断。温度方程表明温度的变化来自水平平流过程、绝热和非绝热加热过程:

(1)

近地表的Q1和辐射加热、潜热释放和地表扰动热通量有关，地表向上净通量Fs收支方程可表示为：

Fs=SSR+STR+SHF+LHF+G。

(2)

其中：SSR和STR分别表示地表净短波辐射和净长波辐射通量；SHF和LHF表示感热和潜热通量；地表储存的热通量G通常都很小，在我们的研究中不考虑。正值表示净向上的通量。

1.4 统计方法

不同尺度(10～30 d和30～60 d)的低频分量通过Lanczos带通滤波方法(Duchon，1979)得到。

对相关系数进行显著性检验时考虑了低频数据的自相关性，采用有效自由度(Davis，1976；Chen，1982)，有效自由度Edof定义如下：

(3)

其中：n为时间序列的长度；Rxx、Ryy分别为变量x和y的自相关系数；j为滞后时间；通常取为n的一半；*表示标准化。

2 夏季长江流域Tmax的低频特征和物理机制

图1显示了夏季(MJJAS)欧亚大陆地区的Tmax气候平均值、方差变率和高温热浪发生概率的分布。我国中东部地区夏季温度高(图1a),其中,长江流域地区(Yangtze River Basin,YRB)为温度变率大值区(图1b),显示该地区较易出现极端气温事件。统计结果发现,YRB确实是持续时间长的中等热浪事件(图1c)和极端高温热浪事件(图1d)的高发区,因此,选取该地区(105°～122°E,26°～32°N)作为研究区域。该区域与Hsu et al.(2017)、Gao et al.(2018)、Xie et al.(2020)定义的长江流域高温热浪区域范围基本相符。作为中国人口密集和经济发达的地区,提高YRB地区的Tmax延伸期预报能力,对于保障人民生命健康、提高政府决策效率以及防灾减灾工作的开展具有重要的意义。

图1 1979—2019年夏季(MJJAS)Tmax的平均值(a)和标准差(b)分布(单位:℃),以及中等但持续时间长的热浪事件(c;超过75th阈值持续10 d以上)和极端高温热浪事件(d;超过95th阈值持续3 d以上)的发生概率(单位:%);方框表示长江流域地区(105°～122°E,26°～32°N)

我国夏季持续性高温的发生与大气低频系统活动有关(Hsu et al.,2017;Chen et al.,2018;Gao et al.,2018),进一步确认YRB区域低频Tmax的主要变率周期(图2),YRB的日最高气温具有显著的10～30 d和30～60 d的低频振荡信号,通过带通滤波将此两频段滤出后,分别计算10～30 d和30～60 dTmax标准差与夏季逐日Tmax标准差的比值,发现10～30 d和30～60 d振荡周期均是YRB夏季Tmax的主要变化模态,两者(10～30 d和30～60 d变率)在YRB区域Tmax的解释方差分别为46.84%和26.90%(图3)。

图2 1979—2019年夏季(MJJAS)YRB区域平均日最高温度的功率谱合成(黑色实线,单位:℃2;首先计算每年夏季的功率谱,再计算功率谱的气候平均;红色实线表示红噪声谱;蓝色虚线和绿色虚线分别表示红色噪声的95%和5%置信水平;在功率谱计算前去除了年循环分量(逐日气候平均值和前3个谐波分量),并通过5 d滑动平均去除天气尺度高频变化)

为了了解YRB地区Tmax变化的空间型态,分别对10～30 d和30～60 d 的Tmax距平场进行EOF分析(图4)。图4显示了1979—2019年夏季期间YRB的低频(10～30 d和30～60 d)Tmax主要模态:两个频段的Tmax模态分布相似,第一模态呈现出YRB区域一致特征,解释方差可达66%～72%;第二模态的解释方差约为12%～14%,呈现出西北-东南偶极型分布;第三模态则呈现东北-西南偶极型分布,解释方差约为6%～7%。10～30 d和30～60 dTmax前3个EOF模态的总方差贡献率都超过了85%,均通过了统计检验(North et al.,1982),显著区别于其余模态。

为了有效建模并进行独立预报试验,自此处开始,前25 a的数据(1979—2003年)为分析和诊断的时段,并基于此时段的分析结果及得出的潜在预报因子进行建模,以避免与预报试验(2004—2019年)的数据发生重叠,造成过拟合的误差。为了明确影响YRBTmax的关键低频信号,将10～30 d和30～60 dTmax前三个模态的时间序列(PCs)分别与低频大尺度对流(10～30 d/30～60 d OLR)和中、高层高度场(10～30 d/30～60 d H500及H200)进行超前-滞后相关分析。由于图形众多,部分信号演变复杂,总结了影响YRB低频气温(包含10～30 d和30～60 dTmax)的显著大尺度信号来源及其传播方向(表1):1)由欧亚大陆西北部向东南传播的低频波列(图5a;Yang and Li,2016;Gao et al.,2018;杨秋明,2018;Zhu and Yang,2021);2)西太平洋向东亚传播的低频对流(图5b;Chen et al.,2018;Zhu and Li,2018);3)自东北亚向西南传播的环流扰动(图5c;Zhu and Li,2018)。当这些地区的低频对流或环流扰动的对流/下沉位相移至YRB地区时,可能通过云-辐射过程(上升对流区多云、下沉位相为晴空)对局地Tmax产生影响,也可能通过温度平流、绝热/非绝热加热等过程引起气温的变化甚至导致高温热浪的发生。

对YRB地区10～30 d/30～60 d升温个例(∂Tmax/∂t>0)的气温方程合成诊断分析(图6)表明,YBR地区10～30 d(图6a)与30～60 d(图6b)Tmax升温的发生机制相似,主要来自绝热(与大气垂直运动和静力稳定度有关)和非绝热加热过程,而水平气温平流呈现微弱的负贡献。近地表的非绝热过程包含辐射和热通量过程,通过地表能量平衡方程诊断(图略),进一步确认了向下短波辐射增加有利地表升温,温暖的地表面又导致向上的长波辐射和感热通量加强,加热近地表大气。综上所述,低频对流和环流传播至YRB地区时,异常垂直运动引发的绝热加热作用,以及相关的云-辐射反馈过程,是导致局地低频增温的主要物理过程。由此可见,大尺度对流/环流场的低频信号与长江流域Tmax演变之间存在着重要的物理联系,是本研究将低频环流/对流场引入延伸期预报模型的物理基础。

3 基于CNN的YRB Tmax延伸期预报模型

3.1 建模思路和CNN模型结构

前一节的统计分析可知,影响YRBTmax变化的前兆信号包括来自热带和中高纬的低频对流/环流扰动(图5),其可作为延伸期预报的潜在预报因子,对YRBTmax进行建模预报。由于每一次引发Tmax异常的信号来源(起源地)、传播方向和强度并不一致,假若采用基于区域平均气象变量的多元线性时滞回归模型(黄世成等,2014;Yang and Li,2016)或是考虑基于预报因子和预报量的时空耦合模态的统计模型(徐邦琪等,2020),这些模型采用的预报因子区域范围固定(例如:固定于热带某个海域范围,或是固定于欧亚大陆某个区域范围),当某些预报时刻的预报因子起源和传播特征改变时,则预报因子无法提供有效信息(提供的预报信息与建模所选取的区域范围不一致),而导致预报效果偏低。再者,气候数据的超前-滞后相关分析(图5)仅显示出两个变量的线性关系,无法解析复杂的非线性作用,以此分析仅能辨识出与预报量线性相关的先兆信号。CNN方法则可通过特殊的卷积、池化和非线性映射的运算弥补以上统计方法的弱点:1)卷积有助于提取数据特征,池化则能对特征进行降维,卷积和池化运算综合而成的深层神经网络可以使CNN提取到丰富的数据特征,提高了微小形变的鲁棒性,使得数据特征具有平移和尺度不变性,不随细微的位置平移和范围缩放而改变,即便发生偏移或变形也能对预报有贡献;2)激活函数(如ReLU;Nair and Hinton,2010)可以对数据进行非线性映射,CNN能在历史数据的训练和学习中探索数据间的非线性关系(贺圣平等,2021)。因此,本研究在传统相关分析和物理诊断的基础上,进一步利用CNN方法,通过对大量历史数据的学习,在大尺度空间范围内(42.5°～150°E,0°～67.5°N)客观辨识出影响YRB气温的低频对流和环流信号,并进行建模预报。

图3 1979—2019年夏季(MJJAS)的10～30 d(a)和30～60 d(b)滤波的Tmax标准差与逐日原始Tmax标准差的比值(单位:%;YRB区域平均的数值列于黑框旁)

图4 1979—2019年夏季(MJJAS)YRB 10～30 d(a、c、e)和30～60 d(b、d、f)Tmax的EOF模态(右上角标示了各模态的方差贡献率):(a、b)EOF1;(c、d)EOF2;(e、f)EOF3

表1 与长江地区低频(10～30 d和30～60 d)Tmax前三个模态变化(PC1-PC3)有关的先兆信号

图5 1979—2003年夏季(MJJAS)低频对流(OLR)和环流(H500、H200)与YRB低频Tmax主要模态的超前-滞后相关分析(1—7为lag30 d至lag0 d,lagN d代表低频大尺度场超前PC时间序列N d;填色区域通过95%置信度的显著性检验;绿线标示出低频对流/环流的传播/演变):(a)10～30 d Tmax PC1与10～30 d H500的超前-滞后相关系数分布;(b)30～60 d Tmax PC1和低频OLR的超前-滞后相关系数分布;(c)30～60 d Tmax PC2和低频H200的超前-滞后相关系数分布

图6 1979—2003年夏季YRB地区10～30 d(a)及30～60 d(b)Tmax于升温期间的近地表(925 hPa)温度收支情况(单位:10-7K·s-1;由左至右分别为近地表温度趋势、水平平流、绝热和非绝热加热作用)

图7 基于CNN的YBR Tmax延伸期预报模型的建立流程(X(低频大尺度场)和PC(EOF的时间系数)分别为预报因子和预报量。K为所选取的10～30 d和30～60 d长江流域Tmax的前K个EOF模态(本文中,K=3),fk为CNN所学习得到的预报量和预报因子的关系式;黑色实线表示独立试报阶段t时次的预报流程)

本文参照Ham et al.(2019),采用卷积层和池化层交错堆叠的网络框架,设定3层卷积层和2层池化层以及一个具有6个输出节点的全连接层。各卷积层中卷积核个数分别定为6、12、24,卷积核的大小为3×3,池化核的大小为2×2,采取最大池化方式,使用ReLU激活函数。为了使CNN中间层的输出更稳定并提高训练速度,每个卷积层后连接一个批归一化层;对数据边缘采用0填充以保证卷积前后特征图大小不变。用预报量和观测量之间的平均绝对误差MAE=|ypred-yobs|作为模型的损失函数。优化算法选择通用性高的Adam方法,学习率设定为0.01,采用分批训练方法,批次的大小设定为16。另外,由于CNN受初始化参数的影响较大,我们将采用鲁棒性较强的Kaiming初始化方法(He et al.,2015),各PC都基于20个不同的初始化方案得到20个CNN参数模型,然后取集合平均进行集合预报。

训练的过程中采用以下两种方法防止过拟合问题。第一,在全连接层前嵌套一层Dropout层。在训练过程中,每一个CNN提取出的特征输出到该层后有50%的概率被丢弃。第二,给定模型训练的总轮数,每隔5轮计算模型在验证集上的误差(Weyn et al.,2021),当验证集的误差上升时,停止训练,保存使得验证集误差最小的CNN参数(Mayer and Barnes,2021)。一般而言,当训练集和验证集的误差都下降时,说明模型欠拟合;当训练集的误差下降,而验证集的误差上升时,模型过拟合,因此验证集上的误差有助于判断模型的拟合性能。

3.2 CNN预报模型的技巧检验

验证阶段集合预报的结果(图8a)表明,CNN对10～30 dTmax的第一模态(PC1)和30～60 dTmax前三个模态(PC1-PC3)有最高的预报技巧,提前5～30 d预报结果与观测数据进行时间相关系数(TCC)检验显示,TCC技巧均通过95%置信度的显著性检验。而CNN预报10～30 d的PC2及PC3技巧欠佳,TCC通过显著性检验的预报时次较少,未能提供稳定可行的预报。基于此,在独立试报阶段中,对这4个模态分别进行预报,并进行低频Tmax的空间形态重构,得到最终预报量。独立试报阶段的技巧检验结果显示,CNN能有效预报出这4个低频模态,提前5～30 d预报两种低频分量第一模态的TCC预报技巧都通过了95%置信度的显著性检验,且模型对30～60 d模态的预报技巧较高(图8b)。

图8 CNN模型对YRB Tmax不同模态时间系数的集合预报(基于20个集合成员的平均)技巧(不同颜色代表对不同低频分量和模态的预报;用以验证预报技巧的观测数据为对应这些模态的逐日PCs;虚线表示30～60 d PCs通过95%置信度的显著性检验的临界值,点划线表示10～30 d PC1通过95%置信度的显著性检验的临界值;图a中橙色星号标示了验证阶段中具有高TCC技巧的预报结果):(a)验证阶段;(b)独立测试阶段

为了对长江流域Tmax空间分布进行预报评估,将预报的低频PCs和相对应的EOF模态进行重建后加总,再将年循环分量加回,得到逐日Tmax的空间分布。由于该延伸期预报产品中未考虑天气尺度分量,因此,用来评估预报技巧的观测数据为经过5 d滑动平均的Tmax。图9显示,该模型对YRB区域Tmax皆有较高的预报技巧,在延伸期预报尺度上(提前5～30 d),YRB区域平均TCC在0.63～0.70,且超过半数格点的TCC技巧通过了99%信度检验。模型对Tmax的量级预报误差(RMSE)则在0.77到0.85标准差之间。由图9可见,CNN模型对YRB的西部和东部区域Tmax预报能力较高(有较高的TCC值和较低的RMSE偏差),这2个高预报技巧的地区与Tmax方差变率大值区一致(图1b)。一般而言,方差大值区代表影响该区气象要素的因素和信号较为复杂,导致气象要素出现较大的变率;从预报的角度而言,该区的潜在可预报性来源较多,若预报模型能够较高效能地掌握可预报性来源,则能更好地预报局地气象要素的变化。本研究的结果显示,得益于历史大数据的训练和学习,基于CNN方法建立的延伸期统计预报模型能在复杂多变的数据中,有效地提取和识别预报因子信号及其与预报量之间的联系(LeCun et al.,2015)。

为了验证模型参数的稳定性和适用性,我们也进行了一系列的敏感性试验,包括:提高卷积核的分辨率(由3×3格点提高到2×2格点)和增添EOF预报模态的个数(由3个提高到5个),结果显示,这些改变对预报技巧并无显著的改变(图略),然而却需要更多的计算资源。基于目前的结果,我们建议对于长江流域夏季Tmax的延伸期预报可采用目前的模型架构、EOF降维和重构方法,以及相关参数设定,有利于节省计算资源和提高运算的效率。

3.3 CNN模型预报信号来源:热力图分析

图8、9显示CNN预报模型可在延伸期尺度上对YRBTmax进行有效预报。为了在物理上解释CNN提取的前兆信号(预报因子)和预报量之间的关系,挑选不同预报结果的个例进行热力图(heat map)合成分析(Ham et al,2019;Tang and Duan,2021)。首先,选取独立试报阶段中预报技巧最高的集合预报子成员,挑选预报PC数值超过第95百分位和低于第5百分位的样本进行热力图合成,再计算两者的差值(图10),以探讨CNN模型在输出不同预报结果(预报量偏高/偏低)时大尺度预报因子的信息来源,图10中数值的大小表示各个区域预报因子的贡献度,颜色越深,代表该区域所提供的低频信号对预报量的影响越大。

图9 CNN预报模型于独立预报(2012—2019年夏季)期间Tmax的预报技巧检验(每个子图的右上角标注了区域平均值):TCC(a;黑色实线表示通过99%置信度的显著性检验的临界值)、RMSE(b;单位:标准差)在提前5、10、15、20、25、30 d(1—5)的预报结果

图10 CNN模型对不同预报量的热力图分析(该结果基于集合预报最优子成员,是所有预报提前时间(5～30 d)的合成结果;热力图数值大小表示了该区域低频场所提供的信号对预报的贡献度;填色区均通过99%置信度的显著性检验):(a)10～30 d Tmax PC1;(b)30～60 d Tmax PC1;(c)30～60 d Tmax PC2

对于长江流域10～30 dTmax第一模态的预报,CNN模型捕捉且采用的前兆信号主要来自欧亚大陆经贝加尔湖东传南下的低频信号,与超前-滞后分析的结果相似(图5a),此外,东北亚/华北地区南传的信号和热带西北太平洋向西北传播的信号也被CNN模型采用为预报信息(图10a);对于30～60 dTmax前两个模态的预报而言(图10b和图10c),主要预报信息集中于东北亚和西北太平洋,这些信号与线性统计相关的结果大致相同(图5b、c)。经过历史大数据的学习,CNN模型辨识的前兆预报信息与预报因子和预报量的超前-滞后相关分析一致,主要的预报信号来源仍是中高纬和热带低频波列的传播和演变,显示具有物理意义的大尺度信息仍是延伸期可预报性的重要来源。通过CNN的热力图分析,进一步明确了这些潜在预报因子在实际预报中的相对贡献。

4 总结和讨论

近年来我国高温热浪频发,长江流域地区为高温热浪的多发地区,了解该区域夏季Tmax变化的物理机制和可预报信号来源,进一步借助机器学习方法客观识别先兆信号,建立延伸期预报模型以提高Tmax预报能力,对政府部门及时决策、高温防灾工作顺利开展具有重要意义。

长江流域地区Tmax变率呈现出10～30 d和30～60 d周期低频振荡的特征。超前-滞后相关分析显示出影响YRB地区低频Tmax模态的3种先兆信号来源,包括源于热带西太平洋向北/西北传播的信号、来自欧亚大陆向东/东南传播信号,以及从东北亚向南/西南传播的信号(Yang and Li,2016;Chen and Zhai,2017;Gao et al.,2018;杨秋明,2018;Zhu and Li,2018;Zhu and Yang,2021)。当这些低频对流和环流扰动抵达YRB时,通过绝热和非绝热过程导致YRBTmax的变化。在这些物理基础上,我们将前期低频对流(OLR)和环流(H500,H200)作为预报因子,以YRBTmax的低频空间模态的时间系数(PCs)作为预报量,将CNN应用于历史数据的训练,找到预报因子和预报量之间的关系,实现客观且智能地识别预报因子所提供的前兆信号,并据此预报YRBTmax的变化。预报技巧检验的结果表明,基于CNN的预报模型对10～30 dTmax的第一模态(PC1)和30～60 dTmax的第一模态(PC1)具有最高的预报能力,20个集合成员的集合预报技巧可达30 d(TCC均通过95%置信度的显著性检验)。进一步将预报的PCs与观测的EOF模态进行重构,并叠加气候态空间场,得到未来5～30 d的YRB地区Tmax预报产品。此最终产品与观测相比(独立试报期间),YRB区域平均的TCC均超过了0.62(通过99%置信度的显著性检验),区域平均的量级误差(RMSE)均在1个标准差以下。经过热力图的合成分析,揭示了中高纬和热带低频波列的传播和演变是CNN模型的延伸期可预报性来源。

本研究的结果显示,CNN方法具有应用于延伸期预报的潜能,但在业务化过程仍须进一步优化和改进,例如:需采取非传统带通滤波法来实时获取低频分量(Hsu et al.,2015)和考虑更多源的有效预报因子。目前CNN模型采用的预报因子局限于大气低频系统,地球其他圈层(海洋、陆面)及其间的相互作用过程也可提供延伸期天气预报的可预报性来源(章大全等,2019;徐邦琪等,2020)。在CNN方法技术方面,目前的CNN模型主要参照Ham et al.(2019),采用了较为简单的网络结构和数据训练方法,虽然回报试验的技巧良好,但未来仍有巨大的改进空间,深度学习模型仍可进一步优化。例如,采用提取时序特征较优的LSTM模型,或是采用ConvLSTM或U-Net等网络架构,在训练时考虑学习率衰减、迁移学习等。此外,深度学习模型受初始化参数和人为设定参数(如学习率、卷积核的大小和步长)的影响,需要通过建模时期和回报试验的敏感性试验来确认最优方案,如何有效确认最优的参数方案,也是本研究的未来工作。