智协飞 张珂珺 田烨 季焱
摘要 基于欧洲中期天气预报中心(the European Centre for Medium-Range Weather Forecasts,ECMWF)2015年2月8日—2016年12月31日中国华东及华南地区24~168 h预报时效的逐日24 h累积降水集合预报资料,利用前馈神经网络建立NN(Neutral Network)模型及NN-GI(Neutral Network-Geographic Information)模型进行概率预报试验,并对两个模型输出的概率预报结果进行评估。结果表明,经NN模型和NN-GI模型订正后,降水概率预报结果得到明显改进,在168 h预报时效时,降水概率预报的CRPS值与原始集合预报相比分别下降了约16.00%、21.27%。与NN模型相比,NN-GI模型由于考虑到各格点的地理信息差异,在区域内预报技巧整体改进更优。这表明,在利用机器学习方法改进降水预报时,在模型中加入各个格点的地理信息非常重要。
关键词降水;概率预报;神经网络;地理信息;ECMWF集合预报
随着人类活动对气候变化的影响日益显著,暴雨等极端天气事件频发,对人民生命及财产安全造成重大影响,人们对降水预报准确性的要求也越来越高。同时,准确的降水预报是制定科学合理的政府决策的重要前提,也是人民生命财产安全的重要保证。因此,提高降水预报准确性,减小预报误差一直是气象业务和科研工作的重点。但是,降水受到多种不同尺度天气系统的共同作用,这使得降水相较于其他气象要素,预报难度更大,是天气预报和气候预测中最具挑战性的气象要素之一。
由于大气是一个高度非线性的混沌系统,误差会随着数值预报模式积分时间的增加而增加,从而导致预报的不确定性(Lorenz et al.,1965)。另外,数值预报模式在处理大气中物理过程,如微物理过程、边界层过程、陆面过程等,往往通过假设、近似、参数化等方法对这些作用进行简化,从而对预报结果产生影响(Moghim and Bras,2017)。比如,云物理过程、积云对流参数化等方案就对降水预报,特别是由中尺度系统引起的暴雨预报产生重要影响(崔文君等,2016)。不同的参数化方案得到的云微物理特征相关变量存在较大差异,而多方案集成方法能够有效地降低这种不确定性,使得模拟结果更加稳定(智协飞等,2020a)。因此,近年来数值预报逐渐由确定性预报转变为多成员集合预报。与确定性预报相比,基于Epstein动力随机预报理论(Epstein,1969)和Leith蒙特卡罗预报法的集合预报(Leith,1974)能够模拟大气可能的变化,从而更加接近大气的实际状况。20世纪90年代后,随着大规模并行计算机的发展,集合预报系统在美国国家环境中心(National Centers for Environmental Prediction,NCEP)和欧洲中期天气预报中心投入业务运行,随后成为这两个中心数值天气预报的重要组成部分。
集合预报由于初值扰动、模式设置等方面的原因,常存在一阶系统偏差及二阶离散度偏差(苏翔和袁慧玲,2020),所以对集合预报进行评估及偏差订正具有重要意义。国内外学者尝试采用多种方法对集合预报进行后处理(Applequist et al.,2002;Hamill et al.,2004;张海鹏等,2020;智协飞和赵忱,2020),从而提高预报的准确性。智协飞等(2016)通过建立降水的分级回归统计降尺度模型,获得更加精细化的预报结果;王姝苏等(2018)在此基础上,采用Schaake Shuffle方法重建降水丢失的空间相关性和时间连续性,使之更接近实况观测。智协飞和吕游(2019)将全国分为7个子区域,并分别用频率匹配法进行订正,有效减少了降水预报的误差。Ji et al.(2020)尝试将基于对象的诊断方法(the Method for Object-based Diagnostic Evaluation,MODE)用于多模式集合预报,发现该方法能够较好地保留降水的空间相关性,使降水落区更加完整。但是,这些方法仅得到一些确定性的预报结果,难以包含实际大气可能发生的各种情况。对于降水而言,能够定量计算不同量级降水出现的可能性大小,即采用概率预报,较传统的确定性预报具有更大的应用价值(林春泽等,2013)。
近年来,随着计算机技术的发展及相关理论的完善,机器学习方法广泛应用于气象领域中,如短时临近预报(Shi et al.,2015;陈元昭等,2019)、空气质量预报(张庭玉,2018)、统计降尺度(任梅芳等,2018;商琪等,2020)、台风路径分类(耿焕同等,2017)及云图分类(韩丁等,2011;李林等,2015;胡凯等,2017)等方面。其中,神经网络模型可以从训练期的数据中,深入挖掘输入数据和目标数据之间的关系,从而对新的数据进行分类、预测等处理。Liu and Racah(2016)利用卷积神经网络,對热带气旋、大气环流和锋面现象进行识别,准确率达到99%、90%和89.4%。最近,智协飞等(2020b)和Peng et al.(2020)利用深度学习方法对地面气温进行多模式集成预报,所得结果优于传统超级集合等线性统计后处理方法。陈昱文等(2020)使用Stacking方法将人工神经网络模型和长短期记忆神经网络模型进行集成,建立ALS(ANN-LSTM-Stacking)模型,以均方根误差为损失函数,对地面气温进行偏差订正,在气温预报误差较大的区域和气温峰值预报有显著的订正效果。Rasp and Lerch(2018)针对德国地区2 m气温48 h预报,建立神经网络,得到其概率分布的均值及方差,从而求得其气温的概率分布。所得结果与EMOS方法相比,在连续分级概率评分上有较大改进。目前基于神经网络的概率预报研究主要集中于气温等正态分布的气象要素中,对于降水这种非正态分布的气象要素研究较少。
本文针对欧洲中期天气预报中心24~168 h预报时效的24 h累积降水集合预报,采用神经网络模型,研究基于Gamma分布的降水概率预报方法,并与原始集合预报进行比较,期望得到更优的降水预报结果。
1 资料和方法
1.1 研究区域及资料说明
本文的研究区域为我国华东和华南地区(106°~125°E,20°~36°N)。该地区以平原丘陵为主,包含珠江三角洲及长江三角洲等城市群,是我国经济较为发达的区域之一。同时,该地属于亚热带季风气候区,降水量较大,区域内河流众多,河网密集,时常面临较为严重的洪涝灾害,造成严重的人民生命及财产安全损失,如2020年南方洪涝灾害受灾人数超过3 020万人次,直接经济损失超过600亿元。但是,由于受到多种天气系统的共同影响,天气多变,该地区降水预报准确率较其他地区低(图1)。
集合预报资料采用的是TIGGE资料集下欧洲中期天气预报中心(ECMWF)全球集合预报模式2015年2月8日—2016年12月31日时段的24 h累积降水预报,起报时间为00:00(世界时,下同)。该预报资料有51个集合成员,水平分辨率为0.5°×0.5°,预报时效为24~168 h,间隔24 h。
观测资料采用的是中国降水融合产品。该数据是基于全国三万多个自动气象站的逐小时降水资料和CMORPH卫星反演的降水产品。资料长度为2015年2月8日—2016年12月31日,水平分辨率为0.1°×0.1°,采用双线性插值,使分辨率与集合预报资料一致。由于该产品为逐小时的累积降水量,因此将其累加为与预报资料起报时间一致的24 h累积降水量,用于神经网络的建立和检验预报效果。
1.2 研究方法
1.2.1 前馈式人工神经网络
本研究中,NN模型及NN-GI模型以前馈式人工神经网络结构(Feedforward Neural Network,FNN)为主要结构。FNN网络通常只含有1个隐藏层,一般为全连接神经网络,即前一层神经元的输出全部作为当前层神经元的输入(夏瑜潞,2019),结构如图2所示,其数学模型可以表示为:
Y=f(ω1X+θ1),(1)
Z=f(ω2Y+θ2)。(2)
其中:X、Y、Z分别表示输入层、隐含层和输出层(节点向量)矢量;ω1、ω2、θ1、θ2表示各层之间连接权值和阈值;f(x)为网络激活函数,使得神经网络各层神经元的计算由线性转变为非线性,更好地获取数据特征,常见的激活函数有ReLU函数(Nair and Hinton,2010)等:
f(x)=x, x>0;
0,x≤0。(3)
由于ReLU函數在x≤0时梯度恒为0,难以更新对应神经元的连接权值ω和阈值θ,因此采用Elu函数(Clevert et al.,2015):
f(x)=x, x>0;
α(ex-1),x≤0。(4)
其中:α取1。
FNN网络通过损失函数计算输出层矢量Z与观测值之间的差异,并根据损失函数梯度,利用Adam算法(Kingma and Ba,2014)更新各层之间的连接权值ω和阈值θ,最终使得输出层矢量和观测值之间差异达到最小。不同的损失函数有不同的特点及适用场景,常用的损失函数有交叉熵、均方根误差等,主要用于计算确定性预报值和观测值之间的误差情况,难以衡量概率预报的准确性。因此,此处使用连续分级概率评分(Continuous Ranked Probability Score,CRPS)(Hersbach,2000)作为损失函数,量化连续概率分布与真实观测值之间的差异:
SCRP=1n∑ni=1∫[(F(yi)-H(yi-Oi)]2dy。(5)
其中:F(yi)为yi处的累计概率分布值;Oi为实际观测值;H(yi-Oi)表示Heaviside阶跃函数,当yi
由于连续分级概率评分的计算中涉及积分运算,根据式(5)难以计算其梯度。Sloughter et al.(2007)的研究表明,虽然日降水量不服从正态分布,但日降水量的1/3次方服从Gamma分布。在Gamma分布下,连续分级概率评分可以近似表示为(Scheuerer and Hamill,2015):
SCRP=x(2Gα,β(x)-1)-αβπB12,12+α+αβ(1-2Gα+1,β(x))。(6)
其中:α,β分别表示Gamma分布的形状参数和尺度参数;G(x)表示Gamma分布的累积分布函数;B(x,y)表示Beta函数。
1.2.2 预报模型建立
利用2015年2月8日—2015年12月31日数据对模型进行训练,并对2016年2月8日—2016年12月31日进行预报。考虑到降水数据存在大量零值,依据预报集合平均值将预报数据分为两个部分:集合平均值大于0.1 mm时为有降水发生;集合平均值小于0.1 mm时为无降水。对有降水的情况建立神经网络模型进行概率预报试验。
NN模型采用ECMWF集合预报的51个成员值作为输入,通过训练期建立的模型计算得到对应的Gamma分布的形状参数α和尺度参数β,从而得出降水的概率密度曲线。
NN-GI模型是在NN模型的基础上,增加各个格点归一化后的经纬度值作为输入。归一化方法采用离差标准化:
x=x-xminxmax-xmin。(7)
其中:xmax、xmin为研究区域内的经纬度最大、最小值。
Dueben and Bauer(2018)的研究指出,由于各个格点的地理位置及地形等差异,适用的神经网络不一定相同;但对单个格点建立独立的模型又会有训练数据量过小而造成的过拟合等问题。NN-GI模型一方面考虑到各个格点的差异性,另一方面也保证了充足的训练样本。
同时,神经网络的结构会对预报结果产生影响。过于简单的结构会使神经网络无法获得数据特征,过于复杂的神经网络会降低网络的泛化能力。随机抽取训练集中80%的数据,分别建立神经元数目不同的模型,并对剩余20%的数据进行预报。通过比较不同神经元数目模型下的预报结果,选取预报结果更为准确的模型结构为NN模型和NN-GI模型的结构。表1及表2分別为NN模型及NN-GI模型在不同的神经元个数下对应的训练集及验证集的损失函数值。当NN模型神经元数目为8、NN-GI神经元数目为128时,其验证集损失函数值达到最小,表明该神经网络结构最为适宜。当神经元数目超过8(128)时,虽然训练集的损失函数值依旧在下降,但验证集的损失函数值有上升的趋势,表示此时更加复杂的神经网络结构,不能有效地改进预报效果,同时也需要耗费更多的计算时间。NN-GI模型相较于NN模型更为复杂,主要原因在于它相较于NN模型,输入数据中包含各格点的经纬度信息。综合以上因素,本研究中NN模型和NN-GI模型分别采用8、128个神经元的单层神经网络结构。
1.2.3 检验方法
本文采用Brier评分(Brier Score,BS)、Brier技巧评分(Brier Skill Score,BSS)、连续分级概率评分和连续分级概率评分技巧(Continuous Ranked Probability Score Skill,CRPSS)评价模型的概率预报结果。
1)Brier评分。Brier评分(Brier,1950)主要用于评价超过某一阈值降水的预报概率是否准确(Ferro,2007),视为概率预报中针对不同量级降水的均方根误差。
SB=1n∑Ni=1(fi-oi)2。(8)
其中:n为样本数;fi表示超过某一阈值降水的预报概率,oi为实际降水是否超过这一阈值,超过为1,不超过为0。Brier评分取值范围为0~1,值越低,表明预报概率越准确。
2)Brier技巧评分。Brier技巧评分能够排除各个阈值降水发生频率对Brier评分的影响,从而更加直观地比较其预报技巧的改进情况。
SBS=1n∑Ni=11-SBiScBi2。(9)
其中:ScBi为气候平均的Brier评分,此处采用各格点的气候概率预报值,具体计算过程参考Hamil and Juras(2006)。Brier技巧评分大于0表示预报技巧高于气候概率预报,其值越高,表明预报技巧越高。
3)连续分级概率评分。连续分级概率评分主要表示整体预报概率的准确性,可看作Brier评分在所有可能阈值上的积分值。由于评价模型预报结果时,使用的数据为预报结果反归一化后的值,不再符合Gamma分布,因此前文中的拟合公式不再适用,需采用连续分级概率评分的定义公式:
SCRP=1n∑ni=1∫[(F(yi)-H(yi-Oi)]2dy。(10)
其中:H(yi-Oi)表示Heaviside阶跃函数,当yi
4)连续分级概率评分技巧。连续分级概率评分技巧用于表示模型整体概率预报结果相较于参考预报结果的改进程度。
SCRP=1n∑Ni=11-SCRPiSrefCRPi(11)
其中:SrefCRP为参考预报的连续分级概率评分值,CRPSS大于0表明预报有改进,小于0表明概率预报准确性降低;其绝对值越大,表明预报准确性提高或降低的幅度越大。
2 降水概率预报及其评估结果
2.1 可靠性评估
在概率预报系统的可靠性方面,选用Talagrand分布、概率积分变化和可靠性图来分析ECMWF、NN、NN-GI预报结果的概率分布情况。
Talagrand分布(Talagrand et al.,1997)和概率积分变化主要用于分析预报系统的离散度情况。Hamil and Colucci(1997)认为,依据集合预报系统“成员等同性”(equal-likelihood)原则,在离散度适宜的情况下,每个集合成员表示未来的天气状况应具有相同的可能性。
Talagrand分布的基本原理为:将某一预报的N个集合预报结果按照升序排列,形成N+1个区间,此时观测值应落在某一区间内。在理想情况下,观测值落在每个区间内的频率值应趋向平均概率。概率积分变化与Talagrand分布类似,由0~1的累计概率分布值间隔0.1形成区间,在理想情况下每个概率区间的相对频率值应相等。依照这一原则,ECMWF集合预报每个区间的理想频率为0.019 2,NN、NN-GI模型预报每个区间的理想频率为0.1。
图3给出了ECMWF 24 h集合预报的Talagrand分布及NN、NN-GI模型的概率积分变化。ECMWF预报的Talagrand分布呈现“U”型,即实际降水量落在集合成员最大、最小值以外的频率明显高于理想频率值,达到了0.11和0.15,表示集合预报成员过于集中,不够分散。NN模型的概率积分变化在0.6~1.0的概率区间内实际频率高于理想频率,最高为0.122 7;NN-GI模型则在0.5~0.9的概率区间内实际频率略高于理想频率,最高为0.113 5。和ECMWF集合预报相比,NN、NN-GI模型分布更为平均,表明这两种模型能够有效地改进原始集合预报离散度不足的问题。同时,NN-GI模型有效地改进了NN模型在0~0.2概率区间内相对频率偏低、0.7~0.9概率区间内相对频率偏高的现象,和理想频率的分布更为接近。
可靠性图主要用于评价各概率预报系统在超过某一阈值降水事件预报的概率与实际发生频率是否一致。图4给出了对5、10、25和50 mm阈值降水ECMWF 24 h集合预报及经NN,NN-GI模型订正后的可靠性曲线图。在理想情况下,预报事件发生的概率与观测的频率相等,即图中虚线和实线重合。当预报概率较大时,ECMWF的预报概率大于实际发生的频率,对于25和50 mm阈值以上的降水更为明显。NN和NN-GI整体较ECMWF集合预报更加接近理想的概率预报分布,表示其预报的概率结果更加接近实际的观测频率。对于50 mm阈值以上的降水,NN-GI模型有效地改进了NN模型在预报概率较大时,观测频率大于预报概率的现象,使可靠性曲线更加接近理想情况。
2.2 准确性评估
在概率预报的准确性方面,采用Brier评分、Brier技巧评分、连续分级概率评分及连续分级概率评分技巧,分析NN、NN-GI模型概率预报对各阈值降水及整体降水预报的准确性,以及相较于ECMWF集合预报的改进情况。
图5为5、10、25、50 mm阈值降水的Brier评分情况。对于较小阈值的降水,如5和10 mm,NN和NN-GI模型均有较好的改进效果;对于较大阈值的降水,NN和NN-GI模型的改进效果不如较小阈值降水的改进效果明显。主要原因可能在于,各量级降水的分布并不均匀,50 mm及以上的降水占总降水样本的3.46%,而10 mm及以下的降水占总降水样本的70.22%,50 mm以上的降水样本数远少于10 mm以下的降水样本数,
所建立的NN模型难以获取较大量级降水的特征,从而影响模型对于強降水的预报结果。NN-GI模型对于各量级降水的改进效果均优于NN模型,尤其是对于50 mm以上量级的降水,NN模型的Brier评分高于ECMWF集合预报结果,表示预报准确性有所降低,但是NN-GI模型相较于原始集合预报仍有一定的改进效果。
为避免各量级降水发生的气候概率不同对概率预报准确性的影响,进一步评估其预报技巧。图6给出了各阈值降水的Brier技巧评分情况。随着降水阈值的增加,原始集合预报、NN模型和NN-GI模型的Brier技巧评分均在降低,表示其预报技巧相较于气候概率预报值降低。与Brier评分结果相似,NN和NN-GI模型对较小阈值降水预报结果的改进效果优于较大阈值降水预报结果。对于25 mm阈值的降水,NN模型在24、144 h时预报技巧高于原始集合预报;对于50 mm的降水,NN模型在预报时效超过72 h时,Brier技巧评分小于0,表示其预报技巧不如气候概率预报值。但是,对于25 mm和50 mm阈值的降水,NN-GI模型与原始集合预报结果相比,预报技巧仍有一定程度的提升。
为进一步研究NN和NN-GI模型整体的概率预报准确性情况,图7给出24~168 h三种预报方法的连续分级概率评分。从整体上看,NN和NN-GI模型对于原始集合预报在各预报时效均有较好的改进效果,随着预报时效的增加,改进效果也更加明显:24 h预报时效时,NN模型和NN-GI模型的连续分级概率评分相较于原始集合预报,分别降低了14.31%、18.13%;在168 h预报时效时,分别降低了16.00%、21.27%。NN-GI模型相比于NN模型,CRPS在各预报时效值更低,能够进一步提高降水预报的准确率。
虽然NN和NN-GI模型对于整体区域有较好的改进效果,但是对于区域内的不同地点,其效果有所不同。图8为各个格点平均连续分级概率技巧评分的箱线图。图中虚线表示0值,超过该线的部分表示与ECMWF集合预报相比,该格点概率预报准确性提高,低于该线则表示降低。可以看出,两种模型在预报前期对于各格点的订正效果较预报后期更为显著,且NN-GI模型预报准确性的地区差异较NN模型小。其中,NN模型24~72 h时连续分级概率技巧评分低于0的格点分别占总格点数的9.47%、4.70%、1.64%;NN-GI模型则分别为0.71%、0.85%、0.23%,其余预报时效内除个别格点外评分技巧均大于0。图9为24 h预报时效时CRPSS的分布情况。NN模型的连续分级概率技巧评分负值点主要集中于长江中下游地区和广西的西部,最小值为-0.14,而NN-GI模型CRPSS最小值为-0.04。同时,NN模型CRPS值地区间差异最大可达0.75,NN-GI模型为0.56。NN-GI模型各格点间技巧评分的差异较NN模型小,原因可能在于NN-GI模型在建立的时候加入各格点的经纬度信息,考虑到不同格点之间的差异,使得其改进效果在区域内趋于平均。
2.3 个例分析
为进一步分析NN、NN-GI模型对降水概率预报的订正情况,选取2016年6月10日降水过程进行分析。图10为10 mm以上降水的落区以及ECMWF集合预报、NN、NN-GI模型对大于10 mm降水预报概率的分布情况。对于NN、NN-GI模型,当预报概率大于0.4时,预报降水区域和实际降水落区较为接近。NN和NN-GI模型有效地改善了ECMWF集合预报在某些地区空报的情况,如ECMWF集合预报对于湖北中部及贵州东部大于10 mm降水存在空报现象,预报概率分别达到了0.85、0.64,而NN和NN-GI模型使两地大于10 mm降水的预报概率分别降为0.6、0.45。
同时,与NN模型相比,NN-GI模型在部分10 mm以上降水发生的区域,预报概率较NN模型更高,如湖北中北部及湖南北部,NN模型预报概率为0.77、0.72;NN-GI模型预报概率则达到了0.84、0.88。
3 结论和讨论
利用前馈式神经网络建立降水预报的NN、NN-GI模型,对我国华东及华南地区24~168 h预报时效的ECMWF 24 h累积降水集合预报进行订正,并进行概率预报试验。比较这两种模型和原始集合预报的预报技巧,得到以下结论:
1)NN和NN-GI模型整体概率分布较原始集合预报更为可靠,整体概率预报的技巧也更高。随着预报时效的增加,其改进效果更为显著。
2)对于较大量级的降水,由于样本数量较少,NN模型概率预报的技巧在超过48 h预报时效时较原始集合预报低,NN-GI模型的改进效果也不如对较小量级的降水预报明显。
3)和NN模型相比,NN-GI模型的整体改进效果更为显著。同时,NN模型对不同格点的改进效果存在较为明显的差异,24 h预报在长江中下游地区及广西西部地区预报准确率不如原始集合预报。而NN-GI模型由于在建立模型时考虑到各个格点的地理信息差异,在区域内整体改进效果更优。
鉴于NN、NN-GI模型对于较大量级(超过50 mm)的降水预报改进效果不如对较小量级的降水预报明显,后续研究考虑对样本进行分级,针对不同量级的降水建立不同的模型进行预报。同时,针对NN、NN-GI模型改进效果随着预报时效增加而更为明显的现象,可以考虑在中期、延伸期预报中采用此方法进行改进,有望获得更好的预报结果。
参考文献(References)
Applequist S,Gahrs G E,Pfeffer R L,et al.,2002.Comparison of methodologies for probabilistic quantitative precipitation forecasting[J].Wea Forecasting,17(4):783-799.doi:10.1175/1520-0434(2002)017<0783:comfpq>2.0.co;2.
Brier G W,1950.Verification of forecasts expressed in terms of probability[J].Mon Wea Rev,78(1):1-3.doi:10.1175/1520-0493(1950)078<0001:vofeit>2.0.co;2.
陳昱文,黄小猛,李熠,等,2020.基于ECMWF产品的站点气温预报集成学习误差订正[J].应用气象学报,31(4):494-503. Chen Y W,Huang X M,Li Y,et al.,2020.Ensemble learning for bias correction of station temperature forecast based on ECMWF products[J].J Appl Meteor Sci,31(4):494-503.(in Chinese).
陈元昭,林良勋,王蕊,等,2019.基于生成对抗网络GAN的人工智能临近预报方法研究[J].大气科学学报,42(2):311-320. Chen Y Z,Lin L X,Wang R,et al.,2019.A study on the artificial intelligence nowcasting based on generative adversarial networks[J].Trans Atmos Sci,42(2):311-320.doi:10.13878/j.cnki.dqkxxb.20190117001.(in Chinese).
Clevert D,Unterthiner T,Hochreiter S,2015.Fast and accurate deep network learning by Exponential Linear Units(ELUs)[EB/OL].[2021-01-10].http://de.arxiv.org/pdf/1511.07289.
崔文君,智协飞,朱寿鹏,等,2016.一次长江流域梅雨降水中三种云量计算方案的对比研究[J].大气科学学报,39(2):209-220. Cui W J,Zhi X F,Zhu S P,et al.,2016.Comparison of the performance of three schemes in calculating the cloudiness during a Meiyu rainfall process over the Yangtze River Basin[J].Trans Atmos Sci,39(2):209-220.doi:10.13878/j.cnki.dqkxxb.20151102003.(in Chinese).
Dueben P D,Bauer P,2018.Challenges and design choices for global weather and climate models based on machine learning[J].Geosci Model Dev,11(10):3999-4009.doi:10.5194/gmd-11-3999-2018.
Epstein E S,1969.Stochastic dynamic prediction1[J].Tellus,21(6):739-759.doi:10.1111/j.2153-3490.1969.tb00483.x.
Ferro C A T,2007.Comparing probabilistic forecasting systems with the brier score[J].Wea Forecasting,22(5):1076-1088.doi:10.1175/waf1034.1.
耿焕同,谢佩妍,史达伟,等,2017.基于FMM算法的夏秋季登陆中国热带气旋路径分类及特征分析[J].大气科学学报,40(3):390-400. Geng H T,Xie P Y,Shi D W,et al.,2017.FMM algorithm for track classification and characteristic analysis of land-falling tropical cyclones over China during summer and autumn[J].Trans Atmos Sci,40(3):390-400.doi:10.13878/j.cnki.dqkxxb.20160509001.(in Chinese).
Hamill T M,Colucci S J,1997.Verification of eta-RSM short-range ensemble forecasts[J].Mon Wea Rev,125(6):1312-1327.doi:10.1175/1520-0493(1997)125<1312:voersr>2.0.co;2.
Hamill T M,Juras J,2006.Measuring forecast skill:Is it real skill or is it the varying climatology?[J].Quart J Roy Meteor Soc,132(621C):2905-2923.doi:10.1256/qj.06.25.
Hamill T M,Whitaker J S,Wei X,2004.Ensemble reforecasting:improving medium-range forecast skill using retrospective forecasts[J].Mon Wea Rev,132(6):1434-1447.doi:10.1175/1520-0493(2004)132<1434:erimfs>2.0.co;2.
韓丁,严卫,任建奇,等,2011.基于支持向量机的CloudSat卫星云分类算法[J].大气科学学报,34(5):583-591. Han D,Yan W,Ren J Q,et al.,2011.Cloud type classification algorithm for CloudSat satellite based on Support Vector Machine[J].Trans Atmos Sci,34(5):583-591.doi:10.13878/j.cnki.dqkxxb.2011.05.001.(in Chinese).
Hersbach H,2000.Decomposition of the continuous ranked probability score for ensemble prediction systems[J].Wea Forecasting,15(5):559-570.doi:10.1175/1520-0434(2000)015<0559:dotcrp>2.0.co;2.
胡凯,严昊,夏旻,等,2017.基于迁移学习的卫星云图云分类[J].大气科学学报,40(6):856-863. Hu K,Yan H,Xia M,et al.,2017.Satellite imagery cloud classification based on transfer learning[J].Trans Atmos Sci,40(6):856-863.doi:10.13878/j.cnki.dqkxxb.20170106002.(in Chinese).
Ji L Y,Zhi X F,Simmer C,et al.,2020.Multimodel ensemble forecasts of precipitation based on an object-based diagnostic evaluation[J].Mon Wea Rev,148(6):2591-2606.doi:10.1175/mwr-d-19-0266.1.
Kingma D,Ba J,2014.Adam:a method for stochastic optimization[EB/OL].[2021-01-10].http://www.arxiv.org/pdf/1412.6980.pdf.
Leith C E,1974.Theoretical skill of Monte Carlo forecasts[J].Mon Wea Rev,102(6):409-418.doi:10.1175/1520-0493(1974)102<0409:tsomcf>2.0.co;2.
李林,刘青山,夏旻,2015.基于极限学习机的地基可见光云图的云分类[J].大气科学学报,38(5):678-685. Li L,Liu Q S,Xia M,2015.Cloud classification based on ground-based vision cloud image using extreme learning machine[J].Trans Atmos Sci,38(5):678-685.doi:10.13878/j.cnki.dqkxxb.20130520004.(in Chinese).
林春泽,祁海霞,智协飞,等,2013.中国夏季降水多模式集成概率预报研究[J].暴雨灾害,32(4):354-359. Lin C Z,Qi H X,Zhi X F,et al.,2013.Study on multi-model ensemble probability forecast for summer precipitation in China[J].Torrential Rain Disasters,32(4):354-359.doi:10.3969/j.issn.1004-9045.2013.04.008.(in Chinese).
Liu Y J,Racah E,2016.Application of deep convolutional neural networks for detecting extreme weather in climate datasets[EB/OL].[2021-01-10].https://arxiv.org/pdf/1605.01156.pdf.
Lorenz E N,1965.A study of the predictability of a 28-variable atmospheric model[J].Tellus,17(3):321-333.doi:10.3402/tellusa.v17i3.9076.
Moghim S,Bras R L,2017.Bias correction of climate modeled temperature and precipitation using artificial neural networks[J].J Hydrometeorol,18(7):1867-1884.
Nair V,Hinton G E,2010.Rectified linear units improve restricted boltzmann machines[C]//ICML10:proceedings of the 27th international conference on international conference on machine learning:807-814.
Peng T,Zhi X F,Ji Y,et al.,2020.Prediction skill of extended range 2 m maximum air temperature probabilistic forecasts using machine learning post-processing methods[J].Atmosphere,11(8):823.doi:10.3390/atmos11080823.
Rasp S,Lerch S,2018.Neural networks for postprocessing ensemble weather forecasts[J].Mon Wea Rev,146(11):3885-3900.doi:10.1175/mwr-d-18-0187.1.
任梅芳,龐博,徐宗学,等,2018.基于随机森林模型的雅鲁藏布江流域气温降尺度研究[J].高原气象,37(5):1241-1253. Ren M F,Pang B,Xu Z X,et al.,2018.Downscaling of air temperature in the Yarlung Zangbo River Basin based on the random forest model[J].Plateau Meteor,37(5):1241-1253.doi:10.7522/j.issn.1000-0534.2018.00026.(in Chinese).
Scheuerer M,Hamill T M,2015.Statistical postprocessing of ensemble precipitation forecasts by fitting censored,shifted gamma distributions[J].Mon Wea Rev,143(11):4578-4596.doi:10.1175/mwr-d-15-0061.1.
商琪,2020.基于相关向量机和InSAR时间序列的GRACE数据降尺度方法研究[D].北京:中国地质大学. Shang Q,2020.Downscaling of GRACE datasets based on relevance vector machine using InSAR time series[D].Beijing:China University of Geosciences.(in Chinese).
Shi X J,Chen Z R,Wang H,et al.,2015.Convolutional LSTM network:a machine learning approach for precipitation nowcasting[C].
Sloughter J M L,Raftery A E,Gneiting T,et al.,2007.Probabilistic quantitative precipitation forecasting using Bayesian model averaging[J].Mon Wea Rev,135(9):3209-3220.doi:10.1175/mwr3441.1.
苏翔,袁慧玲,2020.集合预报统计学后处理技术研究进展[J].气象科技进展,10(2):30-41. Su X,Yuan H L,2020.The research progress of ensemble statistical postprocessing methods[J].Adv Meteor Sci Technol,10(2):30-41.(in Chinese).
Talagrand O,Vautard R,Strauss B,1997.Evaluation of probabilistic prediction systems[C]//Proc.workshop on predictability.Reading:European Centre for Medium-Range Weather Forecasts:1-25.
王姝苏,智协飞,俞剑蔚,等,2018.降水的统计降尺度预报及其空间相关性和时间连续性重建[J].大气科学学报,41(1):36-45. Wang S S,Zhi X F,Yu J W,et al.,2018.Statistical downscaling forecast and reconstruction of spatial and temporal correlation of the precipitation[J].Trans Atmos Sci,41(1):36-45.doi:10.13878/j.cnki.dqkxxb.20161010001.(in Chinese).
夏瑜潞,2019.人工神经网络的发展综述[J].电脑知识与技术,15(20):227-229. Xia Y L,2019.A review of the development of artificial neural networks[J].Comput Knowl Technol,15(20):227-229.doi:10.14004/j.cnki.ckt.2019.2271.(in Chinese).
张海鹏,智协飞,吉璐莹,2020.中国区域降水偏差订正的初步研究[J].气象科学,40(4):467-474. Zhang H P,Zhi X F,Ji L Y,2020.A preliminary study on calibration in precipitation forecast over China[J].J Meteor Sci,40(4):467-474.doi:10.3969/2019jms.0022.(in Chinese).
张庭玉,2018.基于神经网络的空气质量预报多模式集成技术研发与应用[D].南京:南京信息工程大学. Zhang T Y,2018.Research and application on multi-model ensemble methods for forecast of air quality based on neural network[D].Nanjing:Nanjing University of Information Science & Technology.
智协飞,吕游,2019.基于频率匹配法的中国降水多模式预报订正研究[J].大气科学学报,42(6):814-823. Zhi X F,Lü Y,2019.Calibration of the multimodel precipitation forecasts in China using the frequency matching method[J].Trans Atmos Sci,42(6):814-823.doi:10.13878/j.cnki.dqkxxb.20190109001.(in Chinese).
智协飞,赵忱,2020.基于集合成员订正的强降水多模式集成预报[J].应用气象学报,31(3):303-314. Zhi X F,Zhao C,2020.Heavy precipitation forecasts based on multi-model ensemble members[J].J Appl Meteor Sci,31(3):303-314.doi:10.11898/1001-7313.20200305.(in Chinese).
智协飞,王姝苏,周红梅,等,2016.我国地面降水的分级回归统计降尺度预报研究[J].大气科学学报,39(3):329-338. Zhi X F,Wang S S,Zhou H M,et al.,2016.Statistical downscaling of precipitation forecasting using categorized rainfall regression[J].Trans Atmos Sci,39(3):329-338.doi:10.13878/j.cnki.dqkxxb.20151201045.(in Chinese).
智协飞,董甫,张玲,等,2020a.基于不同微物理过程的广西沿海南风型暖区暴雨的数值模拟研究[J].大气科学学报,43(5):867-879. Zhi X F,Dong F,Zhang L,et al.,2020.Numerical simulation of southerly type warm-sector heavy rainfall in the coastal region of Guangxi using various cloud microphysics parameterization schemes in the WRF Model[J].Trans Atmos Sci,43(5):867-879.doi:10.13878/j.cnki.dqkxxb.20200106001.(in Chinese).
智协飞,王田,季焱,2020b.基于深度學习的中国地面气温的多模式集成预报研究[J].大气科学学报,43(3):435-446. Zhi X F,Wang T,Ji Y,2020.Multimodel ensemble forecasts of surface air temperature over China based on deep learning approach[J].Trans Atmos Sci,43(3):435-446.doi:10.13878/j.cnki.dqkxxb.20200219003.(in Chinese).
Probabilistic precipitation forecast in East and South China based on neural network and geographic information
ZHI Xiefei1,2,ZHANG Kejun1,2,TIAN Ye1,JI Yan1,2
1Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters (CIC-FEMD)/Key Laboratory of Meteorological Disaster,Ministry of Education (KLME),Nanjing University of Information Science and Technology,Nanjing 210044,China;
2Weather Online Institute of Meteorological Applications,Wuxi 214000,China
With the increasing impact of human activities on climate change,the extreme weather events such as extreme precipitation occur more frequently and people pay more attention on probabilistic precipitation forecast.Since there is still a large error in precipitation ensemble forecast,it is of great significance to calibrate the forecast.Based on the daily 24 h accumulated precipitation forecasts obtained from the global ensemble forecast system of ECMWF (the European Centre for Medium-Range Weather Forecasts) with 24—168 h forecast lead times in East and South China from 8 February 2015 to 31 December 2016,NN (neutral network) model and NN-GI (neutral network-geographic information) model using feedforward neural network were established to improve probabilistic precipitation forecast and evaluate the results before and after calibration.Results show that after the correction of NN model and NN-GI model,the precipitation probabilistic forecasts are improved obviously.Compared with ECMWF raw ensemble forecasts,CRPSs of precipitation probabilistic forecasts from NN model and NN-GI model with 168 h forecast lead time decrease by around 16.00% and 21.27%,respectively.Meanwhile,compared with NN model,NN-GI model takes into account the geographic information difference of each grid point,and the overall improvement of forecasting skills in the region is better.However,NN-GI model has better performance,indicating that the machine leaning approach can improve the probabilistic forecast of the precipitation more significantly by taking into account the geographic information of each grid point in the model.
precipitation;probabilistic forecast;neural network;geographic information;ECMWF ensemble forecast
doi:10.13878/j.cnki.dqkxxb.20210117001
(責任编辑:张福颖)