摘要利用TIGGE资料提供的欧洲中期天气预报中心 (ECMWF)、美国国家环境预报中心(NCEP)、英国气象局(UKMO)三个预报中心2013年6月1日至8月31日的地面2 m气温10~15 d预报资料,对延伸期地面气温进行贝叶斯模式平均(Bayesian Model Averaging,BMA)预报试验。结果表明,BMA方法的预报效果随训练期长度而改变,训练期长度为30 d时预报效果最优。BMA方法可提供全概率密度函数,定量描述预报不确定性的大小,且陆地上预报不确定性大于海洋上的预报不确定性,高纬度地区预报不确定性大于低纬度地区的预报不确定性。利用CRPS评分对BMA概率预报技巧进行评估,发现预报技巧随预报时效的延长降低,且预报技巧在海洋上优于陆地、低纬度地区优于高纬度地区。此外,3 d、5 d和7 d滑动平均的预报值反映某些天气过程的平均要素预报,对于提高10~15 d延伸期概率預报技巧有一定效果,且滑动天数越长,预报效果越好。
关键词BMA;延伸期预报;概率预报;滑动平均
延伸期预报是指时间尺度为10~30 d的天气预报,是连接常规天气预报和短期气候预测达成无缝隙预报的关键。根据大气的可预报性理论,一般认为逐日天气可预报时效的理论上限约为两周,超过理论上限则失去预报技巧(Lorenz,1982;Chou,1989)。由于大气是高度非线性的,且目前的数值预报模式也不完善,这种逐日预报上限主要是由数值模式对大气初始条件的敏感性所决定的。而延伸期天气预报不仅受大气的初始条件影响,也同时和大气外部强迫因子有关。气象要素在几天或者更长时间内的平均值或距平值是可以预报的,并且当某些异常环流信号明显且持续时,对于延伸期天气过程往往具有较好的可预报性(金荣花等,2010)。因此,延伸期天气预报仍然是可能的。
数值模式预报时效的延长,为延伸期天气预报提供了可能和有力支撑。特别是集合预报的应用,作为延伸期预报的重要手段,有效延长了数值天气预报的预报时效(郑志海,2013)。Palmer et al.(1990)、Palmer(1993)基于ECMWF模式讨论了延伸期大尺度天气系统转变的系统误差、预报技巧的演变及两者对模式水平分辨率的依赖关系,以及集合预报对延伸期预报技巧的影响等,发现数值模式预报时效在10 d以上也有一定的预报技巧。法国(Déqué and Royer,1992)、美国(Tracton et al.,1989)、加拿大(Boer et al.,1988)等国家也尝试做了延伸期预报研究。国内陈丽娟等(2005)、顾伟宗等(2009)、许晓光等(2009)利用国家气候中心月动力延伸预报结果,最大限度地提取模式有用信息并建立了月降水的降尺度预测模型,取得了较好的结果。崔慧慧和智协飞(2013)、卞赟等(2015)对延伸期地面气温和降水等采用超级集合、消除偏差集合平均等方法进行了确定性预报研究,结果表明多模式集合预报可以有效改善延伸期预报技巧。
自Epstein(1969)提出集合预报以来,数值天气预报有了全新的发展,为概率预报的诞生奠定了基础。概率预报可以更加真实地刻画大气的多平衡态和大气运动的不确定性,比传统确定性预报提供更为科学合理的预报结果(智协飞等,2014a,2014b)。一些基于回归方法制作的概率预报只能提供超出某一阈值的特定事件的发生概率,而不能提供完整的概率密度函数(Probability Density Function,PDF)。贝叶斯模式平均方法(Bayesian Model Averaging,BMA)作为获得概率预报的一种统计后处理方法,可以充分利用集合预报的全部信息,给出完整的PDF,量化预报的不确定性信息。目前,BMA方法在天气尺度(智协飞等,2014a,2014b)和气候尺度(Casanova and Ahrens,2009;智协飞等,2015)的预报预测中均获得应用,并且取得了较好的预报效果。此外,吉璐莹等(2017)利用BMA对东亚地区冬季延伸期地面气温进行了概率预报的研究,其预报技巧明显高于原始集合预报的技巧。
1资料与方法
11预报资料
TIGGE(智协飞和陈雯,2010)是全球交互式大集合(THORPEX Interactive Grand Global Ensemble)的简称,目前全球共有ECMWF、美国国家大气研究中心(NCAR)和中国气象局(CMA)三个TIGGE集合预报产品数据中心,本文选取ECMWF、UKMO和NCEP三个中心每日12时(世界时)起报的地面2 m气温的逐日预报资料,预报区域为(90~130°E,15~45°N),分辨率为1°×1°,资料时间选为2013年6月1日—8月31日,逐日预报时效为240~360 h。三个中心成员数分别为21、51和24。
12观测资料
以与预报资料相应时段的FNL全球再分析资料(Final Operational Global Analysis,简称FNL)作为参照资料,时间段选为2013年6月11日—9月15日,分辨率为1°×1°。
13贝叶斯模式平均方法
Raftery et al.(2005)指出BMA是一种结合多个统计模型进行联合推断和预测的,可以产生完整PDF的一种统计后处理方法,其PDF为:
p(y|f1,f2,…,fK)=∑k=Kk=1wkhk(y|fk)。
其中:f=f1,f2,…,fK分别表示K个不同成员的预报结果;y代表需要预报的变量;wk是权重,反映了第k个成员在训练期的相对贡献,非负,且满足∑Kk=1wk=1。hk(y|fk)是与单个成员预报结果fk相联系的条件概率密度函数。对于气温、海平面气压等符合正态分布的变量,BMA预报均值以及方差的求解可参考智协飞等(2014a,2014b)在研究单站气温的概率预报时的详细介绍。
14预报效果检验方法
本文采用均方根误差、距平相关系数、CRPS评分等指标对BMA预报结果进行检验评估。
(1)均方根误差
ERMSE=1n∑ni=1(yi-oi)2。
其中:n是样本总和;yi是预报值;oi是观测值。ERMSE值越小,预报效果越好。
(2)距平相关系数
CACC=1N∑Ni=1(fi-)(oi-)
1N∑Ni=1(fi-)2·1N∑Ni=1(oi-)2
。
其中:N是样本总和;fi为预报值;oi是相应时刻的观测值;和 分别表示预报值fi(i=1,2,…,N)和观测值oi的平均值。CACC值越大,表明预报效果越好。
(3)CRPS评分
CCRPS=1n∑ni=1∫[f(yi)-H(yi-oi)]2dx。
其中, H(yi-oi)是赫维赛德阶跃函数( Heaviside step function ),如果yi2最优训练期长度的选取及权重分析
BMA是结合多个成员的预报结果进行联合推断和预测的统计后处理方法,计算中将时间序列划分为训练期和预报期,训练期的长度会影响BMA预报结果。为取得最佳预报效果,采用滑动训练期方法,以5~80 d作为训练期,进行最优训练期长度的调试。气温预报的均方根误差(RMSE)和距平相关系数(ACC)能很好地反映气温预报的技巧,因此本文采用RMSE和ACC作为训练期长度调试的预报检验指标。
图1、图2分别给出了ECMWF、NCEP、UKMO以及所有集合成员构成的大集合(Grand Ensemble,以下简称GE)BMA预报的RMSE和ACC随训练期长度的变化。可以看出,各个中心各个预报时效的RMSE随训练期的变化趋势基本一致,先随训练期长度的增加而迅速减小,经过20 d左右达到最小,之后基本保持稳定,30 d以后开始逐渐增大;各个中心各个预报时效的ACC则随训练期长度的增加而迅速增大,于30 d左右达到最大以后逐渐趋于稳定或略有减小。综合以上两个指标,训练期长度在20~30 d之间时BMA预报效果最好。考虑到延伸期预报时效较长,本文选取30 d为最优训练期长度对地面2 m气温作BMA预报试验。
根据贝叶斯模式平均的原理,权重反映了不同成员在训练期对BMA预报结果的相对贡献,以此来分配预报期内各集合成员的比重。若某集合成员在训练期内表现优良,那么它在预报期内被赋予的权重就大,若表现差,则权重小。这种权重赋予方式可以使每个集合成员的预报信息都得到充分利用,有助于改善预报效果。为直观说明BMA方法的权重分布特点,图3以GE 240 h预报为例,给出了BMA预报各个集合成员的权重分布。从图中可以看出,不同集合成员的权重大小差异很明显,数值从0006到002不等,直观反映出各集合成员对BMA预报结果的贡献确实是不同的。
3BMA概率预报结果
31单点BMA概率预报特征
在选定最优训练期的基础上,首先对研究时段内单个格点的地面2 m气温进行BMA概率預报研究。图4给出了格点(119°E,32°N)240~360 h预报的概率密度函数(PDF)曲线。PDF曲线越尖越窄,说明预报方差越小,集合系统对大气真值的预报范围越小,即预报不确定性越小,概率预报效果越好。总体来说,在地面2 m气温的延伸期预报中,各中心预报PDF的方差(预报不确定性)在240~360 h各个预报时效下的差异不大,PDF峰值均在02~03。其中,GE的PDF曲线总是较其他三个单中心更尖更窄,说明其预报方差小于单中心,概率预报效果最优。
三个单中心的预报效果则因预报时效而异,240 h和288 h预报中,预报方差ECMWF小于NCEP,NCEP小于UKMO。312 h预报中,预报方差NCEP小于ECMWF,ECMWF小于UKMO。336 h预报中,预报方差UKMO最小,NCEP和ECMWF较大。264 h和360 h预报中,三个单中心预报方差的差别不大。此外,BMA预报的均值即确定性预报值与观测值十分接近,两者之差不足1 ℃,说明BMA方法在提供概率预报的同时也能提供比较准确的确定性预报。
从上述分析中可以看到,每个集合预报中心在不同预报时效中预报能力不是固定不变的,并不是某个中心始终优于其他中心,而包含了所有成员的GE大集合,其预报方差和预报不确定性小于三个单中心,概率预报效果优于任一单中心。对其他格点的PDF曲线(图略)进行分析,同样发现GE预报方差小于其他三个单中心。
从格点(119°E,32°N)240~360 h预报的累积分布函数(CDF)曲线(图5)也可以看到,BMA概率预报能够在一定的区间范围(22~30 ℃)内使概率值达到1,从而将实际大气可能发生的状态缩小在该范围内,其中GE CDF曲线的曲率均大于三个单中心,说明GE预报区间范围更小,预报不确定性更小。从观测值与CDF曲线的交点来看,BMA方法具有较好的预测能力,各个中心各个预报时效的预报概率基本位于50%~60%。
综上,BMA方法能够提供全概率密度函数,定量表述预报不确定性的大小,还能提供确定性预报结果。尽管单个格点的预报结果具有一定的偶然性,但单点分析能够为实际业务中单站的概率预报提供参考。
32区域BMA概率预报特征
从单个格点的概率预报特征发现,单点的CDF曲线可反映与某一特定概率相对应的地面气温情况。为了从区域的角度分析BMA概率预报的特点,图6给出了GE 240 h预报的地面2 m气温在不同概率(10%,20%,30%,40%,50%,60%,70%,80%,90%)下的空间分布,以此来研究区域内所有格点在不同概率下的地面气温分布特征。可以看出,从低概率到高概率,陆地气温随概率的增加而升高。例如在10%概率下青藏高原地区的地面气温约为9~12 ℃,我国西北地区的地面气温约为21~24 ℃,东部地区的地面气温约为24~27 ℃。当90%概率时,青藏高原地区的地面气温升至12~18 ℃,我国西北和东部地区的地面气温升至27 ℃以上,部分地区甚至突破30 ℃。海洋的气温相对比较稳定,随概率增加没有明显变化,这主要是由于海陆热力差异导致的,海水比热容较大,因而海温变化幅度相对较小,陆地则相反。
根据不同概率下的地面2 m气温空间分布,可制作不同概率下的区域气温预报。此外,还可根据10%和90%概率下的地面2 m气温空间分布,推断出所需预报时段各地区的最低气温、最高气温的分布情况以及极端气温发生概率的地理分布,这对于低温灾害和高温预警的预报具有一定的参考价值。
图7表示GE 240 h预报的地面2 m气温以BMA确定性结果为中心,区间长度为1 ℃的概率分布,可由此判断不同地区选取哪一个概率下的预报结果才比较合理。由图可知,概率分布受海陆地形和纬度的共同影响,从海洋到陆地、从低纬度到高纬度,概率值是减小的,即预报方差和预报不确定性是增大的,海洋上的概率在60%以上,预报方差和不确定性较小,陆地上30°N以北地区的概率在10%~30%、30°N以南地区的概率在30%~60%,陆地预报方差和不确定性较大。因此,对于GE 240 h预报的地面2 m气温来说,海洋上选60%概率下的预报结果较为合理,陆地上可根据纬度差异合理选取某一概率下的预报结果。
33BMA概率预报检验
由于延伸期预报的预报时效较长,逐日预报误差较大。为得到可用预报结果,对参照资料和预报资料进行滑动平均处理,研究不同中心对地面2 m气温某几天平均状态的延伸期BMA预报效果,并与滑动平均前的预报结果进行对比分析。其中,滑动平均的滑动步长分别取为3 d,5 d,7 d。
以CRPS评分为指标衡量各集合预报中心的BMA概率预报技巧。图8是各个中心不同预报时效下BMA预报的CRPS评分,数值越小说明BMA预报值与观测值的累积分布函数差别越小,概率预报效果越好。从图中可以看出,逐日预报各中心CRPS评分均在1以上,3 d滑动平均后约降至07,5 d、7 d滑动平均后降至05附近,可见滑动平均能够有效改善BMA概率预报效果,且滑动步长越长,预报效果越好。逐日预报中,GE的CRPS评分小于其他三个单中心,预报效果优于任一单中心,其他三个单中心的CRPS评分差别很小。滑动平均预报中,依然是GE的CRPS评分最小,预报效果最好,其次是ECMWF的预报,然后是UKMO和NCEP。从预报时效的角度看,无论是逐日预报还是滑动平均后的预报,CRPS评分随预报时效的延长而增大,说明预报时效越长,BMA概率预报效果越差。
图9给出了GE 240 h预报时效的CRPS评分的地理分布,可以发现海洋上的CRPS评分基本维持在05以下,且受滑动平均的影响较小,说明海洋上BMA概率预报效果比较好。陆地上的CRPS评分远远大于海洋,且受纬度影响,随纬度升高而增大,尤其是逐日预报中,30°N以北地区的CRPS评分均达到1以上,其大值中心位于我国西北地区,说明北方内陆地区逐日的概率预报效果不理想。但是,滑动平均方法可以改善陆地预报效果差的状况,图9表明滑动平均之后CRPS评分相对大值区的范围明显缩小、强度明显减弱,且滑动步长越长,改善效果越明显,原本CRPS评分较大的北方陆地上改善幅度大于南方地区。当滑动步长取为7 d时,CRPS评分的海陆差异和纬度差异变得非常小。
4结论
本文对ECMWF、NCEP、UKMO三个单中心以及由此3个中心集合预报成员构成的大集合预报(GE)的地面2 m氣温进行延伸期BMA概率预报研究,得到如下几点结论:
1)通过最优训练期长度的选取试验,发现在不同训练期长度下,BMA预报均方根误差先减小后增大,距平相关系数先增大后稳定,综合考虑两个指标,文中选取最优训练期的长度为30 d。
2)单点和区域的地面2 m气温的BMA概率预报结果显示,BMA能够定量描述预报的不确定性信息,提供全概率密度函数。预报不确定性受纬度和下垫面的影响,纬度越低、下垫面变化越平缓,不确定性越小。
3)对BMA概率预报结果进行评估,发现GE的预报效果优于其他三个单中心,概率预报技巧随预报时效延长而下降,海洋上的预报效果优于陆地上的预报效果,低纬度地区的预报效果优于高纬度地区。
4)滑动平均方法侧重天气过程的平均要素预报,相比逐日预报,预报效果更好,且海陆和南北差异不明显,其中7 d滑动平均预报效果最好,其次是5 d及3 d滑动平均。
参考文献(References)
卞赟,智协飞,李佰平,2015.多模式集成方法对延伸期降水预报的改进[J].中国科技论文,10(15):18131817.Bian Y,Zhi X F,Li B P,2015.Multimodel ensemble method improvement for extended range consensus forecast of precipitation[J].China Science Paper,10(15):18131817.(in Chinese).
Boer G J,Zwiers F W,Chan E,1988.Dynamical extended range forecasting at the Canadian Climate Center[C].In Proceedings of the ECMWF workshop on predictability in the medium and extended range:1618.
Casanova S,Ahrens B,2009.On the weighting of multimodel ensembles in seasonal and shortrange weather forecasting [J].Mon Wea Rev,137(11):38113822.
陈丽娟,陈伯民,李维京,等,2005.T63模式月动力延伸预报高度场的改进实验[J].应用气象学报,16(增刊1):9296.Chen L J,Chen B M,Li W J,et al.,2005.Improved experiments for T63 potential heights by monthly dynamic extendedrange forecast[J].J Appl Meteor Sci,16(sup1):9296.(in Chinese).
Chou J F,1989.Predictability of the atmosphere [J].Adv Atmos Sci,6(3):335346.
崔慧慧,智协飞,2013.基于 TIGGE 资料的地面气温延伸期多模式集成预报[J].大气科学学报,36(2):165173.Cui H H,Zhi X F,2013.Multimodel ensemble forecasts of surface air temperature in the extended range using the TIGGE dataset[J].Trans Atmos Sci,36(2):165173.(in Chinese).
Déqué M,Royer J F,1992.The skill of extendedrange extratropical winter dynamical forecasts[J].J Climate,5(11):13461356.
Epstein E S,1969.Stochastic dynamic prediction[J].Tellus,21(6):739759.
顾伟宗,陈丽娟,张培群,等,2009.基于月动力延伸预报最优信息的中国降水降尺度预测模型[J].气象学报,67(2):280287.Gu W Z,Chen L J,Zhang P Q,et al.,2009.Downscaling precipitation prediction in China based on optimization information extracted from monthly dynamic extended range forecast[J].Acta Meteor Sinica,67(2):280287.(in Chinese).
吉璐莹,智协飞,朱寿鹏,2017.东亚地区冬季地面气温延伸期概率预报研究[J].大气科学学报,40(3):346355.Ji L Y,Zhi X F,Zhu S P,2017.Extendedrange probabilistic forecasts o f surface air temperature over East Asia during boreal winter[J].Trans Atmos Sci,40(3):346355.(in Chinese).
金榮花,马杰,毕宝贵,201010~30 d 延伸期预报研究进展和业务现状[J].沙漠与绿洲气象,4(2):15.Jin R h,Ma J,Bi B G,2010.Research advancement and operation status about the extended range forecast from 10 to 30 days[J].Desert and Oasis Meteorology,4(2):15.(in Chinese).
Lorenz E N,1982.Atmospheric predictability experiments with a large numerical model [J].Tellus,34(6):505513.
Palmer T N,1993.Extendedrange atmospheric prediction and the Lorenz
model[J].Bull Amer Meteor Soc,74(1):4965.
Palmer T N,Brankovic C,Molteni F,et al.,1990.The European Centre for Mediumrange Weather Forecasts (ECMWF)program on extendedrange prediction[J].Bull Amer Meteor Soc,71(9):13171330.
Raftery A E,Gneiting T,Balabdaoui F,et al.,2005.Using Bayesian model averaging to calibrate forecast ensembles [J].Mon Wea Rev,133(5):11551174.
Tracton M S,Mo K,Chen W,et al.,1989.Dynamical extended range forecasting (DERF)at the National Meteorological Center[J].Mon Wea Rev,117(7):16041635.
许晓光,李维京,任宏利,等,2009.T63L16 气候模式预报能力的空间尺度分布研究[J].气象学报,67(6):9921001.Xu X G,Li W J,Ren H L,et al.,2009.Distribution of prediction capacity of T63L16 model for mediumrange forecast at different spatial scales[J].Acta Meteor Sinica,67(6):9921001.(in Chinese).
郑志海,2013.月动力延伸预报研究进展回顾[J].气象科技进展,3(1):2530.Zheng Z H,2013.Review of the progress of dynamical extendedrange forecasting studies[J].Advances in Met S & T,3(1):2530.(in Chinese).
智协飞,陈雯,2010.THORPEX国际科学研究新进展[J].大气科学学报,33(4):504511.Zhi X F,Chen W,2010.New achievements of international atmospheric research in THORPEX program[J].Trans Atmos Sci,33(4):504511.(in Chinese).
智协飞,彭婷,李刚,等,2014a.多模式集成的概率天气预报和气候预测研究进展[J].大气科学学报,37(2):248256.Zhi X F,Peng T,Li G,et al.,2014.Advances in multimodel ensemble probabilistic prediction[J].Trans Atmos Sci,37(2):248256.(in Chinese).
智协飞,李刚,彭婷,2014b.基于贝叶斯理论的单站地面气温的概率预报研究[J].大气科学学报,37(6):740748.Zhi X F,Li G,Peng T,2014.On the probabilistic forecast of 2 meter temperature of a single station based on Bayesian theory[J].Trans Atmos Sci,37(6):740748.(in Chinese).
智协飞,王晶,林春泽,等,2015.CMIP5 多模式资料中气温的 BMA 预测方法研究[J].气象科学,35(4):405412.Zhi X F,Wang J,Lin C Z,et al.,2015.Bayesian model average prediction on temperature by CMIP5 data[J].J Meteor Sci,35(4):405412.(in Chinese).
Extended range probabilistic forecast of surface air temperature using Bayesian model averaging
ZHI Xiefei1,2,PENG Ting1,WANG Yuhong1,3
1Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters(CICFEMD)/
Key Laboratory of Meteorological Disasters,Ministry of Education (KLME),Nanjing University of Information Science & Technology,Nanjing 210044,China;
2Nanjing Joint Center for Atmospheric Research (NJCAR),Nanjing 210008,China;
3Hebei Meteorological Observatory,Shijiazhuang 051001,China
In this study,based on the 10—15 day extended range ensemble forecasts of European Centre for MediumRange Weather Forecasts(ECMWF),National Centers for Environmental Prediction (NCEP)and United Kingdom Met Office(UKMO)in the TIGGE dataset,the probabilistic forecasts of surface air temperature during the period from 1 June to 31 August 2013 were conducted using BMA(Bayesian Model Averaging).The results showed that the forecasting skill changed with the length of the training period,reaching its optimal value when the length of the training period was 30 days.BMA could provide full PDF(Probability Density Function),and quantitatively describe the forecast variance and uncertainty.The uncertainty and error on the land(higher latitude)were larger than those on the sea(lower latitude).Moving average methods improved the forecast skill of surface air temperature,and the longer the moving average period was,the better of the forecast performance would be.
BMA;extended range forecast;probabilistic forecast;moving average
doi:1013878/j.cnki.dqkxxb.20160314001
(責任编辑:刘菲)