崔慧慧,智协飞
(气象灾害教育部重点实验室(南京信息工程大学),江苏南京210044)
随着国民经济和人民生活水平的提高,人们不仅关心一周以内的天气变化,同样也更加关注10 d以后甚至更长时间的天气变化。受大气自身特点以及数值模式发展等因素的限制,10~30 d延伸期的天气预报变得十分困难。因而,延伸期预报也成为目前研究的热点及难点问题。随着对延伸期预报认识的不断深入,一些研究者尝试利用模式对延伸期内天气的发展进行模拟。Miyakoda et al.(1983)首先采用高分辨率的大气环流模式,成功预报了北半球10~30 d平均的阻塞高压,该工作被看作是延伸期数值预报的开端;Palmer(1990)讨论了延伸期预报系统误差的演变、延伸期预报技巧与模式水平分辨率的关系及集合预报对延伸期预报技巧的影响等内容;随后,Palmer(1993)基于Lorenz对流模式进行了逐月的延伸期预报,结果表明,模式在10 d以后也具有相当的预报能力;我国的月动力延伸预报系统始于“八五计划”,国家气候中心在“九五”期间建立了月动力延伸预报的试验性业务系统,李维京和陈丽娟(1999)、陈丽娟和李维京(1999)在此领域做了大量深入的工作。
大气是一个高度非线性的混沌系统,这就使得描述其变化的数值模式对初始时刻的误差非常敏感,即非常小的误差,随着时间的演变会不断扩大,使系统的预报值和真实状况相差很远(Lorenz,1963),但这并不意味着人们对时效较长的预报就无能为力(金荣花等,2010)。研究表明,可预报性与模式的初始场关系密切(Lorenz,1995;Ripley and Archibold,2002),选取一定数量的初始场,预报场的平均值高于单个模式的预报期限;Epstein(1969)首先提出了应用集合预报方法来弥补数值天气预报预报时效的不足,集合预报与传统数值预报的最大不同就是初值不是“一个”,而是满足某一误差概率分布的数据集,因此预报结果也是“一组”或一个集合;经过近20 a的研究探索和数值预报试验,到20世纪90年代初,集合数值预报进入了实际业务应用阶段。自 Krishnamurti et al.(1999,2000a,2000b,2007)提出超级集合预报方法后,集合预报技术又获得重大突破:超级集合预报有效地减小了季节气候预测和天气预报的误差,预报效果远优于单个模式和多模式集成平均;Vijaya Kumar et al.(2003)利用超级集合方法对飓风的路径和强度进行预报试验,获得了较好的效果;智协飞等(2009)成功将超级集合方法应用于北半球1~7 d地面气温的预报中,并提出了滑动训练期超级集合预报方法;Zhi et al.(2011)以2008年初我国南方低温冰冻雨雪灾害天气事件为例,研究了多模式集成技术在降水预报中的适用性;Zhi et al.(2012)又基于TIGGE资料,对比了三种多模式集成方案的预报技巧。
综合以上研究,本文尝试将多模式集成预报方法应用于延伸期10~15 d地面气温的预报中。首先对加拿大气象局(CMC)、欧洲中期天气预报中心(ECMWF)、英国气象局(UKMO)以及美国国家环境预报中心(NCEP)的10~15 d地面气温预报性能进行检验评估,并对四个中心的地面气温进行多模式集成预报。然后,分别对四个中心地面气温的延伸期集合预报资料以及“观测”资料做滑动平均处理,再对滑动平均后的资料进行多模式集成,并比较滑动平均前后的预报效果。
所用资料包括 TIGGE资料中 CMC、ECMWF、UKMO及NCEP四个中心的集合预报资料以及NCEP提供的FNL全球再分析资料(Final Operational Global Analysis,简称 FNL)。
1)TIGGE(Richardson et al.,2005;智协飞和陈雯,2010)是全球交互式大集合(THORPEX Interactive Grand Global Ensemble)的简称,目前全球共有中国气象局(CMA)、欧洲中期天气预报中心(ECMWF)和美国国家大气研究中心(NCAR)三个TIGGE集合预报产品数据中心,这三个中心收集来自全球十多个预报中心的集合预报产品。本文选取CMC、ECMWF、UKMO及NCEP四个中心全球集合预报模式2008年7月1日—9月30日每天12:00(世界时,下同)起报的地面气温集合预报资料,预报区域为北半球中纬度地区(30~60°N),水平分辨率为0.5°×0.5°,预报时效为240~360 h(即10~15 d),间隔为24 h。
2)“观测”资料:选取NCEP每日12:00的FNL再分析资料作为实况值,用以检验预报效果,资料时段为2008年7月11日—10月15日,水平分辨率为1°×1°。
由于预报资料和“观测”资料的分辨率不一致,为便于计算,本文采用双线性插值方法使二者的分辨率保持统一。
式中:Fi为第i个模式的预报值;N为参与集成的模式总数。
2)消除偏差集成平均定义为
1)多模式集成平均
多模式集成的算法平均定义为
式中:VBREM为消除偏差集成预报值;Fi为第i个模式的预报值;¯Fi为第i个模式预报值的平均;¯O为观测值平均;N为参与集成的模式个数。
3)超级集合的方法见式(3),其中,参与集成的模式权重满足,预报效果越好的模式在多模式集成中所占权重越大。文中权重由一段时间内各模式预报均方根误差的倒数决定,具体见式(4),式中Ei代表各模式均方根误差的倒数。超级集合预报用到的各个模式的权重系数也可用线性回归方法(林春泽等,2009)、神经网络方法(Zhi et al.,2009)等在训练期确定。
在对多模式集成预报结果的检验中,本文采用了交叉检验方法(Cross Validation;Mo and Straus,2002),即从试验资料序列的第一个样本开始,每次轮流留出一个样本,用余下的样本建立预报方程,并对留出的样本作预报检验。这样依次进行,直到全部样本都作为独立的预报检验完毕。这种方法的优点是能充分利用所有的观测数据。
为综合分析各个集合预报系统对10~15 d延伸期地面气温的预报能力,本文采用多种评价检验方法,包括侧重于确定性预报的均方根误差以及侧重于检验集合预系统可靠性的Talagrand分布(Talagrand and Vautard,1997)和离散度指标。
适宜的离散度是一个好的集合预报系统的重要指标。一个好的集合预报系统应该是每个预报成员发生的概率均等,实况值可能是集合成员中的任意一个,对其通常采用Talagrand分布的检验方法(李莉等,2011):将N个集合预报成员按非降序排列后构成N+1个区间(包括两侧的开区间),然后用实况值落在这N+1个区间的时空累积频率来描述集合预报系统的可靠性。对于理想的集合预报系统,实况落在每个区间的概率相同,即Talagrand分布应该是平直的;若Talagrand分布呈“L”型分布,表明实况大多落在集合预报的小值区,即集合预报系统有正偏差,反之亦然;若为“U”型分布,说明集合预报系统的离散度偏小。
图1给出了四个集合预报系统地面气温240 h预报的Talagrand分布。由图1可知,四个系统的Talagrand分布中,实况值落在大多数区间的概率都低于理想概率,说明集合预报系统的离散度不够;CMC、UKMO及ECMWF三个系统的Talagrand分布略呈反“L”型,即实况值落在最大预报值区间之外的概率较大,系统对地面气温的预报存在一定程度的“冷偏差”。对于NCEP集合预报系统,实况值落在两端区间的概率较大,Talagrand分布呈“U”型,说明集合预报系统的离散度偏小,这也是目前集合预报普遍存在的问题。
集合离散度定义为集合扰动预报与集合平均预报之间的平均距离,它反映了预报的不确定性、置信度和集合成员总体变率程度。离散度的大小一方面体现了大气可预报性的高低,离散度大,意味着大气可预报性低,相反则高;另一方面,离散度的大小又反映了集合预报代表真实大气状态的程度,离散度大,反映大气真实状态的可能性就高,反之亦然。因此,如何在不影响预报准确率的前提下适当增大集合成员间的离散度是目前很多集合预报系统需要解决的问题(麻巨慧等,2011;肖玉华等,2011)。集合预报系统的好坏或者说基于集合预报系统的平均预报是否具有可靠性和准确性,关键前提之一就是要衡量集合预报的离散度是否有能力定量给出预报误差的分布(段明铿和王盘兴,2004;李俊等,2009)。理想的的集合预报系统,其均方根误差和离散度二者是相当的。
图1 地面气温240 h预报的 Talagrand分布(单位:%) a.CMC;b.ECMWF;c.UKMO;d.NCEPFig.1 Taragrand distribution of 240 h forecast of surface air temperature(units:%) a.CMC;b.ECMWF;c.UKMO;d.NCEP
图2给出了2008年7月1日—9月30日地面气温预报的区域平均均方根误差及离散度。可见,四个中心温度预报的均方根误差都随预报时效延长而增大,但增幅不大;当预报时效从10 d延至15 d,四个集合预报系统的预报均方根误差增幅均在0.3℃以下,其中ECMWF预报效果最好,NCEP次之,UKMO预报均方根误差最大。四个系统的离散度都在1.5~2.0℃之间,明显小于均方根误差,且离散度与均方根误差随预报时效的变化趋势是一致的。
由以上分析可知,各模式的预报效果不尽相同,都存在系统偏差。为进一步消除系统偏差,提高预报技巧,拟采用多模式集成平均(Ensemble Mean,EMN)、消除偏差集成平均(Bias-Removed Ensemble Mean,BREM)及超级集合(Multi-model Superensemble,SUP)三种多模式集成方法,对2008年7月1日—9月30日四个集合预报系统的地面气温延伸期预报进行集成处理,分析集成前后预报效果的改善程度并比较三种集成方法的优劣。
图3给出了研究区域7月1日—9月30日预报时效为10~15 d单个集合预报系统和三种集成方法对地面气温预报的区域平均均方根误差以及多模式集成相对于最优单系统的改进幅度。图3a显示,对于各个预报时效,EMN、BREM及SUP三种多模式集成方法均降低了预报误差,其预报技巧优于单个系统,且SUP对预报效果的改进程度大于BREM及EMN。由图3b发现,对于10~15 d地面气温的预报,SUP相对于最优单系统ECMWF误差降低的幅度最大,平均降幅在11%左右;BREM次之,约为7%;EMN的改进效果最差,误差平均减小幅度仅为2%。
图4给出了EMN、BREM及SUP三种集成方案相对于最优系统ECMWF在92 d预报期内地面气温240 h预报平均均方根误差减小百分比的地理分布。由图4可知,三种集成方案比单个系统预报效果明显提高。其中,EMN对均方根误差的减小程度最小,大部分地区在10%左右;BREM对预报效果的改进程度比EMN显著,大部分地区在10% ~30%之间,局部地区改进百分比达50%以上;SUP的改进效果最明显,在整个预报区域内其改进百分比都较高,尤其是在欧亚大陆上,误差减小幅度较大。综上所述,多模式集成平均、消除偏差集成平均及多模式超级集合三种集成方法都有效地减小了预报区域的预报均方根误差且SUP效果最佳。这说明SUP是一种有效的多模式集成方法,能够提高预报技巧,稳定预报效果。
图2 2008年7月1日—9月30日地面气温预报的区域平均均方根误差及离散度(单位:℃) a.CMC;b.ECMWF;c.UKMO;d.NCEPFig.2 The mean RMS error and ensemble spread of surface air temperature forecast in the forecast area from 1 July to 30 September 2008(units:℃) a.CMC;b.ECMWF;c.UKMO;d.NCEP
图3 2008年7月1日—9月30日单个集合预报系统和三种多模式集成方案对地面气温预报的区域平均均方根误差(a;单位:℃)以及三种集成方案相对于最优单系统ECMWF误差减小的区域平均百分比(b;单位:%)Fig.3 (a)The mean RMS error of surface air temperature forecast for single ensemble forecasting system and three multi-model ensemble methods from 1 July to 31 September 2008(units:℃)and(b)the decrease rate of RMS error for three multi-model ensemble methods compared with the best single system ECMWF(units:%)
图4 2008年7月1日—9月30日三种多模式集成方案相对于最优集合预报系统ECMWF的240 h预报均方根误差减小百分比的地理分布(单位:%) a.EMN相对于ECMWF误差减小的百分比;b.BREM相对于ECMWF误差减小的百分比;c.SUP相对于ECMWF误差减小的百分比Fig.4 Geographical distribution of RMS error decrease rate of 240 h forecast for three multi-model ensemble methods compared with the best single ensemble forecasting system ECMWF from 1 July to 30 September 2008(units:%) a.decrease rate of EMN compared with ECMWF;b.decrease rate of BREM compared with ECMWF;c.decrease rate of SUP compared with ECMWF
由以上研究发现,10~15 d地面气温逐日预报误差较大,即使是最好的集成方案SUP,其在各个预报时效的均方根误差都在2.4℃以上。为进一步缩小预报误差,考虑将各个集合预报系统的预报资料及“观测”资料进行滑动平均处理,再对滑动平均后的资料进行多模式集成,以滤去短波扰动,研究延伸期内地面气温某几天的平均状态。滑动平均的滑动步长分别选取3 d、5 d及7 d。
图5给出了滑动平均前后单个系统及三种多模式集成方法在各个时效的区域平均均方根误差。从图5可以看出,无论是逐日预报还是滑动平均后,SUP、BREM和EMN三种集成方法明显优于单个系统。其中,SUP预报效果最好,BREM 次之,EMN最差。逐日预报中,SUP在各个时效的平均误差约为2.6℃;3 d滑动平均后,SUP在各个时效的平均均方根误差约为2.0℃,比逐日预报降低了0.5℃;5 d及7 d滑动平均后,SUP在各个时效的平均均方根误差已分别降低至1.7℃和1.5℃左右。这说明,地面气温预报的均方根误差随着滑动步长的增大而降低。由图5还可发现,滑动平均后BREM和SUP与单个系统和EMN相比,优势更加突出:滑动平均之前,SUP较最优系统ECMWF平均误差仅降低了0.3℃,而3 d滑动平均后,SUP较ECMWF平均误差降低了0.5℃,5 d及7 d滑动平均后,SUP较ECMWF平均误差分别降低了0.60℃和0.65℃。总之,SUP在逐日预报中和滑动平均预报中都明显提高了预报技巧,该方法对于延伸期天气过程的预报也有一定的价值。
图6给出了2008年7月1日—9月30日多模式超级集合地面气温240 h预报平均均方根误差的地理分布。由图6可知,逐日预报中误差较大的区域位于欧亚大陆及北美大陆上。3 d滑动平均后,绝大部分地区的预报误差明显降低。其中北美大陆的误差降低至2~3℃,欧亚大陆上误差在4℃以上的区域明显缩小;5 d及7 d滑动平均后,误差进一步降低,尤其在7 d滑动平均后,欧亚大陆误差在4℃以上的区域基本消失,北美大陆上的误差也进一步降低。
由以上分析可知,SUP在逐日预报,3 d、5 d及7 d滑动平均预报中,都明显改善了预报效果。而上述的SUP是基于交叉检验的,即将其中1 d作为预报期,其余的样本作为训练期,但这个训练期长度并不一定是最佳的。那么,训练期究竟取多长,预报效果才最好呢?下面尝试对训练期窗口进行调试,以找出SUP的最佳训练期长度,最大程度地发挥该方法的优势。尝试以10~80 d逐日作为训练期,计算各个训练期长度下的预报均方根误差。图7给出了10~15 d各个时效SUP预报误差随训练期长度的变化。由图7可知,对于逐日及3 d滑动平均预报,10~12 d的预报误差在训练期为75 d时最小,对于13~15 d预报,其训练期选取35 d为宜;对于5 d及7 d滑动平均预报,10~15 d各个时效的预报均方根误差在训练期为35 d时最小。
图5 2008年7月1日—9月30日单个集合预报系统及三种多模式集成方案对地面气温预报的区域平均均方根误差(单位:℃) a.逐日;b.3 d滑动平均;c.5 d滑动平均;d.7 d滑动平均Fig.5 The mean RMS error of surface air temperature forecast for single ensemble forecasting system and multi-model ensemble methods from 1 July to 30 September 2008(units:℃) a.daily;b.3-day moving average;c.5-day moving average;d.7-day moving average
本文对 CMC、ECMWF、UKMO及 NCEP四个集合预报中心2008年7月1日—9月30日的10~15 d地面气温延伸期集合预报在北半球中纬度的预报效果进行检验评估,并利用多模式集成平均、消除偏差集成平均及超级集合进行多模式集成预报试验,比较了三种集成方法的预报效果;又对各模式的延伸期地面气温预报资料进行滑动平均处理,并对滑动平均后的资料集成;最后对超级集合的训练期窗口进行了调试。得到以下结论:
1)四个集合预报系统的离散度均偏小,存在一定的系统偏差。10~15 d地面气温逐日预报中,ECMWF的预报效果最佳,NCEP和 CMC次之,UKMO预报效果最差。
2)多模式集成平均在一定程度上减小了单个系统预报的系统误差,预报效果优于最好的系统ECMWF,但对预报效果的改善不明显;消除偏差集成平均使预报的均方根误差得到明显降低,预报效果优于最好的单系统和集成平均;超级集合是对等权消除偏差的改进,它使好的模式在集成中获得较大的权重,从而进一步改善了预报效果。
3)对资料进行滑动平均,在一定程度上滤去了短波扰动,反映了延伸期中某一天气过程的平均状态,故其预报均方根误差低于逐日预报,且7 d滑动平均效果最好,其次是5 d及3 d滑动平均。BREM及SUP的优势在滑动平均后的预报中较单个系统及EMN更加突出。
图6 2008年7月1日—9月30日多模式超级集合对地面气温240 h预报的平均均方根误差地理分布(单位:℃) a.逐日;b.3 d 滑动平均;c.5 d 滑动平均;d.7 d 滑动平均Fig.6 Geographical distribution of the mean RMS error of 240 h surface air temperature forecast of SUP from 1 July to 30 September 2008(units:℃) a.daily;b.3-day moving average;c.5-day moving average;d.7-day moving average
4)通过对SUP训练期的调试,发现滑动平均前后,不同时效的最适训练期长度也不同。对于逐日及3 d滑动平均预报,10~12 d预报的训练期为75 d时最佳,13~15 d预报的训练期长度选取35 d为宜;对于5 d及7 d滑动平均预报,10~15 d各个预报时效的均方根误差在训练期长度为35 d时最小。
陈丽娟,李维京.1999.月动力延伸预报产品的评估和解释应用[J].应用气象学报,10(3):486-490.
段明铿,王盘兴.2004.集合预报方法研究及应用进展综述[J].南京气象学院学报,27(2):279-288.
金荣花,马杰,毕宝贵.2010.10~30 d延伸期预报研究进展和业务现状[J].沙漠与绿洲气象,4(2):1-5.
李俊,杜钧,王明欢,等.2009.中尺度暴雨集合预报系统研发中的初值扰动试验[J].高原气象,28(6):1365-1375.
李莉,李应林,田华,等.2011.T213全球集合预报系统性误差订正研究[J].气象,37(1):32-34.
李维京,陈丽娟.1999.动力延伸预报产品释用方法的研究[J].气象学报,57(3):338-345.
林春泽,智协飞,韩艳,等.2009.基于TIGGE资料的地面气温多模式超级集合预报[J].应用气象学报,20(6):706-712.
麻巨慧,朱跃建,王盘兴,等.2011.NCEP、ECMWF及CMC全球集合预报业务系统发展综述[J].大气科学学报,34(3):370-380.
肖玉华,何光碧,陈静,等.2011.区域集合预报增长模繁殖扰动方法研究[J].高原气象,30(1):94-102.
智协飞,陈雯.2010.THORPEX国际科学研究新进展[J].大气科学学报,33(4):504-511.
智协飞,林春泽,白永清,等.2009.北半球中纬度地区地面气温的超级集合预报[J].气象科学,29(5):569-574.
Epstein E S.1969.Stochastic dynamic prediction[J].Tellus,21:739-759.
Krishnamurti T N,Kishtawal C M,LaRow T E,et al.1999.Improved weather and seasonal climate forecasts from multimodel superensemble[J].Science,285:1548-1550.
Krishnamurti T N,Kishtawal C M,Shin D W,et al.2000a.Improving tropical precipitation forecasts from a multianalysis superensemble[J].J Climate,13:4217-4227.
Krishnamurti T N,Kishtawal C M,Zhang Zhan,et al.2000b.Multimodel ensemble forecasts for weather and seasonal climate[J].J Climate,13:4196-4216.
Krishnamurti T N,Gnanaseelan C,Chakraborty A.2007.Prediction of the diurnal change using a multimodel superensemble.Part I:Precipitation[J].Mon Wea Rev,135:3613-3632.
Lorenz E N.1963.Deterministic nonperiodic flow[J].J Atmos Sci,20:130-141.
图7 10~15 d各个时效SUP预报均方根误差随训练期长度的变化(单位:℃) a.逐日;b.3 d滑动平均;c.5 d滑动平均;d.7 d滑动平均Fig.7 The mean RMS error change of SUP with the training period length for forecasting time from 10 to 15 d(units:℃) a.daily;b.3-day moving average;c.5-day moving average;d.7-day moving average
Lorenz E N.1995.Predictability:A problem partly solved[C]//Proceedings of Seminar on predictability,Vol.1.Reading,UK:ECMWF:1-18.
Miyakoda K,Gordon T,Carerly R,et al.1983.Simulation of a blocking event in January 1977[J].Mon Wea Rev,111:846-869.
Mo R,Straus D M.2002.Statistical-dynamical seasonal prediction based on principal component regression of GCM ensemble integrations[J].Mon Wea Rev,130:2167-2187.
Palmer T N.1990.The European Centre for Medium-Range Weather Forecasts(ECMWF)program on extended-range prediction[J].Bull Amer Meteor Soc,71(9):1317-1330.
Palmer T N.1993.Extended-range atmospheric prediction and the Lorenz model[J].Bull Amer Meteor Soc,74:49-65.
Richardson D,Buizza R,Hagedorn R.2005.Final report of the 1st workshop on the THORPEX Interactive Grand Global Ensemble(TIGGE)[R]//WMO/TD No.1273,WWRP/THORPEX,No.5.Ripley E A,Archibold O W.2002.Accuracy of Canadian short-and medium-range weather forecasts[J].Weather,57:448-457.
Talagrand O,Vautard R.1997.Evaluation of probabilistic prediction system[C]//Proceedings of ECMWF Workshop on Predictability.Reading,United Kingdom:ECMWF:1-25.
Vijaya Kumar T S V,Krishnamurti T N,Fiorino M,et al.2003.Multimodel superensemble forecasting of tropical cyclones in the Pacific[J].Mon Wea Rev,131:574-583.
Zhi Xiefei,Bai Yongqing,Lin Chunze,et al.2009.Multimodel superensemble forecasts of the surface air temperature in the Northern Hemisphere[C]//Abstract,Third THORPEX International Science Symposium.California:TTISS.
Zhi Xiefei,Zhang Ling,Bai Yongqing.2011.Application of the multimodel ensemble forecast in the QPF[C]//Proceedings of International Conference on Information Science and Technology.Nanjing,China:IEEE:657-660.doi:10.1109/ICIST.2011.5765333.
Zhi Xiefei,Qi Haixia,Bai Yongqing,et al.2012.A comparison of three kinds of multi-model ensemble forecast techniques based on the TIGGE data[J].Acta Meteor Sinica,26(1):41-51.doi:10.1007/s13351-012-0104-5.