董 全 张 峰 宗志平
1)(国家气象中心, 北京 100081)2)(大连市气象局, 大连 116001)
不同相态降水对生产生活影响截然不同,尤其在冬半年,发生雨雪转换或冻雨常造成较大损失[1]。同时降水相态与整层的大气温湿廓线相关,对其敏感且相互影响[2],因此降水相态预报是天气预报业务的重点,也是难点。
降水相态预报主要有两种方法:一种是基于历史个例分析的阈值法[3],另一种是基于数值模式的MOS(model output statistics)或非线性的机器学习等统计建模方法。阈值法通过个例分析,归纳出与雨雪相态转换相关的阈值因子,主要是中低层的气温、露点气温、湿球温度、厚度、0℃层高度等要素[4-6]。统计建模方法通过构建降水相态与数值模式中低层气象要素之间的统计模型对其进行预报[7]。Allen等[8-9]运用模式输出不同高度的气温、湿球温度、温度平流、风、厚度、冻结层高度等要素作为预报因子,建立雨、雪、冻雨和无降水4类事件的多元线性回归的MOS预报模型。董全等[10]运用人工神经网络方法,基于数值模式产品开发了中国区域雨雪相态的客观预报产品。Scheuerer等[11]基于美国GEFS集合预报系统,运用贝叶斯分类器以湿球温度廓线为预报因子,开发了降水相态概率预报方法。
近年随着数值模式的发展,降水相态模式预报产品准确率不断提高,成为降水相态预报中的重要参考。欧洲中期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECMWF)集合预报系统的降水相态预报产品(precipitation type,PTYPE)[12]在预报业务应用中表现出较好的预报效果[13-14]。
集合预报系统考虑数值模式物理过程和初始条件等不确定性因素,从概率角度提高数值模式预报性能[15-18]。在实际预报应用中,面对确定性预报要求,需将集合概率预报转换为确定性预报[19]。目前最优概率阈值法(OPT)应用较广,该方法通过设定概率阈值将概率预报转换为确定性预报。集合预报在定量降水预报应用方面,最优百分位[20]、频率匹配[21]等方法取得很好的预报效果。在确定性预报产品订正中,吴启树等[22]运用TS评分最优和ETS评分最优确定模式降水量的订正阈值,孙靖等[23]运用滑动训练期方法完成降水量预报订正。
本文基于ECMWF 集合预报系统的PTYPE概率预报,运用OPT方法,分别以HSS评分最优(OHSS)、TS评分最优(OTS)和频率偏差最优(OB)为标准,生成降水相态确定性预报产品OPTH,OPTT和OPTB,并与ECMWF细网格模式相态预报产品(HRD)及ECMWF集合预报系统控制成员相态预报产品(CF)进行对比。
ECMWF模式运用温湿层结曲线预报结果,对降水粒子下落过程中的融化和再冻结物理过程进行参数化描述,开发PTYPE产品,对雨、干雪、湿雪、雨夹雪、冻雨和冰粒共6类降水相态进行定量预报[12-14]。由于实况中无湿雪的天气现象,本研究将干雪和湿雪归为一类。冰粒和冻雨发生时的温湿层结接近[12],且冰粒发生频率很低,因此将冰粒和冻雨归为一类。最终分为雨、雪(包括干雪和湿雪)、雨夹雪和冻雨(包括冻雨和冰粒)共4类降水相态进行研究。
运用2016—2018年冬半年(当年10月至次年3月,下同)全国2515个国家级气象站3 h间隔的天气现象实况和ECMWF集合预报系统PTYPE产品,其中2016—2017年冬半年资料用于参数估计和模型构建,2018年冬半年资料用于模型检验评估,同时利用2018年冬半年HRD和CF进行对比检验。
ECMWF产品在预报无降水处无相态预报,故其集合预报系统输出的降水相态概率P(x>0,w)为两个概率的联合概率,即
P(x>0,w)=P(x>0)×P(w│x>0)。
(1)
式(1)中,x为降水量,w为降水相态,P(x>0)为降水概率,P(w|x>0) 为预报有降水时降水相态的条件概率。模型构建中,为了剔除降水预报的误差和不确定性对模型和估计参数影响,本文仅考虑预报有降水时的相态条件概率P(w|x>0)。对式(1)进行转换,得
P(w│x>0)=P(x>0,w)/P(x>0)。
(2)
近年我国部分气象站取消了天气现象的人工观测,需剔除地面观测中天气现象缺测样本。本文仅考虑实况出现降水且模式预报降水概率大于0的站点,并对该站点各相态概率根据式(2)进行转换。同样,在HRD和CF对比检验中,仅考虑实况出现以上4类降水相态同时预报也有降水相态的样本。以2016—2017年冬半年满足上述条件样本作为模型构建样本,其中,雨、雨夹雪、雪和冻雨的样本量分别为220272,5772,44160和1207;2018年冬半年作为检验评估的雨、雨夹雪、雪和冻雨的样本量分别为178361,3057,32023和801。
以上4类降水相态事件夜间样本量较白天明显偏少,为了剔除由于样本量差异导致的模型参数估计不确定性,将24 h内的样本统一分析,如对于08:00(北京时,下同)起报的预报,将11:00,14:00,17:00,20:00,23:00,02:00,05:00和08:00的样本一同分析;对于20:00起报的预报,将23:00,02:00,05:00,08:00,11:00,14:00,17:00和20:00的样本一同分析。最优概率阈值估计和大样本统计检验均针对0~24 h,24~48 h,48~72 h等预报时效。
1.2.1 降水相态检验方法
针对雨、雨夹雪、雪和冻雨4类降水相态事件,采用传统的二分类事件检验方法,分别将以上4类事件转换为二分类事件,以TS评分和频率偏差为检验参数[24]。
对每一类事件的独立评估检验,不能准确反映4类降水相态事件整体预报效果。因此运用多分类事件的预报检验[24-25],选用正确率和HSS评分两个参数。对4分类事件评估检验的事件列联表如表1所示。
正确率为4分类事件的预报正确率,表示预报正确的样本量占总样本量比例,即
C=(a+b+c+d)/N,
(3)
式(3)中,N为总样本量。HSS评分为多分类事件的正确率的技巧评分,对比预报正确率相对于完全随机预报正确率的相对预报技巧,其计算公式为
H=[C-(Po1×Pf1+Po2×Pf2+Po3×Pf3+
Po4×Pf4)]/[1-(Po1×Pf1+Po2×Pf2+
Po3×Pf3+Po4×Pf4)]。
(4)
其中,完美预报的正确率为1,随机预报的正确率为(Po1×Pf1+Po2×Pf2+Po3×Pf3+Po4×Pf4),降雨的预报边际概率Pf1=(a+e+r+g)/N,降雨的观测边际概率Po1=(a+h+z+n)/N,雨夹雪、雪和冻雨的预报边际概率分别为Pf2,Pf3,Pf4;观测边际概率分别为Po2,Po3,Po4;其计算公式以降雨边际概率类推。
表1 雨、雨夹雪、雪和冻雨预报检验的4分类列联表Table 1 The contingency table for four categories of rain,sleet,snow and freezing rain
1.2.2 最优概率阈值法(OPT)
确定一个概率阈值后,即可将概率预报转换为确定性预报。最优化问题是求解使某一检验标准达到最优时的概率阈值,从而将概率预报转换为最优的确定性预报。常用检验标准包括TS评分、ETS评分、频率偏差[19-22]等。本文分别对比HSS评分最优(OHSS),TS评分最优(OTS)和频率偏差最优(OB),运用全国的全部样本进行最优概率阈值的估计。OTS和OB的最优概率阈值估计方法同文献[22]。
OHSS的最优概率阈值估计采用梯度增加法[26]。由于4类相态的概率满足和为1的约束,因此独立变量仅3个。个例检验结果[注]董全, 胡宁, 宗志平. ECMWF降水相态预报产品(PTYPE)应用和检验. 气象,待发表.显示,ECMWF集合预报系统相态预报产品的雨雪分界线存在系统性偏差,导致雨雪分界线南北两侧雨夹雪最优概率阈值存在差异,故只估计雨、雪和冻雨3类事件的最优概率阈值,当上述3类事件概率均小于最优概率阈值时,则判定为雨夹雪。求得最优概率阈值后,可将集合预报系统降水相态概率预报转换为确定性预报。对应OHSS,OTS和OB这3个最优标准,分别生成OPTH,OPTT和OPTB共3种降水相态确定性预报产品。
分别以OHSS,OTS和OB为标准,08:00和20:00起报的不同预报时效雨、雨夹雪、雪和冻雨最优概率阈值如图1所示。以OHSS为标准,降雨最优概率阈值从0~24 h预报时效的7%逐渐增大到216~240 h预报时效的约27%,降雪最优概率阈值从0~24 h预报时效的60%减小至216~240 h预报时效的约40%,冻雨最优概率阈值从0~24 h预报时效的约80%减小至216~240 h预报时效的约50%。比较OHSS,OTS和OB标准的最优概率阈值,以OB为标准,4类降水相态最优概率阈值均最大,以OTS为标准的最优概率阈值与以OB为标准相比有所减小,可见以OTS为标准时适当增大了预报范围。以OHSS为标准,降雨和降雪最优概率阈值与以OTS为标准相比进一步减小,冻雨最优概率阈值与以OB为标准接近。以OTS和OB为标准,4类降水相态分别估计最优概率阈值,受不同降水相态概率之和为1的约束,无法保证4类事件总体的评分最优,OHSS很好地克服了这一缺陷。另外,08:00和20:00起报的不同预报时效的最优概率阈值基本一致,可见最优概率阈值具有稳定性。
图1 不同最优标准、不同相态、不同时效预报最优概率阈值(以OHSS为标准时无雨夹雪阈值)Fig.1 Estimated optimal probability thresholds under criteria of OTS,OB,OHSS as a function of lead times for different initial times(no sleet threshold under criteria of OHSS)
续图1
不同预报产品对2018年冬半年我国4类降水相态不同预报时效的HSS评分和正确率如图2所示,HSS评分和正确率均随时效延长逐渐减小。CF的预报效果最差,正确率由0~24 h时效的约92%减小至216~240 h时效的约91%,HSS评分由0~24 h时效的0.74减小至216~240 h时效的约0.55。HRD不同时效的正确率和HSS评分均明显优于CF。最优概率阈值法预报效果大多优于HRD和CF,其中OPTH预报效果最好,0~24 h和216~240 h时效HSS评分分别为0.805和0.677,较CF提高约0.07,上述时效的正确率分别为94.5%和93.0%,较CF提高约2%。可见,多成员集合预报优于细网格确定性预报[27-28],这也是集合预报系统得到大力发展的原因之一。
图2 2018年冬半年全国降水相态、不同时效预报的HSS评分和正确率Fig.2 HSS and proportion correct of precipitation type forecast at different lead times for 2018 winter half year
续图2
不同预报产品对2018年冬半年我国4类降水相态不同预报时效的TS评分和频率偏差如图3和图4所示。由TS评分(图3)可知,各预报产品中,降雨预报TS评分最高,均超过0.9;降雪预报次之,TS评分为0.5~0.8;冻雨预报TS评分为0.1~0.15;雨夹雪预报TS评分最低,为0~0.06。除雨夹雪之外,CF对其余各类降水相态预报的TS评分均最低,频率偏差(图4)也最差,降雨预报范围偏小,降雪预报范围偏大,冻雨预报范围偏大尤其明显,频率偏差达3.0左右。HRD雨夹雪预报与CF 持平,其余各类降水相态预报TS评分较CF有所提高,改进了频率偏差。
与CF和HRD相比,不同最优标准时的OPT方法进一步提高降雨和降雪(图3)预报的TS评分,并改进了频率偏差,其中OPTH的改进最明显,将降雨的TS评分从HRD的约0.93提高至0.94以上,减小HRD和CF对降雨预报范围偏小、降雪预报范围偏大的误差。对冻雨的预报,虽然不同标准时OPT方法的TS评分与HRD持平或略减小,但频率偏差较HRD显著改善至接近于1,即空报范围明显减小。对雨夹雪的预报,各产品几乎无预报能力,虽然OPTB对雨夹雪预报的TS评分最高,但预报范围偏大明显,频率偏差约为1.6。OPTH对雨夹雪的预报评分最低、预报范围最小,频率偏差约为0.1~0.3,TS评分接近于0。OPTH降低可预报性最低的雨夹雪的预报能力,提高可预报性高的雨、雪和冻雨的预报能力,从而达到对4类降水相态整体预报性能最优的目的。
可见,在多分类事件的预报中,仅针对某一类事件进行预报改进,可能会降低其他事件的预报能力,导致整体预报性能降低,因此有必要运用多分类的检验参数和最优评估方法。
另外,ECMWF降水漏报会导致降水相态的漏报。HRD对降水的漏报率从24 h时效的约8%逐渐升高至240 h时效的约40%,运用式(2)转换后,集合预报系统减小漏报,0~240 h时效降水漏报率均低于1%(图略),即有效减小对降水相态的漏报。
图3 2018年冬半年全国降水相态不同时效预报TS评分Fig.3 TS scores of precipitation type forecast at different lead times for 2018 winter half year
续图3
图4 2018年冬半年全国降水相态不同时效预报频率偏差Fig.4 Forecast bias of precipitation type at different lead times for 2018 winter half year
续图4
由上述评估和对比可见,3种最优标准下的预报产品中,OPTH预报效果最佳,因此,个例检验中仅对比OPTH,HRD和CF。
2018年12月7日前后,南支槽在孟加拉国附近不断加深,7—11日随着南支槽东移,中低层(700 hPa)急流明显加强,暖湿气流沿我国中东部地区冷高压爬升,形成有利于冰冻天气产生的逆温层结,我国南方大部地区出现一次雨雪冰冻天气过程。
2018年12月9日02:00上海、浙江北部、江西北部等地出现降雪,浙江南部和江西中南部出现降雨,雨雪分界线位于浙江中部至江西北部。降水相态最复杂的是贵州,南部为降雨,中部为冻雨、降雪和雨夹雪共存,北部以雨为主,个别站点出现冻雨。由于观测自动化,安徽和湖南无天气现象观测,降水相态为缺测,此处不予考虑。对于30 h时效预报,OPTH(图5a)较HRD和CF更好地预报出上述降水相态。首先,对江西北部和浙江中南部的降雨,HRD和CF均预报为冻雨或雨夹雪,OPTH预报与实况一致,且HSS评分提高至0.53。其次,对贵州中南部的冻雨,OPTH预报范围明显减小,有效减小了空报,冻雨预报TS评分提高至0.31。HRD(图5b)对雨雪分界线的预报与CF基本一致,由于HRD更高的分辨率,一定程度上减小冻雨的空报,较CF将冻雨预报的TS评分提高至0.28,HSS评分提高至0.51。CF(图5c)预报出浙江中部至江西北部的雨雪分界线大体位置,但冻雨预报范围较实况明显偏大,导致冻雨预报TS评分(0.21)和整体HSS评分(0.48)均低于OPTH和HRD。贵州降水相态最复杂,HRD和CF预报误差均较大,将贵州北部个别站点的降雨预报为降雪,贵州中部雨、雪、雨夹雪和冻雨共存的区域预报为冻雨。
图5 2018年12月7日20:00起报30 h时效降水相态确定性预报(填色)与实况(离散点)对比(a)OPTH,(b)HRD,(c)CFFig.5 Precipitation type deterministic forecasts at lead time of 30 h from 2000 BT 7 Dec 2018(the shaded) and corresponding observations(the scattered) (a)OPTH,(b)HRD,(c)CF
由集合预报系统对4类降水相态30 h时效概率预报(图6)可见,降雨(图6a)和降雪(图6c)高概率区与实况基本一致,雨夹雪概率(图6b)普遍较低,约为25%,冻雨(图6d)高概率区范围偏大明显。对浙江中南部的降雨,集合预报系统预报降雨概率约为20%,雨夹雪概率约为20%,降雪概率约为10%,冻雨概率最大,约为50%。虽然冻雨概率最大,但降雨概率达到OHSS时的降雨最优概率阈值,OPTH客观预报判断为降雨,最优概率阈值法对该处降水相态进行有效订正。在贵州南部,基于最优的冻雨最优概率阈值,OPTH较CF和HRD显著减小冻雨预报范围,有效控制了空报。但在上海和贵州中部,OPTH并未显著改善降水相态预报效果。
图6 2018年12月7日20:00起报30 h时效ECMWF集合预报系统PTYPE概率预报(填色)和实况(离散点)对比(a)雨,(b)雨夹雪,(c)雪,(d)冻雨Fig.6 ECMWF ensemble prediction system precipitation type probabilistic forecasts at lead time of 30 h from 2000 BT 7 Dec 2018(the shaded) and corresponding observations(the scattered)(a)rain,(b)sleet,(c)snow,(d)freezing rain
对于126 h时效预报,OPTH(图7a)较HRD和CF减小了冻雨空报,对浙江北部降雪预报有所改进,但对降雪预报误差仍大于CF。HRD(图7b)较CF减小了浙江中部等地冻雨空报,将冻雨预报TS评分由CF的0.28提高至0.40。CF(图7c)的雨雪分界线较30 h时效预报(图5c)更接近实况,对浙江北部降雪预报更优,明显优于HRD和OPTH。集合预报系统126 h时效概率预报(图略)落区与30 h 时效预报基本一致,概率较30 h时效预报有所减小,江西中部降雨概率较30 h时效预报减小至约为75%,同时冻雨概率增加至约25%。由于中期时效最优概率阈值相应减小,因此OPTH 126 h时效预报与30 h时效预报基本一致。可见对于较稳定的雨雪相态过程,数值模式中期时效预报效果(图7)与短期时效预报(图5)基本持平。
图7 2018年12月3日20:00起报126 h时效降水相态确定性预报(填色)与实况(离散点)对比(a)OPTH,(b)HRD,(c)CFFig.7 Precipitation type deterministic forecasts at lead time of 126 h from 2000 BT 3 Dec 2018(the shaded) and the corresponding observations(the scattered) (a)OPTH,(b)HRD,(c)CF
2019年1月8日夜间至9日白天,江南北部、江淮、黄淮南部出现一次雨雪天气过程。9日08:00雨雪分界线位于湖北中部至江苏南部一带(图8a)。对于24 h时效预报,OPTH(图8a)较HRD和CF减小了湖北中部雨夹雪的空报,降雨预报TS评分由HRD和CF的0.83提高至0.86,HSS评分由CF的0.64和HRD的0.63提高至0.69。HRD(图8b)和CF(图8c)对江苏南部雨夹雪和降雪预报较实况位置偏西,对湖北雨夹雪预报范围明显偏大且位置偏南,从而导致降雨和雨夹雪预报范围偏大。
图8 2019年1月8日08:00起报24 h时效降水相态确定性预报(填色)与实况(离散点)对比(a)OPTH,(b)HRD,(c)CFFig.8 Precipitation type forecasts at lead time of 24 h from 0800 BT 8 Jan 2019(the shaded) and corresponding observations(the scattered)(a)OPTH,(b)HRD,(c)CF
续图8
对于120 h时效预报(图9),3种预报产品对湖北中部雨雪分界线预报较好,与实况基本一致。对江苏南部的雨雪分界线和雨夹雪,HRD(图9b)和CF(图9c)预报较实况位置明显偏北,OPTH(图9a)改善了这一误差,降雨和降雪预报TS评分以及整体HSS评分均优于HRD和CF,HSS评分由CF的0.67和HRD的0.71提高至0.79。
图9 2019年1月4日08:00起报120 h时效降水相态确定性预报(填色)与实况(离散点)对比(a)OPTH,(b)HRD,(c)CFFig.9 Precipitation type forecasts at lead time of 120 h from 0800 BT 4 Jan 2019(the shaded) and corresponding observations(the scattered)(a)OPTH,(b)HRD,(c)CF
续图9
本文运用最优概率阈值法(OPT),分别以HSS评分最优(OHSS)、TS评分最优(OTS)和频率偏差最优(OB)为标准,基于ECMWF集合预报系统降水相态预报产品PTYPE,运用2016—2017年冬半年的观测和预报产品估计最优概率阈值,开发降水相态客观预报产品。以2018年冬半年资料进行评估检验,并与ECMWF细网格模式相态预报产品(HRD)及集合预报系统控制成员相态预报产品(CF)进行对比分析。得到如下结论:
1) 以OHSS为标准,冻雨最优概率阈值在80%至50%之间,降雪最优概率阈值在60%至40%之间,降雨最优概率阈值在7%至27%之间,前两者最优概率阈值随时效延长逐渐减小,降雨最优概率阈值随时效延长逐渐增大,且以OB为标准最优概率阈值最大,以OTS和OHSS为标准最优概率阈值接近。
2) 对比检验结果显示:CF预报效果最差,其次为HRD,OPT较前两者明显提高4类降水相态的HSS评分和正确率,且以OHSS为标准提高率最明显。相对于CF,HSS评分和正确率分别提高0.07和2%左右。
3) 个例检验显示:CF和HRD对冻雨预报范围明显偏大,以OHSS为标准OPT有效减小冻雨预报范围,改善冻雨空报,同时对雨雪分界线的预报有一定改进,整体上提高降水相态预报能力。
基于集合预报系统的最优概率阈值法,较集合预报系统控制成员和细网格模式确定性预报显著提高降水相态预报能力。但该方法还存在一定局限性,有较大提升空间。上述模型未考虑最优概率阈值的空间和时间差异,以及日变化影响,采用分区、分月份、逐时刻的建模方法,可进一步提高预报能力。数值模式中期时效雨雪分界线预报出现特别显著偏差时,最优概率阈值法订正能力有限,可考虑采用领域法[29]、逻辑回归、深度学习[30]等方法对其进行订正。另外,HSS评分是对4类事件的预报进行等权重检验评估,对于特定的预报或服务对象,可采用Gandin和Murphy公平评分体系(GMSS)、最大经济价值、二分类检验等[24-25]更有针对性的检验,以提高预报能力。