李淑娟,毛炜峄,陈 静,于晓晶,贾孜拉·拜山
(1.中国气象局乌鲁木齐沙漠气象研究所,新疆 乌鲁木齐 830002;2.中亚大气科学研究中心,新疆 乌鲁木齐 830002;3.新疆气候中心,新疆乌鲁木齐 830002)
中国气象局气候中心第二代动力延伸预测模式系统(DERF2.0)是基于第一代(DERF1.0)的升级,2014年向各省推送业务应用的同时下发了1983—2013年的历史回算数据,各省在进行模式预报能力检验时大多基于这一数据,鉴于模式性能稳定,文中的相关工作也是基于这一时段的数据展开。在模式应用过程中,很多学者对其预报性能进行了分析,认为DERF2.0系统受地形、下垫面等因素的影响,对不同要素的预报效果在不同区域存在一定差异:模式对极端旱涝事件具有一定预报能力[1],但月平均温度预报与观测实况仍然存在较大偏差,模式预报有较大改进空间[2-3],针对广西87个台站的气温和降水展开检验评估,发现该系统对广西月气温的总体效果优于降水,气温和降水的预测效果存在明显的月季变化,夏季的预报效果最差[4],而重庆地区34个测站的2月气温和8月500 hPa高度场经过检验后,预测效果低纬好于中高纬,8月总体好于2月[5],贵州省冬季和春季的气温预测评分较好,秋季降水预测评分最高,基本能够预测出贵州的秋季总体旱涝趋势[6],基于甘肃省1月2 m温度的预报效果评估结果,认为模式对气温的空间模态有较好的回报结果,但气温异常变化的中心及空间趋势与观测有较大差异[7],对于2013年乌鲁木齐站春季温度的预报性能而言,预报偏差随预报时效推进而增大,延伸期预报偏差明显大于中期[8]。
中天山北坡经济带属于典型的干旱绿洲经济区,是新疆现代工业、农业、交通信息、教育科技等最为发达的核心区域,是未来新疆经济发达的综合示范区,自然资源条件优越,可是生态环境相对脆弱,受气候条件影响显著,尤其在寒潮偏多年份,秋季寒潮过程的爆发次数往往最多[9],给当地农牧业等的生产收获和发展带来巨大灾难。为规避或减少灾害天气带来的损失,给防灾减灾工作争取时间,不断提高中期(预报时效在10 d以下)至延伸期预报(预报时效为10~30 d)的准确率尤为必要。第二代动力延伸预测模式系统(DERF2.0)是新疆气候中心气候延伸期及中期预测的重要参考工具,但是产品应用过程中缺乏系统的检验评估,业务参考主要基于定性误差判断,缺乏定量的偏差分析依据。因此,借鉴以往的模式预报检验方法[10-17],针对中天山北坡经济带8个代表台站,包括呼图壁、玛纳斯、乌鲁木齐、昌吉、阜康、吉木萨尔、奇台和木垒站,进行秋季最低温度的预报检验,客观评估DERF2.0模式的预报性能,以期为延伸期预报改进提供量化参考,为防灾减灾提供气候预测基础。
中天山北坡经济带选取8个代表站(图1):呼图 壁(Hutubi)、玛 纳 斯(Manasi)、乌 鲁 木 齐(Urumqi)、昌吉(Changji)、阜康(Fukang)、吉木萨尔(Jimusaer)、奇台(Qitai)和木垒(Mulei)站。观测资料为上述站点的2 m逐日最低气温(Tmin)资料,来自新疆气象信息中心,时间为1983—2013年秋季,即9月1日—11月30日。预报数据来自国家气候中心DERF2.0模式输出的未来1~52 d逐日1°×1°分辨率的最低气温预报数据(20个全样本集合平均),资料选取时段为1983—2013年每年的7月12日—11月30日。数据分析时,采用双线性插值方法插值为站点数据进行运算,再结合站点观测实况进行检验。
图1 中天山北坡经济带8个代表站分布
检验中使用了预报偏差分析确定模式的预报偏差,采用相关分析获得预报结果与观测的协同变化关系,应用均一化标准差对预报与观测的离散程度进行诊断,还利用均方根误差以及PS评分指标对预报的整体偏差水平进行检验,其中,均一化标准差(NSTD)、均方根误差(RMSE)、PS评分的计算公式如下:
NSTD为均一化标准差,是模式模拟数据的标准差和观测数据标准差的比值[10],其中,STD=,N为样本数,Xi为第i个样本的值,是N个样本的平均值。均一化标准差反映数据离散程度,为评估DERF2.0模式模拟结果与观测值时间序列之间的差异,i为时间样本。一般认为NSTD的值介于0.75~1.25的模式模拟性能良好。
其中,RMSE为均方根误差,N为样本量,XM,i和Xo,i分别为第i个样本的模拟值和观测值。均方根误差反映模式预报数据和观测实况的整体偏差水平,RMSE越小、越接近0,表明模拟效果越好。
其中,P为预测正确总次数,N为预测总次数[14],PS评分为综合评分,其值用Ps表示,用于衡量预报准确率,评分的偏差标准采用业务标准中的±2℃,不对温度进行进一步的等级划分。
检验对象分别为:秋季逐日气温预测检验,秋季逐日24 h变温预测检验,秋季典型降温过程预测检验。预报偏差为DERF2.0输出的预报值减去对应的观测实况,当偏差<0℃时,称为冷偏差,当偏差>0℃时,称为暖偏差。
根据1983—2013年的观测数据(图2a),中天山北坡经济带8个代表站的多年平均秋季逐日最低气温整体随季节推进而在波动中下降,站点间的下降趋势以及幅度差异不大。乌鲁木齐站的秋季平均日最低温度最高,奇台站最低,二者多年秋季平均温度相差3.6℃;乌鲁木齐多年平均秋季日最低气温在9月1日最高,为14.6℃,在11月28日最低,为-10.0℃,近31 a平均秋季温度呈升高趋势(图2b);奇台站秋季的日最低气温最高温度9月1日最高,为11.1℃,11月29日最低,为-15.5℃。
图2 中天山北坡经济带8个代表站秋季多年平均日最低温度(a)及乌鲁木齐秋季年平均最低温度(b)
基于DERF2.0预报结果,对1983—2013年秋季(9月1日—11月30日)逐日最低气温计算预报偏差并进行多年平均,得到8个代表站1~52 d不同预报时效的日平均最低气温预报偏差(图3,只选取1、5、10、15、20、30 d共6个预报时效)。无论预报时效长短,各站秋季日最低气温预报偏差整体以冷偏差为主,即预报结果较实况日最低气温偏低,冷偏差幅度随季节变化特征大致分为两种类型。第一类,9月初冷偏差幅度最大,之后偏差幅度逐渐减小,到秋季后期(11月中下旬)出现明显正偏差,各阶段的偏差主要介于-6~2℃,测站包括:乌鲁木齐、玛纳斯、呼图壁、昌吉、阜康。第二类,9月初为弱冷偏差,之后冷偏差幅度逐渐增大,10月中旬后冷偏差幅度逐渐减小,到11月中下旬为明显正偏差,偏差范围主要在-3~5℃,测站包括:奇台、木垒、吉木萨尔。
图3 8个代表站秋季平均日最低温度预报偏差
整体而言,乌鲁木齐站的预报偏差最大,10月上旬之前,奇台站的预报偏差最小,10月上旬之后,木垒站的预报偏差最小。各站的预报偏差整体随预报时效延长而增大,但是当季节推进到11月底(多数站点在11月28日以后)、所有时效的预报偏差均>0℃时,预报时效为1 d(d1)的预报偏差是所有预报时效中最大的,这可能和秋冬季节转换期间初值场中雪盖等下垫面要素的偏差有关。在整个秋季,DERF2.0模式的预报偏差由冷偏差逐渐向暖偏差转变,这可能是由系统误差造成,而站点之间的空间差异,很可能是因为模式对沿天山一带的地形、海拔等综合因素的模拟能力不足而导致。
打开Photoshop,使用移动工具将花的照片放在人像上面,大致对齐。将图层的混合模式改为叠加,有必要的话,适当调整图片位置,然后添加反相蒙版。
分别将提前1~30 d预报的各站31 a秋季逐日最低温度与观测实况进行整体超前相关分析,各测站在每个预报时效下相关系数的计算样本量为2 821个,结果见图4。DERF2.0模式预报输出的8站秋季逐日预报结果与实况之间的相关系数整体介于0.84~0.95,随着预报时效的延长而减小(图4a),去除季节变化的线性趋势之后,相关系数下降明显(图4b),最大相关系数为0.36,最小为-0.02,表明DERF2.0模式对日最低温度的季节变化趋势把握较好,但是对去除线性变化趋势后的逐日温度预报能力相对较弱。
以乌鲁木齐站为例,分析DERF2.0模式的逐年预报效果是否稳定。计算乌鲁木齐站每年秋季提前1~30 d的DERF2.0预报的日最低气温与实况之间的相关系数,每年秋季计算相关系数样本为91,提前1 d(d1)、5 d(d5)、10 d(d10)、15 d(d15)、20 d(d20)以及30 d(d30)的6个预报时效的相关系数结果见图4c、4d。乌鲁木齐(图4c)不同预报时效的相关系数在各年份普遍高于0.8,表明预测和观测的时间一致性较好。去除季节变化的线性趋势之后(图4d),逐年的相关系数整体介于-0.4~0.9,较去趋势之前的0.72~0.97这一变化区间有大幅下降,不同预报时效间的相关系数差异也明显增大,预报时效越长,相关系数越小,预报时效在18 d以上时,多站的相关系数接近0,对预报的参考价值有限,同时,延伸期内不同时效的相关系数差异远小于中短期。
值得关注的是,逐年相关系数中,去除季节变化的线性趋势后,当预报时效为15 d时,整个区域平均有29%的年份相关系数通过了0.05的显著性检验,其中,奇台站通过0.05的显著性检验的比率最高,达到35%,呼图壁最低,为23%,而乌鲁木齐为32.3%(10 a,图4d),这表明DERF2.0模式在延伸期时效内对日最低气温仍具有一定预报能力。此外,预报时效为15 d时,去除季节变化趋势前,在普遍高值的相关系数背景下1994年相关性最差(图4c),去趋势后,在普遍低值相关的背景下1997、2006和2009年的相关性最好,均在0.6以上(图4d),通过温度分析后认为,不论是否去除温度的季节变化趋势,温度分布由暖向冷转变的季节变化趋势越强,相关性越好、可预报性越强。反之,则相关度降低、可预报性减弱,如2009年的温度分布由暖向冷转变的季节性趋势很明显,去除季节变化的趋势后,温度分布仍然有很强的暖向冷转变趋势,因此,去趋势前后这一年的预报相关性均很好。
图4 秋季最低温度的预报相关系数
分别分析了8站的31 a秋季以及逐年秋季的日最低气温不同预报时效的预报离散程度(NSTD)。NSTD介于0.75~1.25的预报效果较好,越接近1代表预报与观测的离散程度越接近。图5a中,8站预报时效为1~30 d的预报结果的均一化标准差(NSTD)在0.72~0.89,NSTD在较为合理的范围,且各站延伸期的NSTD随预报时效推进而减小,中短期预报时段内的NSTD表现为先增大后减小,峰值出现在预报时效为5 d时。结合图4的结果,NSTD较高主要是因为DERF2.0对秋季最低温度的季节变化趋势把握较好。
以乌鲁木齐为例,分析逐年秋季日最低气温的NSTD变化情况(图5b),NSTD在不同年份的变化并不总是随预报时效的推进而呈规律性变化,也没有哪一个预报时效能在整个检验时段内始终表现为预报效果最好(NSTD接近1),但相对来说,预报时效为5 d时,整体预报离散程度为所有预报时效中最好,其NSTD均普遍在0.75以上且更接近1。
图5 秋季最低温度的均一化标准差(NSTD)
8个代表站秋季日最低气温的31 a整体以及逐年不同预报时效的均方根误差(RMSE)如图6。各站的整体偏差较大,多年整体RMSE均远大于1(图6a),站点之间的RMSE差别明显,奇台和木垒站的RMSE较小,介于2.8~4.4,乌鲁木齐站的RMSE较大,变化范围在4.2~6.0。各站的RMSE在延伸期和中短期内均随预报时效延长而增大,但延伸期的变化趋势较中短期明显减缓,尤其是奇台和木垒,延伸期内的RMSE基本在3.8~4.4小幅变化。RMSE的结果与偏差分布(图3)基本对应,即偏差越大,RMSE越大。
乌鲁木齐逐年的RMSE(图6b)介于3.0~7.0,在不同年份(从1983—2013年)存在较大差别,但RMSE在整个检验时段内基本随预报时效的推进而增大。
图6 秋季最低温度预报均方根误差(RMSE)
基于多年综合PS评分结果(计算同相关系数),奇台站的预报准确率较高(最高57.21分),乌鲁木齐相对较低(最高31.02分),这种空间差异可能与地形因素、下垫面情况、温度分布等密切相关,各站PS评分随预报时效推进而减小。单站逐年的PS评分随年份、预报时效的不同差别较大,虽然整体的预报能力随预报时效延长而减弱,但也存在异常情况,如最高PS评分(52.75分)出现在1992年时,对应的预报时效为5 d(d5)而非1 d(d1)。值得关注的是,乌鲁木齐逐年的PS评分整体有下降趋势,而且其评分的年际变化与秋季平均温度的年际变化基本反向对应,即平均温度越高(低),评分越低(高)。
3.1.1 偏差分析
24 h变温的预报值减去实况值即为24 h变温的预报偏差,计算逐年秋季(91 d)日最低温度的24 h变温(每年90个变温值),并进行多年平均,得到多年平均24 h变温偏差分布,各站的偏差分布差别不大。
在整个秋季,多年平均24 h变温偏差主要在±1.5℃之间波动变化,站点之间、不同预报时效之间的偏差变化不大,但是偏差的变动幅度相对较大,基本介于1~4℃,其中玛纳斯与呼图壁偏差的绝对值相对最大,在整个季节内,除奇台和木垒在11月中下旬偏差幅度最大外,其他站点的偏差最大幅度均出现在9月下旬,所有站点的最小偏差幅度基本都在10月中下旬、预报时效为1 d和5 d时,预报时效进入延伸期后,偏差幅度相对较大、但时效之间差异不大。
3.1.2 相关系数、RMSE、NSTD分析
对8个代表站31 a间不同预报时效的24 h变温数据(样本量共2 790个)计算相关系数、NSTD以及RMSE。各站的相关系数在预报时效≤10 d时均通过了0.05的显著性检验,其中,在预报时效≤5 d时相对较高,普遍在0.35以上。相关系数存在空间差别,最大的站点为奇台、最小为木垒,随着预报时效的推进,站点之间的差别逐渐减小,延伸期内,各站点之间的相关系数差别不大,均未通过0.05的显著性检验。各站的24 h变温的预报离散程度普遍小于观测,所有站点中,只有乌鲁木齐和昌吉在预报时效≤5 d时的NSTD≥0.75,其他预报时效和站点的NSTD均低于0.75,这表明24 h变温预报值的波动远小于实际观测。各站不同预报时效的RMSE介于2.2~3.4,随预报时效的推进而增大,在延伸期基本稳定,但RMSE存在站点间差异,玛纳斯整体最大,吉木萨尔最小。相比于逐日预报的RMSE(图6a),24 h变温的RMSE相对较小,可是二者均远大于1。结合乌鲁木齐逐年不同预报时效的相关分析、NSTD以及RMSE,不同年份的结果差别较大,但预报时效为1 d和5 d的预报效果均为最优,表明预报时效在5 d以内的DERF2.0模式对24 h变温的预报结果参考价值相对较高。
综合以上分析,相比于逐日最低气温的预报,DERF2.0模式对24 h变温的延伸期预报能力更低,离散程度预报偏弱,虽然RMSE相对较小,但也远大于1,整体对24 h变温的预报能力较逐日最低温度弱,业务参考价值有限。
基于DERF2.0模式对逐日最低气温及24 h变温的预报能力分析,对中天山北坡经济带8个代表站的强降温过程进行预报能力检验。参照《冷空气等级》(GB/T20484—2017)中对冷空气级别的划分,单站强降温过程为48 h过程降温≥8℃,且最低气温<8℃,或者使某地的日最低气温24 h内降温幅度≥8℃,或48 h内降温幅度≥10℃,或72 h内降温幅度≥12℃,而且使该地日最低气温≤4℃的冷空气活动。依据上述标准,1983—2013年秋季,同时覆盖8个代表站的强降温过程共计20次(表1),将8个代表站的降温幅度进行平均作为区域降温幅度,最大区域降温幅度达到-26.18℃(1987年),最小区域降温幅度为-10.19℃(1994年),发生次数最多年份为2003年,同一年秋季爆发3次。选取区域降温幅度最大(1987年)和2003年区域降温幅度最大的过程作为典型分析过程,过程信息见表2。2次典型过程的预报偏差如图7。
表1 中天山北坡经济带秋季强降温过程
表2 2次典型强降温过程
DERF2.0模式对两次强降温过程的预报偏差较大,随着预报提前的日数越多、预报偏差整体越大。综合来看,两次过程初始温度的预报偏差在不同预报时效均以冷偏差为主(图7a,7b),结束温度的预报偏差以暖偏差为主(图7c,7d),造成过程降温幅度预报偏小(图7e,7f)。过程1中,预报时效<10 d时,玛纳斯、呼图壁和昌吉站的过程起始温度预报偏差普遍<3℃,其他站均<2℃,预报时效在10 d以上时,各站的预报偏差随预报时效推进增长较快,在预报时效为15 d前后达到最大,而过程结束温度的预报偏差(尤其是暖偏差)整体偏高且幅度较大,其中呼图壁站的预报比实际降温偏高35.44℃(呼图壁),造成过程降温幅度预报偏小。过程2中,过程的初始温度预报偏低,偏差在各预报时效主要介于-15~0℃,最大偏差为-16.32℃(玛纳斯),而过程结束温度预报偏高,虽然大多数站点的预报偏差在所有预报时效中普遍<2℃,但同样造成过程降温幅度预报偏小。
图7 2次典型强降温过程的预报偏差
2次过程的降温幅度不同,预报的偏差也不同,综合来看,过程起始温度越高,冷偏差越大,过程结束温度越低,暖偏差越大,强降温过程的降温幅度越大,预报偏差越大。
综合评估DERF2.0模式在1983—2013年间对中天山北坡经济带8个代表站秋季中短期及延伸期最低温度的预报效果,结论如下:
(1)DERF2.0对秋季日最低气温的预报效果存在空间差异和时间差异,整体而言,北疆沿天山东部的奇台和木垒两站逐日温度的预报效果优于其他站。对秋季日最低气温季节变化趋势、离散程度的预报把握较好,延伸期预报能力明显低于中短期预报。
(2)DERF2.0模式对8站的预报偏差整体介于-6~2℃,以冷偏差为主,乌鲁木齐的预报偏差整体最大,奇台和木垒最小。8站的预报RMSE随预报时效的推进而增大,以10 d为过渡时效,小于该时效的预报偏差随预报时效推进增大较快,超过该时效后不同时效的预报偏差变化不大。
(3)DERF2.0模式对最低温度的季节变化趋势把握较好,不论是否去除温度的季节变化趋势,温度分布由暖向冷转变的季节变化趋势越强,相关性越好、可预报性越强,在延伸期也具备一定的预报能力。反之,则相关度降低、可预报性减弱。奇台站整体预报评分最高,乌鲁木齐站相对最低,各站的多年综合PS评分整体随预报时效推进而减小,乌鲁木齐的逐年PS评分与其秋季年平均温度分布反向对应,即平均温度越高(低),评分越低(高)。
(4)DERF2.0模式对各测站24 h变温的预报偏差较逐日温度小,不同站点、不同预报时效的24 h变温预报偏差主要介于-1~1℃,预报的相关性较低,离散程度远小于观测值的24 h变温,对24 h变温的预报能力整体弱于逐日温度的预报能力,预报时效为1 d和5 d的预报结果对业务参考价值相对较高。
(5)强降温过程的降温幅度不同,模式预报的偏差也不同,但DERF2.0模式对强降温过程的预报偏差过大。对过程初始温度预报偏低。对过程结束温度预报偏高,导致过程降温幅度预报偏小、强降温过程无法识别。
目前,针对气温变化的中期和延伸期预报主要依赖数值模式,通过上述检验发现,DERF2.0模式对中天山北坡经济带各代表站的中期最低温度预报以及强降温过程预报有较高的预报参考价值,但是对延伸期温度预报参考价值有限。对北疆沿天山各站的预报偏差的季节内变化特点可能是由DERF2.0模式的系统误差导致,站点之间的差异可能和DERF2.0模式对于天山北坡一带的地形、海拔等差异描述能力不足密切相关,偏差分布也可能和插值方法有一定关系。今后一方面需要在更加丰富的资料基础上,全面评估DERF2.0对秋季延伸期强降温过程预报能力,另一方面,需要拓展思路,在多种要素资料的基础上进行更广泛探索,积极展开强降温过程预报方法研究,如根据动力模式的中期以及延伸期环流场预报结果,开展统计降尺度方面的方法研究,尝试提高秋季强降温过程预报能力。