尹 姗,马 杰,张恒德,李 勇
(1.国家气象中心,北京100081;2.中国气象局一河海大学水文气象研究联合实验室,北京 100081)
延伸期天气预报的时效为10~30 d,介于中短期天气预报和短期气候预测之间,其可预报性主要来源于热带季节内振荡(MJO)、雪盖、平流层—对流层相互作用等,当前在科研和预报业务实践中难度均较大[1]。随着数值天气预报技术的迅猛发展,世界气象组织(WMO)先后推出了TIGGE 和次季节—季节(S2S)试验数据集,为无缝隙预报提供了有利支撑。当前,已有研究对延伸期时效的预报技巧进行检验评估,如Buizza 和Leutbecher[2]研究发现欧洲中期天气预报中心(ECMWF)的次季节预报系统对2~3周的高空位势高度、温度和风场具有预报技巧。Li和Robertson[3]对比3 个不同的预报系统的降水预报后指出,模式在海洋大陆、赤道太平洋和大西洋区域具有较好的预报性能,ECMWF 的次季节预报系统表现最好。诸多国内外学者评估了季风[5]、低温事件[6-7]、地面气象要素预报在欧洲[8]、北美[9]、欧亚大陆[10]等地区的表现。
数值模式产品是延伸期业务预报的重要支撑之一。改进模式的动力预报系统是提升延伸期数值预报的主要手段[11-12],如调整海表面气温、对流参数化等方法可以显著提高模式的预报性能[12-13]。然而,近期研究发现这些方法对模式延伸期预报性能的提升存在局限[14]。与此同时,动力延伸预报误差订正技术的发展为提高延伸期模式预报水平提供了新思路[15]。丑纪范[16]提出将大气相似规律与动力模式相结合的相似—动力方法。多位学者在此基础上发展了多种相似误差订正方法和基于可预报分量的相似—动力方法,对改进数值模式延伸期预报效果显著[17-20]。此外,一些统计后处理订正方法,例如模式输出统计(MOS)[21-22]、卡尔曼滤波[23]、滑动平均[24-25]、距平积分预报订正[26]、相似订正[27-28]、贝叶斯模型平均[29-30]、分位值映射等方法[31-32],也在一定程度上提高了模式的延伸期预报性能。使用多年的模式回算数据能有效订正第二周模式预报温度的系统偏差[23,33-35]。Guan 等[9]在回算数据基础上使用历史偏差订正方法有效地提高了模式对北美延伸期逐周温度预报的准确性,我国也有研究发现该方法能较好地订正我国第二周平均温度的预报误差[25]。那么,其对第16~30 天的预报订正效果如何?为此,本文一方面将基于20 a 回算数据,分析公认预报效果较好的ECMWF 全球模式第16~30 天日最高气温预报在我国的预报误差时空分布;另一方面探索历史偏差订正方法在业务预报中的订正效果,以期为预报员了解模式预报性能、提高预报准确率提供参考。
ECMWF 的业务预报系统通常1 a 左右更新一次[8],本文关注的是该模式2018 年6 月6 日—2019年6 月11 日运行的CY45r1 版本。分析了这期间的ECMWF 模式次季节再预报和实时业务预报366~720 h 预报时效过去6 h 的最高气温。使用的模式再预报和业务预报数据的时空分辨率均为6 h 和0.5°。模式再预报包含11 个预报成员,涵盖10°~60°N,70°~144°E 范围,实时业务预报包含51 个预报成员,涵盖10°~70°N,70°~180°E。台站观测资料使用的中国国家级地面气象站基本气象要素日值数据集中的2 373 个站点日最高气温观测数据。
取一日4 次的过去6 h 最高气温预报的最大值为日最高气温预报。采用双线性插值方法将格点数据插值到站点上对集合平均的预报误差进行估计,暂不考虑格点与站点地形高度的差异。对预报的订正采用历史偏差订正方法,在业务预报集合平均值基础上减去上述基于模式20 a 回算的集合预报的误差估计,得到订正后的气温预报。
文中选用均方根误差RMSE、平均绝对误差MAE、系统偏差SB 和预报准确率TTk对预报产品质量进行检验评估:
其中,Tm和To分别为模式预报气温和实况观测值,Nri和Nfi分别是预报正确的站数和预报的总站数,气温预报绝对误差≤2 ℃即为预报正确。
从1998 年6 月—2018 年6 月全国平均的ECMWF 模式日最高气温预报的均方根误差和平均绝对误差来看,在第16~30 天,均方根误差为4.6~4.9 ℃,第16 天的最高气温均方根误差最小,随着时效的延长该指标呈波动性增大。平均绝对误差和均方根误差的变化基本一致,其数值为3.8~4.0 ℃。就系统偏差而言,日最高气温预报较实况偏低,其中第16 天的预报偏低幅度最少,偏低约1.1 ℃。预报时效越长,系统误差值越小,至第30 天预报较实况偏低约1.39 ℃。整体而言,ECMWF 模式对第16~30 天的延伸期日最高气温预报与实况相差较大,预报以偏低为主。
考查模式预报误差在不同地区的差异发现,我国中东部地区的日最高气温预报均方根误差小于西部地区(图1)。以105°E 为界分别统计我国中东部地区和西部地区的第16 天日最高气温预报的均方根误差可知,中东部地区的均值为4.3 ℃,西部地区的均值为6.2 ℃,模式在我国中东部地区的预报性能优于西部地区。其中,在黄淮东部、江淮东部、四川盆地等地的均方根误差比其他地区小(在夏季和秋季低于4 ℃),预报性能相对较好。在新疆东部和南疆盆地、青海西部、西藏东部和南部及川西高原北部,第16 日的均方根误差超过10 ℃,模式预报能力很差。对比不同季节的均方根误差分布发现,在我国大部地区ECMWF 模式夏季的预报效果最好,其次是秋季,春季和冬季的预报误差较大。第17~30 天的均方根误差分布与第16 天类似。
分析模式预报的系统偏差(图2)可知,模式对中国大部地区日最高气温第16~30 天的预报较实况偏低。在黄淮、江淮、江南和华南等地的部分地区,模式预报的系统偏差在正负2 ℃以内,但在此外的大部地区,日最高气温预报明显偏低。模式在西部地区的系统偏差相对较大,特别是在高海拔地区,模式预报比实况低6 ℃以上。对比不同季节,春季和秋季模式预报的系统偏差在全国基本均是负值,但在夏季,在黄淮中部、内蒙古西部、新疆北部和南疆盆地的部分地区,预报较实况可能偏高。冬季,在新疆北部、内蒙古中部和东北部、黑龙江西部出现了较大范围的预报比实况偏高的情况,其中,在新疆沿天山一带及内蒙古东北部系统偏差较大,可达3~5 ℃。
将20 a 日最高气温观测值从0~40 ℃按每5 ℃分段,统计对应气温区间的模式预报系统偏差发现,模式对不同温度阈值的日最高气温的预报误差存在较大差异。以第16 天的预报为例,当日最高气温实况低于0 ℃时,模式的预报较实况偏高,偏高均值约为1.39 ℃。当日最高气温≥0 ℃时,模式预报较实况偏低。日最高气温越高,模式预报与实况温度的差异越大。当日最高气温低于25 ℃时,模式的系统偏差绝对值均≤2 ℃。当日最高气温高于25 ℃后,随着气温的升高,模式预报较实况温度偏低的幅度迅速增大,到35 ℃以后系统偏差绝对值可达6 ℃以上。对于延伸期更长的预报时效,上述系统偏差变化特征仍存在。由此可见,模式在延伸期时效对较高的日最高气温的预报能力相对较低温度有明显的不足,参考模式预报结果时应予以关注并适当向高值方向调整。
图1 ECMWF 模式第16 d 日最高气温预报的均方根误差空间分布
图2 ECMWF 模式第16 天日最高气温预报的系统偏差空间分布
就中国整体而言(图3),日最高气温预报的系统偏差均为负值,预报较实况整体偏低。在不同预报时效,系统偏差略有不同,大部分时段内较短预报时效的系统偏差较小。在1 月上旬、5 月中下旬至8 月,及10 月下旬—12 月的大部分预报时效内,模式的逐日最高气温系统偏差>-2 ℃,相对于其他时段预报效果较好。在3—4 月和10 月中上旬,系统偏差较小,提示上述时段的模式预报性能较差。这可能与该时段冷空活动不定、温度变化较大有一定联系。
图3 ECMWF 模式延伸期日最高气温预报在中国的系统偏差随时间的变化
根据ECMWF 模式20 a 的回算资料估算的日最高气温预报偏差,运用历史偏差订正方法对2018年6 月—2019 年6 月的模式业务预报进行订正。检验发现,订正后的第16~30 天的均方根误差均小于模式原始预报,订正预报的均方根误差降低至4.33~4.57 ℃(图4a),相对于原始预报减少了6.3%~8.7%,体现出一定的订正效果。不同预报时效预报的均方根误差差异较小,并没有随时效延长误差明显增大,模式在延伸期预报时段的预报误差可能达到了饱和。在系统偏差方面,模式对日最高气温的原始预报较实况偏低明显。订正后系统偏差由负转正,模式预报较实况偏高1 ℃左右(图4b)。
订正前,模式原始预报的准确率为31.2%~32.8%(图4c),其中第16 天的预报准确率最高,随着预报时效的延长准确率基本上逐渐递减。模式订正预报的准确率增长了4.9%~6.0%,和原始预报相比,准确率提升了15.2%~19.2%。一方面说明历史偏差订正方法对第16 天及以后的延伸期逐日最高气温预报有一定的订正效果,另一方面也能看到经过这种统计后处理后,订正预报的效果仍有局限。
从空间分布来看(图5),日最高气温预报的均方根误差订正最显著的区域在我国西部高海拔地区,部分地区的均方根误差从订正前的8 ℃以上降至2~3 ℃,在上述地区模式预报的温度较实况明显偏低的现象也得到改善。在模式原始预报较实况偏低2~3 ℃的区域,如内蒙古东北部、东北地区东部和华南东部沿海等,订正预报的系统偏差为0~2 ℃,有一定的订正效果。订正后,我国新疆、青海、甘肃河西及广西等地的部分地区的系统偏差偏大。
图4 2018 年6 月7 日—2019 年6 月10 日订正前后全国全年平均的日最高气温预报的均方根误差(a)、系统偏差(b)和预报准确率(c)
图5 2018 年6 月7 日—2019 年6 月10 日订正前后第16 天日最高气温预报的均方根误差(a,b)和系统偏差(c,d)的空间分布
2018 年7 月17—26 日我国黄淮及其以南大部地区出现了持续性的高温天气。7 月20 日是这次过程中高温范围最广的一天,当日新疆南疆盆地、内蒙古西部和东南部、华北东南部、黄淮大部、江汉、江南大部、华南北部、西南地区东部等地的部分地区日最高气温达35~37 ℃,局地超过37 ℃。本文以该日为例考查ECMWF 模式延伸期预报对日最高气温的预报能力(图6)。除南疆盆地以外,模式的原始预报显示全国大部的日最高温均低于35 ℃,在我国大部预报均较实况偏低2~7 ℃,在青藏高原东部和北部的部分地区更偏低8 ℃以上。模式预报在陕西北部、内蒙古大部和黑龙江北部等地较实况偏高(图6a)。订正预报虽然仅在河北西南部、江淮、江汉西部、四川盆地东部、江南中部和北部等地预报出35 ℃以上的高温,相比实况高温范围仍偏小,但已给出高温的提示信息。相比原始预报,订正预报在我国中东部大部的预报误差显著减小,体现出较明显的改进。
7 月20 日,模式日最高气温原始预报的误差离散度比较大。当实况最高气温在20~28 ℃时,模式预报误差正负参半,不确定性较大。当站点实况气温低于20 ℃或高于28 ℃时,模式预报大部分以偏低为主,体现出模式对要素高值反映不足的问题(图6c)。通过模式后处理订正,这种离散度能得到明显的调整。但要注意当最高气温高于35 ℃时,订正预报仍明显低于实况。
在S2S 试验中,ECMWF 提供每周2 次的过去20 a 回算预报数据,对数据进行深入分析将有助于提升延伸期时效的预报准确率。本文基于该数据集,估算了ECMWF 模式对我国第16~30 天的日最高气温的预报误差分布特征,并在此基础上对模式预报进行订正。主要结论如下:
(1)在第16~30 天,模式预报的日最高气温均方根误差为4.6~4.9 ℃,其中第16 天的最小,随着时效的延长其略有增长。在我国大部地区,模式预报的日最高气温较实况偏低,系统偏差为-1.39~-1.1 ℃。在西部地区的预报误差最为明显,特别是在青藏高原、川西高原等高海拔地区,均方根误差和系统偏差的绝对值超过了10 ℃。
图6 2018 年7 月20 日模式第16 天的日最高气温预报与实况的对比
(2)当日最高气温低于25 ℃时,模式的系统偏差绝对值≤2 ℃。随着气温的升高,预报较实况温度偏低的幅度迅速增大,当日最高温高于35 ℃后,偏差绝对值可达6 ℃以上。此外,模式在夏季的预报效果最好,在春季的3 月和4 月以及秋季的10 月中上旬,模式的误差最明显。
(3)历史偏差订正方法对模式误差有一定的订正效果。相比模式原始预报,订正预报的均方根误差减少了6.3%~8.7%,准确率提升了15.2%~19.2%。
(4)2018 年7 月的一次高温过程的检验分析表明,模式预报明显低估了中东部大范围的高温强度,预报误差离散度较大。订正后的预报有一定的调整,但依然存在对超过35 ℃的最高气温低估的问题。
本工作选取的历史偏差订正方法主要聚焦系统平均态的订正,若从要素概率分布或其他角度进行调整,或许能做出更准确的预报,这还有待进一步探讨。在未来的工作中选取多种订正方法深入对比分析。本文针对站点预报采用了双线形插值方法,该方法没有阶跃效应,具有较高的精度[37],但同时也存在未考虑模式格点和观测站点的海拔差异的局限,可能会给评估结果带来一定误差。