姚 飛,杨秀芹,刘慕嘉,张余庆
(1.南京信息工程大学水文与水资源工程学院,南京 210044;2.淮阴师范学院城市与环境学院,江苏 淮安 223300)
准确的降水信息对气候变化研究、水文模拟预测、灾害风险管理和农业生产至关重要,随着全球气候变暖,极端降水事件被越来越多的学者关注。目前,降水的直接观测方式为雨量站网观测,但无法反映降水的连续空间分布;间接观测方式为天气雷达估测和气象卫星反演,但天气雷达分布范围有限且造价高昂,卫星反演降水由于受反演算法、传感器性能等限制,存在输出的降水数据精度有限等弊端。利用数据同化方式把各种观测降水与短期数值天气预报产品融合集成,得到再分析降水数据集,ERA5是欧洲中期天气预报中心(The European Centre for Medium-Range Weather Forecasts, ECMWF)发布的第五代全球气候再分析数据集。
已有学者比较了不同再分析降水产品的性能。Sun等总结了全球30个降水数据集的基本特征,分析发现,不同降水数据估计值的大小和变化都存在较大差异,再分析比其他类型的数据集有更大的可变性;Colorado-Ruiz等利用地面观测降水数据,评估ERA5、ERA-Interim及CFSR等再分析数据在美国南部和墨西哥地区对极端和非极端降水指标的模拟性能,ERA5表现出明显优于其他再分析降水产品的性能;王彧蓉等从时间和空间上对ERA5和CFSR在长江中下游地区的适用性进行对比评估,在空间分布特征上,ERA5比CFSR的表现略差,但从定量综合评估指标来看,ERA5表现优于CFSR;Huang等基于地面观测降水数据对ERA5、ERA-Interim、JRA55、MERRA2、NCEP2等5套再分析产品在塔克拉玛干沙漠的准确性进行误差分析发现,ERA5的性能最优,其次是ERA-Interim;比较ERA5和其他9种基于卫星或再分析产品的日尺度和小时尺度性能表明,ERA5在逐日尺度上表现良好,在伊朗、印度、土耳其、澳大利亚和北美也进行了类似的研究,这些研究普遍认为ERA5能够探测降水事件并重现时空分布,但在大多数情况下高估了降水。
ERA5具有较高的时空分辨率,能够较好模拟出降水的时空分布特征,但在不同地区和不同时间对降水事件的探测能力和对降水量模拟的准确性并不一致。Jiang等基于中国大陆站点观测数据评估ERA5对降水事件的探测能力并对降水量进行误差分析发现,ERA5在不同气候区的表现能力存在显著差异,模拟的降水量也有较大偏差,但对降水事件的探测能力优于其他几种卫星降水产品;刘婷婷等以中国728个站点的日降水数据为参考发现,ERA5降水数据在北温带对日降水事件的识别能力精度最高,夏秋季较冬春季的精度低,海拔>500 m地区的精度低于海拔≤500 m地区的精度,ERA5对暴雨的识别偏差较大且受阈值影响;Xin等基于粤港澳大湾区的高密度站点观测降水发现,ERA5在沿海城市地区旱季表现较好,在山地植被区雨季表现较好,在城镇化水平较高的地区模拟能力不足。
长江三角洲是中国经济发展和城市化进程最快的区域之一,近年来该地区的极端降水事件发生频率明显升高,目前ERA5降水资料在该地区对极端降水事件的刻画性能评估较少。本文基于1961—2018年逐日站点实测降水数据,研究ERA5再分析降水数据在月、季和年3个时间尺度上对雨日的探测性能,定量评估ERA5在3个时间尺度上模拟降水量的准确性,最后评估ERA5对极端降水事件的刻画能力。该研究为ERA5在水文模拟预测、城市雨洪管理等方面提供适用性参考,为基于该数据开展相关研究提供准确性评价,也为其他再分析降水产品区域适用性评估提供借鉴。
长江三角洲(27°01′—35°20′N,114°54′—123°08′E)位于我国东部长江下游,包括浙江省、安徽省、江苏省和上海市,总面积约35.8万km。研究区南部和西部海拔较高,中部、东部和北部海拔较低,年降水量受东亚季风气候影响具有高度的空间异质性,沿海地区地势平坦且海拔较低,特别容易受台风和潮汐影响,研究区降水有明显季节差异,降水量和雨日数呈现明显南多北少的空间分布特征。
1.1.1 数据介绍与处理地面气象站观测数据 选取研究区内171个气象站(图1)1961—2018年逐日降水数据作为实测降水序列,数据来源于中国气象数据网(http://data.cma.cn)。站点观测降水为点数据,ERA5降水数据为空间分辨率0.25°×0.25°的栅格数据,若1个栅格内有多个气象站,则取该栅格内所有气象站的平均值作为该栅格的实测降水序列。经统计,171个气象站分布在162个栅格内。
图1 长江三角洲及地面气象站点空间分布
1.1.2 ERA5再分析降水数据 欧洲中期天气预报中心(ECMWF)是由34个国家组成的国际气象组织,在天气预报研究领域处于国际领先地位,ERA5是ECMWF最新的第五代再分析产品。ERA5目前有1950—1978年和1979—现在的逐小时再分析气象数据,下载网站为https://cds.climate.copernicus.eu/。我国地面雨量站点观测降水记录的格式为前1日20:00至当日20:00的累积降水量记作当日降水量,而ERA5日降水量为1 UTC(协调世界时)至翌日的00 UTC之间的累积降水量,00 UTC时刻记录的降水量即为23 UTC~24 UTC的降水量,因此本文在精度评估前将ERA5降水产品与地面雨量站的观测时间进行了一致性校正。本文根据气象站经纬度选取有覆盖站点的栅格降水数据,后文中均简称ERA5。
以站点实测降水数据为基准,分别评估ERA5在月、季和年3个时间尺度对雨日(日降水量≥0.1 mm/day)的探测性能,用命中率(probability of detection, POD)、误报率(false alarm ratio, FAR)和公正先兆评分(equitable threat score, ETS)等3个探测指标评估ERA5对雨日的探测能力。POD代表雨日被ERA5正确探测的概率,FAR代表非雨日被错误地探测为雨日的概率,即“发出错误预警”的情况,ETS是在消除随机命中概率对评分影响后的得分,ETS的取值范围为-1/3~1,ETS≤0表示ERA5不能探测到雨日,ETS>0表示ERA5成功探测到雨日,ETS=1为没有空报和漏报情况下的完美探测。
选取均方根误差(root mean square error, RMSE)、相对误差(relative bias, RB)、相关系数(correlation coefficient, CC)、平均偏差(mean bias, Bias)和平均绝对误差(mean absolute error, MAE)等统计指标定量评估ERA5日降水数据和ERA5对极端降水指标的刻画能力,RMSE表示误差的平均幅度,综合衡量数据准确性,RB表示ERA5高估(RB>0)或低估(RB<0)地面降水的程度,CC反映ERA5与气象站实测降水变化的同步性,Bias可以衡量平均误差大小,MAE可以看出平均误差的等级。统计指标具体定义见表1。
表1 本文选用的统计指标
另外,选取世界气象组织推荐的11个极端降水指标(表2),分析基于ERA5与站点实测降水的极端降水指标的差值、Bias、MAE、RB、CC和RMSE等统计指标,评估ERA5在长江三角洲地区对极端降水事件的刻画能力。
表2 本文选用的极端降水指标
2.1.1 逐月探测性能及统计指标分析 图2~图4为ERA5在长江三角洲1—12月POD、FAR及ETS的时空分布。由图2可知,POD在1—3月介于0.91~0.99,4—6月介于0.84~0.98,此时研究区北部出现全年最小值,在降水量较大和降水事件频发的7,8月POD基本大于0.96,个别格点达100%,即ERA5成功探测到每个雨日;9—12月POD介于0.88~0.99,有不明显先减小后增大的变化趋势。由图3可知,1—12月FAR介于0.16~0.62,在研究区北部有先减小后增大的变化趋势,南部有先增大后减小的变化趋势。7—9月FAR较高且南北差异较小,特别是8月FAR基本大于0.50,其他月份南部误报情况少于北部。由图4可知,1—12月ETS介于0.07~0.67,均值为0.41,说明ERA5对雨日的探测是有效的。ETS在1—5,10—12月基本大于0.4,南部略高于北部,6—9月基本小于0.3,没有南北差异,特别是7,8月大多格点的ETS小于0.25,为全年最小值。ETS的分布特征综合反映POD、FAR的时空分布关系,ERA5有较高的命中率,但在部分区域、部分月份也有较高的误报率。
图2 ERA5再分析降水数据在长江三角洲逐月的命中率(POD)
图3 ERA5再分析降水数据在长江三角洲逐月的误报率(FAR)
图4 ERA5再分析降水数据在长江三角洲逐月的公正先兆评分(ETS)
图5~图7为ERA5在长江三角洲1—12月RMSE、RB和CC的时空分布。由图5可知,各月RMSE介于1.09~22.10 mm/d,RMSE具有雨季高于旱季的特点,1—3,10—12月RMSE均较小(1.14~11.25 mm/d)且具有南高北低的空间分布特征,7—9月RMSE较大且表现出北高南低的空间分布特征。由图6可知,ERA5以高估降水24.52%~33.92%为主。除6月外,其他各月在研究区西南部均有少数格点被低估。RB在1—6,12月等降水较少的月份较大,其他降水较多的月份较小,说明ERA5在降水多时准确性较高,采用ERA5研究雨季的降水准确性相对较好。由图7可知,1—12月CC介于0.44~0.92,1—3,10—12月较大(0.85~0.92),4—9月先减小后增大,最小值出现在7,8月(0.44~0.47),可能是汛期降水量大、降水情况复杂导致降水模拟难度增加所致。
图5 ERA5再分析降水数据在长江三角洲逐月的均方根误差(RMSE)
图6 ERA5再分析降水数据在长江三角洲逐月的相对误差(RB)
图7 ERA5再分析降水数据在长江三角洲逐月的相关系数(CC)
2.1.2 逐季探测性能及统计指标分析 从图8可以看出,POD在季节尺度上表现出优异性能(0.89~0.99),从高到低依次为夏季、冬季、春季、秋季,区域平均依次为0.97,0.95,0.94,0.94,春季和秋季南部略高于北部,夏季和冬季南北差异较小,表现最好的夏季POD介于0.89~0.99,均值为0.97;FAR介于0.18~0.54,在春季、冬季明显呈北高南低、中间过渡的分布特点;夏季、秋季约为0.45,南北差异不明显;ETS(0.09~0.61)在整个区域都是有效的,但在夏季表现较差,分布在0.09~0.42,均值只有0.24,冬季表现最好,均值为0.52,春季和秋季均值分别为0.47和0.43。从图9可以看出,RMSE介于1.45~16.78 mm/d,均值从大到小依次为夏季13.33 mm/d,秋季6.19 mm/d,春季6.12 mm/d,冬季2.49 mm/d,RMSE在夏季北高南低,其他3个季节均为北部略低于南部;ERA5在超过1/2的格点高估降水22.23%~29.13%,每个季节均有个别格点被低估,RB空间分布差异不大,春季、夏季北边较南边略小,秋季、冬季没有明显的南北差异;CC冬季的相关性最好,多数格点介于0.83~0.86,春季、秋季次之,多为0.71~0.75,夏季多为0.58~0.62。
图8 ERA5再分析降水数据在长江三角洲各个季度的POD、FAR、ETS
图9 ERA5再分析降水数据在长江三角洲各个季度的RMSE、RB、CC
2.1.3 年尺度探测性能及统计指标分析 从图10可以看出,多年平均POD介于0.93~0.98,呈南高北低、中间过渡的空间分布特征;FAR介于0.24~0.48,呈现南低北高、中间过渡的空间分布特征。ETS介于0.35~0.48,其中介于0.39~0.42的较多,空间分布有不明显的南高北低的特征。RMSE介于6.89~10.45 mm/d,除了研究区西南和东南部的部分格点均方根误差偏大以外,其余部分的RMSE介于7.37~8.33 mm/d。ERA5在大部分地区高估了降水,RB分布在-8.84%~42.46%,在11.16%~21.16%的格点最多,江苏省和安徽省的RB基本都在该区间内,RB>30%的格点只有4个,均在浙江省境内,存在略微低估的格点有7个,分布在安徽省西南部和浙江省东南部,为-8.84%~-0.18%。CC分布在0.61~0.72,较高的格点位于安徽省与浙江省的交界处。
图10 ERA5再分析降水数据在长江三角洲年尺度表现
2.2.1 区域平均极端降水指标的差值趋势分析 图11为基于ERA5与站点实测降水计算的极端降水指标区域平均值的差值变化趋势,>0表示高估,<0表示低估。PRCPTOT整体上被高估,差值随时间呈减少趋势,2006年之前,差值介于130.09~294.09 mm,2006年之后,PRCPTOT被高估的程度明显减小,准确性明显提高,差值多在0 mm附近波动(图11a)。RX1d普遍被低估,并且低估值越来越大,年际波动幅度也比较大,最大低估值39.84 mm出现在2018年(图11b)。RX5d从高估变为低估,高估最多为1982年的39.28 mm,2005年之后低估得比较明显,最低值出现在2007年(40.39 mm)(图11c)。R95P在2007年之前都是被高估,在2.38~151.33 mm变化,最大值出现在1983年,2005年之后在0 mm附近波动,最大低估值51.43 mm出现在2018年(图11d)。R99P在2005年之前基本被高估,最大值54.95 mm出现在1964年,在2005年之后以低估为主,最大低估值38.19 mm出现在2018年(图11e)。
SDII一直被低估,并且低估量随时间变化越来越大,最小值1.90 mm出现在1982年,最大值4.51 mm出现在2007年(图11f)。CDD一直被低估,但有逐年减小的趋势,最大值19.07天出现在1977年,在1980年以前年际变化较大,1980年以后稳定在0~11天,2009年、2015年表现较好,分别低估1.09,1.00天(图11g)。CWD一直被高估,年际变化范围较小,最大值和最小值分别出现在1973年(7.60天)和1966年(7.35天)(图11h)。R10在2018年(低估0.60天)以前一直被高估,最大值15.88天出现在1977年,高估值随时间呈减少趋势,2000年以后明显减少(图11i)。R20表现比较好,在2002年之前基本为高估,最大值5.96天出现在1983年,从2003年开始低估,最大值4.48天出现在2018年(图11j)。R25的变化趋势和R20相似,差值变化范围更小,最大值和最小值出现在1983年和2018年,分别高估3.88天和低估4.27天(图11k)。
图11 基于ERA5再分析降水数据及地面实测降水数据计算的区域平均极端降水指标的差值多年变化趋势
综上所述,PRCPTOT、RX5d、R95P、R99P、R20和R25表现出先高估后低估的趋势,RX1d、SDII、CDD 3个指标则一直被低估,CWD和R10 2个指标持续被高估。
2.2.2 极端降水指标及其差值的空间分布特征 ERA5与站点实测的多年平均PRCPTOT均具有南多北少、均匀过渡的空间分布特征(图12a1、图12a2),大部分区域的年降水总量为1 000~1 500 mm;由图12a3可知,ERA5在大部分区域高估约111.66~243.66 mm,北部高估少,南部高估多,最高的格点高估520.12 mm,安徽省和浙江省的部分格点被低估,最大低估量为152.34 mm。
站点实测的多年平均RX1d为78.61~146.54 mm,最小值位于上海市和浙江省的中部地区,最大值发生在浙江省的沿海地区(图12b1);ERA5的多年平均RX1d空间分布差异不明显(图12b2),两者有较一致的南多北少的空间分布特征,该指标多被低估,大部分区域低估5.62~24.22 mm,江苏省北部低估值达55.22 mm(图12b3)。站点实测和ERA5的RX5d均有南高北低的特点,大部分区域被低估5.00~26.00mm,仅在南部地区存在被高估的栅格(图12c1~图12c3)。ERA5的R95P和R99P均有南高北低的分布特征,但存在较明显的高估,大部分区域的R95P高估30.68~74.66 mm,R99P高估7.43~20.65 mm(图12d1~图12e3)。站点实测和ERA5的SDII最大值分别为12.51,9.61 mm,最小值分别为8.76,6.13 mm,两者空间分布无明显差异,有明显的低估,特别是在江苏省北部,最大值为5.21 mm/d(图12f1~图12f3)。两者计算的CDD均呈南低北高的空间分布特征,整个区域内都存在低估,研究区的西北部有些格点的低估值约为11.90天,其他大部分区域的低估值分布在3~7天(图12g1~图12g3)。两者计算的CWD均呈南部略高北部略低的空间分布,ERA5在整个区域内均高估该指标,大部分地区高估2~5天(图12h1~图12h3)。两者计算的R10、R20、R25均有南高北低的特点,ERA5在大部分区域高估R10在4~6天;高估R20在0~2天,但在部分区域也存在低估;R25的差值主要分布在-1~1天,没有明显的地区差异(图12i1~图12k3)。
图13较图12更清晰地显示ERA5与地面站点实测降水计算的极端降水指标差值在所有格点的表现。ERA5高估PRCPTOT约200 mm,Bias约为70 mm/a,MAE约为50~100 mm/a,RB在10%~20%,在各格点存在较高的相关性,RMSE在100~330 mm/a;RX1d所有格点基本为低估,有较低的Bias、MAE、RMSE,RB在-40%~0,相关系数变化幅度较大;ERA5对RX5d的表现与RX1d相似,RB在-20%~20%,CC在0~0.8,在有些格点相关性较差;对R95P和R99P有高估也有低估,格点之间CC变化幅度较大,R99P的差及Bias、MAE、RMSE均较小,RB在-20%~20%,R95P的表现较R99P差;SDII在所有格点均为低估,RB在-40%~-10%,相关系数变化幅度较小;CDD在所有格点均为低估,有较低的Bias、RB、MAE及RMSE,相关系数较高;CWD在所有格点均为高估,CWD有较高的RB、较低的相关系数;R10在大部分格点高估,Bias在6~8天,有较高的相关系数;R20、R25在研究区既有高估也有低估,有较小的Bias、RB、MAE、RMSE及较高的CC,且各指标变化幅度不大。
图12 基于站点实测降水和ERA5再分析降水计算的极端降水指标多年均值及其差值空间分布
图13 1961-2018年ERA5再分析极端降水指标的统计指标箱体图
分析表明,ERA5可以重现月、季和年降水过程,有较高的POD和ETS,FAR较低,高估降水量约15.75%等特点,这与现有的研究结果基本一致。由表3可知,ERA5日降水量≥0.1 mm的日数比站点实测多17.68%,使得FAR较大,ETS较小,这种情况在降水事件频发和降水量大的夏季较明显,特别是7,8月;ERA5日降水量介于0.1~1 mm的天数比站点实测多7.66%,这说明ERA5中“假毛毛雨”较多,这些“假毛毛雨”对ERA5的探测性能影响较大,对降水量的准确性影响较小;ERA5日降水量≥1 mm的日数比站点实测多10.02%,介于1~10 mm的天数比站点实测多7.90%,多出的这部分小雨日数,不仅使FAR增大,而且导致ERA5降水总量偏大,也可能导致SDII和CDD被低估、CWD被高估;ERA5日降水量>10 mm和>20 mm的日数比站点实测分别多2.16%和0.28%,日降水量>25 mm的日数比站点实测值小0.02%,这说明随着降水强度的增大,ERA5对日降水过程的重现能力越来越强,对大雨和暴雨的重现性能优异。这些现象可能与ERA5过度补偿ERA-Interim在湿润地区偏干旱问题有关,ERA5等再分析产品刻画旱季锋面降水能力比模拟雨季短时对流降水能力强的特点可以解释上述旱季模拟效果优于雨季的现象。
表3 长江三角洲地区1961—2018年162个格点中不同降水强度的日数频率 单位:%
长江三角洲地区在研究时段内经历城镇化高速发展阶段,有研究发现,在城市化水平越高的地区模拟难度越大,但研究区内年降水总量在2000年以后准确性提高很多(图11a),也没有表现出城镇化带来的空间异质性(图12a1~图12a3)。ERA5的性能在研究区内有明显的南北差异,POD、FAR和ETS均在南部表现较好,这种空间异质性在旱季表现得比雨季显著。ERA5的性能在研究区内受地形地貌和海陆相对位置的影响较小。用栅格内站点实测降水量代表相应栅格的实测降水量存在一定的不准确性,特别是在栅格内气象站点比较少的情况下明显影响评价结果。
(1)ERA5对雨日的探测能力为POD和ETS较高,FAR较低。在降水事件频发的夏季和秋季POD最大,特别是7,8月的POD基本大于0.95,且没有南北差异,7,8月的FAR也维持在较高的0.28~0.58,导致7,8月的ETS明显小于其他月份。春季和冬季的POD略低于夏季和秋季,ETS略高于夏季和秋季,但误报率的最大值出现在1,2,3月的江苏省北部。年尺度的探测性指标优于月尺度和季尺度,数值较高且分布范围较小。
(2)日降水量的误差为RMSE在月尺度的绝大部分格点约为4 mm/d,在1—3,10—12月较低,4—9月有先增大后减小的变化趋势,最大值出现在6—8月,在季节尺度上则是秋季和冬季较小,春季和夏季较大;区域多年平均RB为15.75%,没有明显的时空分布变化趋势;ERA5在月、季、年尺度均表现出较好的线性相关性。
(3)ERA5对极端降水事件的刻画能力为PRCPTOT、RX5d、R95P、R99P、R20和R25 6个指标随着时间变化表现出先高估后低估的趋势,其中强度指标南部比北部高估得多,频率指标则是北部比南部高估得多;RX1d、SDII、CDD 3个指标一直被低估,北部比南部低估得多;CWD和R10 2个指标持续被高估,并没有明显的南北差异。