孙 桂 凯,魏 义 熊,王 国 帅,石 锐,莫 崇 勋
(1.广西大学 土木建筑工程学院,广西 南宁 530004; 2.广西大学 工程防灾与结构安全教育部重点实验室,广西 南宁 530004; 3.广西壮族自治区水安全与智慧调控工程研究中心,广西 南宁 530004)
降水是重要的气象水文要素之一,也是造成区域水土流失和干旱内涝的关键因素,如何快速获取大尺度精细化的地表降水信息对气象预报、水土保持研究和洪涝灾害监测等工作至关重要[1-2]。目前已建成的雨量站和气象站虽然可以提供直接准确的点降水信息,但站点的布设常受到地形、经济发展等因素的影响,以致站点密集程度较低无法精确地反映降水的时空异质性。气象雷达所发射的估计降水信号易受地形环境和高大建筑物的影响,所获取的降水数据虽然时空连续性较好,但探测范围会受到很大的限制[3]。随着卫星反演降水技术的出现使得获取大范围高时空分辨率的降水资料成为可能,对降水资料匮乏或无降水资料地区的水文气候研究具有重要意义[4]。
热带降水计划TRMM(Tropic Rainfall Measurements Mission)由美国NASA(National Aeronautics and Space Administration)和日本JAXA(Japan Aerospace Exploration Agency)合作研发,其发布的TRMM降水分析数据集已被广泛应用于低纬度热带及亚热带地区大气分析、气候变化和水文循环等研究领域[5-7]。作为TRMM后新一代全球降水数据集,全球降水计划GPM(Global Precipitation Measurement Mission)将卫星探测范围拓展至南北纬60°之间,提高了对中高纬度地区微量降水(<0.05 mm/h)和固态降水的探测能力[8]。IMERG(Integrated Multi-satellite Retrievals for GPM)作为GPM时代主流降水数据集之一,拥有更高的时空分辨率(0.1°/0.5 h),可提供3种不同观测时段的降水数据集,分别为近实时的Early-Run和Late-Run及延时的Final-Run(简称IMERG-E、IMERG-L、IMERG-F),其中IMERG-F经过站点降水数据校正,是精度较为理想的高时空分辨率降水数据集[9]。但目前已发布的卫星遥感反演降水数据集均存在普遍的高估或低估的问题和误差不确定性,因此在将卫星遥感反演降水数据集应用于干旱评估、水资源管理和水文循环分析等研究前,还需做多方面的精度评估和误差分析[10-11],但目前国内外关于IMERG 降水数据集精度评估和误差分析的研究均存在数据时间序列较短的问题,此外对于近实时的IMERG-E和IMERG-L的区域精度评估及流域水文效用研究仍开展较少。
广西地区地处亚热带季风区,少部分位于临海热带地区,年降水量丰沛,但受地形等因素影响,降水量时空分布极为不均,区内地形多由丘陵盆地、喀斯特地貌的石山和洼地等组成,降水与产汇流关系非常复杂,使得洪涝、干旱和极端降水等极端自然灾害频发[12-13]。因此如何将卫星遥感降水数据作为对广西地区地面站点降水数据的补充,对区域防灾减灾起到重要作用。鉴于此,前人已做过一些卫星降水数据在广西地区的应用研究,但以往广西地区研究大多针对TRMM降水数据[14-15],针对最新一代IMERG降水数据集在广西地区的精度评估和误差分析的研究尚不全面。因此,本文选取2014年4月至2019年12月时间段内广西地区IMERG降水数据,采用7个连续与分类统计指数进行多尺度精度评估,以验证其在广西地区的可靠性和适用性。研究成果可为后续开展IMERG降水数据校正、融合和降尺度等研究提供参考依据,亦可为IMERG降水数据应用于广西地区水资源管理、水文模拟和水文分析等研究领域提供参考。
广西地处中国南部区域,全区陆地面积达23.66万km2,是中国与东南亚经济交往的中心(见图1)。区内水系发达,水资源储量丰富。多年年平均气温在16.5~23.1 ℃。广西是中国降水量最丰沛的地区之一,各地年降水量均在1 070 mm以上,但由于受夏、冬季风的交替影响,广西年降水量年内分布不均,其中4~9月为雨季,10月至次年3月为旱季,降水量具有东部地区多、西部地区少、丘陵山区多而河谷平原地区少的特点。
图1 研究区位置及地面站点分布Fig.1 Location of the study area and the distribution of ground stations
研究使用的站点降水数据下载自中国气象数据共享网(http:∥data.cma.cn),该数据集提供了2014~2019年广西地区18个地面气象站点实测逐日降水数据,该数据集经后续处理发布,数据准确度和可靠性高,可将其作为对比参考数据去探究IMERG降水数据在广西地区的适用性。
研究采用的3种GPM IMERG卫星降水数据集免费下载自美国宇航局NASA官网(https:∥disc.gsfc.nasa.gov/),所用数据均为最新版本V06的3级降水数据集,由于IMERG降水数据与地面实测数据间存在观测时间差异,因此以站点降水数据为基准,将逐0.5 h的IMERG降水数据按UTC+8 h转换为北京时间,采用双线性插值法插值到站点上,并在时间尺度上进行累加为逐日、逐月,使用站点降水数据值与对应格点降水值进行计算并分析。
选取3种连续统计指数:相关系数(Correlation Coeffient,CC),用于评估IMERG降水数据与站点降水数据的相关性;均方根误差(Root Mean Square Error,RMSE),用于评估IMERG降水数据与站点降水数据之间离散程度,可反映出IMERG降水数据产品整体误差水平和精度;相对偏差(Relative Bias,RB),用于评估IMERG降水数据与站点降水数据之间误差的水平变化趋势,反映IMERG降水数据高估或低估降水的程度。以往已有研究表明,当卫星降水数据与地面实测数据之间CC较大,RMSE较低且RB接近0时,卫星降水数据精度较高,适用性较好[10]。
分类统计指数可量化卫星降水数据对真实降水事件的探测能力以及对不同等级强度降水事件的辨识能力[16]。为排除微量降水的影响,研究以1 mm/d作为是否发生降水事件的阈值。选取降水命中率(Probabilty of Detection,POD)、误报率(Fulse Alarm Ration,FAR)、频率偏差BIAS和公平预兆评分(Equitable Threat Score,ETS) 4个分类统计指数进行量化分析。POD表示卫星对降水事件的探测准确率,值越接近1,探测准确率越高;FAR表示卫星对降水事件的误报率,最优化值是1;BIAS是卫星探测的有降水事件总次数与观测实际总降水事件次数的比值,BIAS>1说明卫星高估总降水事件次数,相反则低估总降水事件次数,最优值是1表示不存在低估;ETS能综合衡量卫星对降水事件的识别能力,对卫星降水数据质量水平判断更加公平,值越接近最优值1,卫星降水数据质量水平越高。选取的7种评价指标计算公式如下:
(1)
(2)
(3)
(4)
(5)
(6)
(7)
图2给出了广西地区多年平均日降水量空间分布。通过对比分析发现:广西地区降水高值区主要集中在广西南部临海区域和桂林市、柳州市北部等区域,广西中部地区、百色市和河池市西部等区域日均降水量则相对减少。由于暖湿气流与冷空气常在桂北地区交汇,致使暴雨集中在桂北地区发生,而广西南部濒临沿海,受海陆季风和大气环流的影响,水汽充足,使得降水丰沛;而广西西北部等毗邻云贵高原东南边缘,日均降水量有一定程度的下降。由图2(b)~(d)可知,IMERG系列降水数据均能较好地表现出降水的空间分布特征,相比较而言,校正产品空间分布优于未校正产品。其中IMERG-F表现最好,表明IMERG-F在广西地区的校正效果明显,而IMERG-E和IMERG-L相对较差,特别是在桂东、玉林和梧州市等地存在明显的高估降水现象。
图2 2014年4月至2019年12月广西地区平均日降水量空间分布Fig.2 Spatial distribution of daily-averaged precipitation ranging from April 2014 to December 2019 in Guangxi Province
为综合分析3种IMERG系列降水数据在整个区域上的精度,将广西地区18个站点降水数据与对应的IMERG降水数据纳入同一序列,在日、月两个不同时间尺度上对3种IMERG降水数据表现进行对比分析,结果如图3所示。在日和月尺度上,3种IMERG降水数据均存在高估降水现象,由日尺度到月尺度,散点的聚合程度明显改善,IMERG降水数据与地面站点相关性变高,但均方根误差RMSE累积较大,同时IMERG-F降水数据总体表现优于近实时的两种IMERG降水数据。
由图3(a)~(c)可知:日尺度上,IMERG-E、IMERG-L与站点降水数据的CC分别为0.49,0.50,散点聚合度较为相似,而IMERG-F的CC为0.54,表明站点校正在一定程度上提升了两者之间相关性。CC只能反映数据之间的一致性,无法反映整体数据精度变化,因此需对另外评价指数进行分析。IMERG-E、IMERG-L和IMERG-F的RB分别为1.53%,1.33%和3.00%,说明3种降水都存在一定程度上高估实际降水的现象;3种IMERG降水数据的RMSE较为接近,分别为14.42,14.54 mm和13.31 mm。
综上分析,日尺度上,校正效果并不明显,反而加重了IMERG降水数据高估降水的程度,原因可能是地面站点实际降水值与覆盖格网降水值之间存在时空差异和现行的校正算法均是基于月尺度进行造成的。
如图3(d)~(f)所示,月尺度上,IMERG-E和IMERG-L的CC均为0.80,IMERG-F的CC达到0.91,与站点降水数据相关性呈高度相关。IMERG-E和IMERG-L降水数据的RMSE分别为85.86 mm和85.85 mm,表明近实时IMERG降水数据具有较大的误差不确定性;IMERG-F的RMSE为55.78 mm,相对于近实时两种IMERG降水数据降低幅度均大于30 mm,说明站点降水数据校正对广西地区IMERG降水数据的误差有一定程度的改善,但也存在误差随时间尺度增加具有累积效应的现象。3种IMERG降水数据RB为1.52%,1.31%和2.93%,依旧存在一定程度的高估现象,但较日尺度而言略微下降。综合分析,随着时间尺度增加,3种IMERG降水数据表现均有所提升,其中IMERG-F月降水数据的表现最好,可以看出站点降水数据校正是提高卫星降水数据精度的有效方式之一。
图3 IMERG-E、IMERG-L、IMERG-F与站点降水量对比散点密度分布Fig.3 Scatter density distribution of IMERG-E,IMERG-L,IMERG-F satellite precipitation and station precipitation
单独分析广西地区不同季节3种IMERG降水数据的精度,结果如图4所示。整体来看,3种 IMERG 季节平均降水量在秋季的一致性程度要高于其他季节(CC分别为0.76,0.78和 0.81);RMSE分别为5.01,4.88 mm和4.81 mm,误差较小;RB则分别为-23.92%,-20.71%和3.02%;由此可看出IMERG-E和IMERG-L对秋季的降水量低估较为严重,但从IMERG-F可以看出,偏差校正效果较为明显。春、夏季3种IMERG降水数据的CC则有所减小,但均高于0.6;IMERG-L在春季的RMSE增大到 12.47 mm/d,大于IMERG-E和IMERG-F(分别为6.71,5.41 mm/d),误差较大;RB分别为12.99%,3.46%和0.19%;夏季IMERG-F的RB为4.27%,高于IMERG-E和IMERG-F(分别为2.73%和0.42%),表明在夏季的站点校正反而增大了降水量偏差。3种IMERG降水数据在冬季精度相对最差,其中IMERG-E和IMERG-L的CC均小于0.6,对降水的高估程度较为严重(RB分别为22.07%和27.32%),IMERG-F的CC为0.68,RB减小到3.18%,RMSE为4.20 mm,IMERG-F在春季有一定的适用性。
图4 IMERG-E、IMERG-L、IMERG-F与站点季节平均降水量对比散点密度分布Fig.4 Scatter density distribution of seasonal mean precipitation of IMERG-E,IMERG-L,IMERG-F and the stations
综上,IMERG-F在4个季节里均表现最优,可作为研究广西地区水资源管理和水文气象规律基础数据的补充,考虑到实时性方面,IMERG-E和IMERG-L同样在近实时洪水预报和洪涝灾害预测等方面也具有很大的应用潜力。
图5给出了日尺度IMERG系列卫星日降水数据相对于地面观测数据的各误差评估指数空间分布,由图5(a)可知,IMERG-E和IMERG-L对广西大部分地区降水存在明显的高估现象,RB主要在0~30%范围内变化,桂东、桂北等大部分地区RB均大于10%,而在桂西南部分地区则存在显著性低估,IMERG-L低估现象相较于IMERG-E有所改善,这可能是IMERG-L增加了传感器数据来源的原因。IMERG-F显著改善了广西地区的相对偏差,但百色中部、南宁南部、防城港北部等部分区域高估降水现象仍然较重。图5(b)显示未校正的两套数据CC空间分布较为相似,地面校正过的IMERG-F表现出了较好的CC,在桂东地区尤为明显,大部分区域CC均超过了0.5。图5(c)可看出,2种未校正的IMERG系列降水数据在整个广西地区均存在较大的RMSE(>9.0 mm/d),尤其是在桂林中部和广西南部临海降水高值区更为明显(>19.0 mm/d),IMERG-F改善了部分地区RMSE,如贺州、来宾中部和柳州东部等区域,但整体改善程度较为有限,尤其是在桂林中部、防城港市和北海市等降水高值区几乎没有改善效果,其原因一方面可能是这些地区相对于其他地区降水量大,降水事件频发;另一方面可用于校正的地面站点较少,导致卫星探测降水能力在这些区域下降。
图5 IMERG-E、IMERG-L和IMERG-F日降水数据误差统计指数空间分布Fig.5 Spatial distributions of statistical indices of IMERG-E、IMERG-L and IMERG-F daily precipitation data
由于研究区站点较少,插值到空间上分析会带来其他方面误差,因此分别计算18个站点的IMERG降水数据评估指数(见表1)。由表1可知,IMERG-E和IMERG-L与站点降水数据之间的CC大于等于0.5的站点均只有8个,而IMERG-F则达到了14个,说明IMERG-F替代站点降水数据的潜力较大。不同站点的CC有很大差异,如那坡、梧州、来宾、钦州等站点CC均较低,近实时的两种IMERG降水数据的CC最低达到0.38,说明这些站点对应的近实时IMERG降水数据与站点降水数据之间的相关性较差。从RB来看,近实时的IMERG-E和IMERG-L的RB相比差距不大,均有12个站点RB大于0,表明在研究区大多数站点对降水的估计表现为高估。IMERG-F的RB显示校正对降水高估和低估现象有一定的改善,但部分站点校正后效果反而更差,表明站点校正的算法仍存在一定的不足。IMERG-F的RMSE在多数站点均有不同程度下降,但大于10 mm的站点仍有17个,说明校正的IMERG-F在广西地区依然存在较大的系统误差。
表1 不同站点的日尺度误差指数
进一步结合站点与误差空间分布分析可知:大部分区域近实时IMERG降水数据相关程度较低、误差较大且存在不同程度的高估或低估现象,校正的IMERG-F精度有一定程度提高但还有提升空间,部分地区精度表现较差,如那坡、靖西和梧州等地,原因可能是那坡、靖西地处桂西南边陲地带,海拔较高,地理位置复杂;梧州、钦州等地易受海陆季风及大气环流的影响。以往研究表明,这些因素均可能对卫星降水数据的精度产生一定程度上的影响,因此要将其应用于其他对降水精度要求更高的研究领域时需要进一步处理或结合站点数据进行综合运用。
广西地区年内降水分配极为不均,雨季往往旱涝灾害频发,但稀疏的站点提供的降水数据很难达到对连续、高强度降水事件的准确预报,因此探究卫星对降水事件的探测识别能力具有重要意义。选择分类评价指数BIAS、POD、FAR和ETS进行量化分析,结果如表2所列,3种IMERG降水数据BIAS变化趋势大致相同,BIAS>1的情况都发生在4~9月,BIAS<1则是11月至次年3月,说明在整个研究区内4~9月3种降水数据都高估了降水事件发生的次数,这可能与广西地区雨季云层较厚,而云层表面的反射粒子致使卫星传感器的灵敏度下降有关系;11月至次年3月存在着低估降雨次数的现象(除IMERG-F降水数据的10月份BIAS>1),这可能与冬、春两季广西地区存在短时间低强度降水有一定关系,造成了卫星对微弱降水和固态降水事件(<0.5 mm/d)的低估。3种IMERG降水数据的POD在6~8月高于0.7,而1~3月和10~12月则低于0.6,其中12月的POD最低,IMERG-F也仅有0.37,不同月份之间探测准确率差异较大。与POD对应分析,广西地区除IMERG-E的2月份FAR为0.52外,3种IMERG降水数据全部月份FAR都低于0.5,误报率普遍较低,表明对无降水天数识别较好。3种IMERG降水数据的ETS年内变化趋势较为一致,大部分月份都在0.2~0.3,而近实时的两种IMERG降水数据在2月和11~12月低于0.2,原因可能是在这期间广西部分地区存在微量降水使得卫星反演降水能力减弱,对降水事件的探测准确率下降。
表2 IMERG-E、IMERG-L and IMERG-F的各月分类评价指数
综合分析,IMERG-F各项评分指数普遍优于近实时的两种IMERG降水数据,说明校正可以提高IMERG降水数据对实际降水事件的探测能力。3种IMERG降水数据均在5~8月POD较高,FAR较低,BIAS与ETS较接近最优值1,其余月份则恰好相反,而广西地区5~8月正值雨季降水高峰期,该期间降水量占全年降水量的60%,降水事件较多且降水强度大[14],说明3种IMERG降水数据在雨季月份具有较高的探测精度,适用性较好,在其他月份适用性有限,这可能与卫星传感器的性能缺陷和反演校正算法不足存在一定的关系。
由上文分析发现降水强度是影响IMERG降水数据精度的重要因素之一,定量评估IMERG降水数据在不同强度降水情况下对降雨事件的探测识别能力,对IMERG降水数据应用于气象预报和旱涝灾害评估及其他方面的研究具有重要意义。依据中国气象局降水等级划分标准和广西地区降水情况,研究选取1,10,25,50 mm/d 4个阈值划分降水强度等级为小、中、大、强降水,分别计算3种IMERG降水数据在不同阈值下BIAS,POD,FAR和ETS的值,结果如图6所示。
图6 不同降水阈值下的IMERG-E、IMERG-L、IMERG-F降水能力评估指数Fig.6 Precipitation capacity evaluation indices of IMERG-E,IMERG-L and IMERG-F under different precipitation thresholds
由图6(a)~(b)可知:随着阈值的不断增大,3种IMERG降水数据对于降水事件的探测能力逐渐降低,误报率在逐渐上升。站点校正的IMERG-F相对于其他2种降水数据的POD有小幅提升且FAR呈下降趋势,但总体而言并不能掩盖IMERG数据本身存在的问题。从图6(c)可看出3种降水数据对所有阈值下的降水事件次数均有不同程度的高估与低估,说明3种降水数据在降水事件探测能力方面存在一定程度的不足。进一步结合ETS指数分析可发现:随着校正次数的增加,IMERG降水数据的精度提高,尤其是对中、大以及强降水事件探测准确度提升明显。总体上,3种IMERG降水数据对过高和过低强度降水事件探测能力存在着根本缺陷,随之对高强度降水事件的高误报率会在一定程度上抬高实际降水值,这可能是造成3种IMERG降水数据对实际降水值均存在高估的原因之一。
(1) 3种IMERG降水数据在日和月尺度上均有高估降水现象,随时间尺度增加,3种IMERG降水数据与站点降水数据的相关系数CC均呈递增趋势,而RMSE具有累积效应。日尺度上,CC介于0.49~0.54,RMSE均大于13 mm,IMERG-F的RB上升至3.0%,说明站点校正略微抬高了IMERG降水数据高估降水的程度;月尺度上,相关系数均大于0.8,RMSE均大于50 mm,表明站点校正对整体IMERG降水数据的精度有一定程度提高,但IMERG降水数据本身存在的误差缺陷仍需进一步完善。
(2) 3种IMERG与站点降水数据的季节平均降水量在广西地区具有较好的空间分布一致性,但不同季节存在一定程度的差异,三者在秋季的CC最大,其次是夏季,冬季最小;春季IMERG-L的RMSE最大,秋季最小,冬季IMERG-L的RB最大,夏季最小。 IMERG-F的精度略高于IMERG-E和IMERG-L;冬季IMERG-E和IMERG-L 的精度较低。
(3) 结合站点与误差空间分布分析表明,地形、气候、地理位置等多因素的综合限制使得不同站点的IMERG降水数据所体现的精度有很大差异,3种IMERG降水数据与地形和气象因素复杂地区的精度均较差,IMERG-F的精度在这些区域则有微弱提高,但不足以说明可将其直接应用于这些区域。
(4) 降水量少的月份表现为低估降水事件且存在较多的误报可能,降水量多的月份则高估降水事件而降水探测准确率较高,表明降水量的增加可改善IMERG降水数据的精度。不同降水强度等级方面,降水强度不断加大使GPM卫星探测降水事件准确率逐渐下降,对阈值为50 mm/d的强降水事件探测准确率最低且高估降水事件次数最多,反映了IMERG降水数据对高强度降水事件探测能力的不足。