邢贞相,袁 泽,段维义,喻 熠,纪 毅,刘昊奇,付 强
(东北农业大学水利与土木工程学院,哈尔滨 150030)
降水是水文循环中主要环节,是水文模型最重要气象输入变量之一,准确的降水输入是获得可靠地表水文模拟基本条件[1]。地面降水观测站是测量降水最直接途径,但复杂地形中雨量计密度低,分布不均匀,难以满足陆面水文模型对降水数据连续性、长序列及大尺度要求[2]。因此,准确获取区域降水数据对于水文模型验证、应用及水资源管理具有重要意义[3]。
因网格化降水产品具有空间分辨率高、覆盖面积广、时间跨度长、便于获取和处理等优势应用广泛,成为水文研究中地面监测降水潜在替代品。目前我国应用较多的网格化降水产品有中国区域地面气象要素数据(China meteorological forcing dataset,CMFD)、全球高分辨率的陆面模拟系统(Global land data assimilation system,GLDAS)、中国气象局陆面同化系统(China meteorological administration land data assimilation system,CLDAS)、中国自动站与CMORPH融合的逐时降水产品(CMPA)等。目前国内流域使用CMFD和GLDAS驱动分布式水文模型,王姝等使用CMFD驱动NoahMP陆面过程-RAPID河网汇流耦合模式,模拟大渡河流域水文过程[4];王福兴在辉发河流域验证GLDAS降水、气温及长波辐射精度较高,并以GLDAS驱动WEB-DHM模型,较好再现该流域水循环过程[5]。CLDAS和CMPA在水文模拟上应用相对较少,但已有对水文模拟应用的潜力评估,孙帅等证明CLDAS长序列融合降水产品优于CMORPH和MERRA2降水产品,满足中国陆面水文模拟、气候研究等相关领域需要[6];田凤云等从水文应用角度评估CMPA在黄土高原精度,结果表明该产品可合理反映研究区降水日变化过程[7]。
呼兰河流域位于东经125.90°~128.80°、北纬
46.18°~48.13°,是松花江(见图1a)左岸最大支流之一,属高寒地区,雨量站站网较为稀疏,降水形态多变,表现为雨、雪、雨雪混合物等多种形态,地面雨量计观测误差较大。网格化降水产品虽可在一定程度上弥补其不足,但不同降水产品存在区域表现差异,需要对其准确性和区域适用性评价展开针对性研究[8-9]。本研究基于地面雨量计的中国逐日网格降水量实时分析系统数据集(CGDPA)和位于呼兰河流域内3个国家级雨量站逐日降水资料作为参考值[10-11],评估CMFD、GLDAS、CLDAS降水产品和CMPA在呼兰河流域全年、汛期(6~9月)、非汛期3种时段时空分布特征和精度,评估各网格化降水产品在多个时空尺度上适用性,为呼兰河流域水文模拟和水资源管理提供可靠的网格化降水数据来源。
呼兰河流域(见图1)发源于小兴安岭西麓,全长523 km,流域面积35 683 km2,东北部为山地,西部和中部为丘陵和台地。呼兰河流域属北温带季风气候区,春季降水量占全年降水15%,径流主要靠融雪补给,且径流量小;夏、秋汛期(6~9月)降水占全年降水70%~80%,径流量占全年径流总量75%~80%,是呼兰河流域暴雨洪水多发期;冬季漫长、干燥,最低气温-41.8℃,冻土深度约2 m,河流在冬季有时因缺少地下水补给而断流。呼兰河流域降水、径流明显的季节性变化和地表土壤季节性冻融造成该流域水文过程复杂。
图1 研究区域示意图Fig.1 Sketch map of study area
兰西水文站位于呼兰河干流,是呼兰河流入松花江前的把口站,控制断面以上河长378 km,集水区面积为25 587 km2,将该区域作为网格化降水产品时空特征对比分析和精度评价的主要区域。
2.1.1 数据介绍
本研究收集整理2008~2015年降水资料为基础数据(见表1):
①中国逐日网格降水量实时分析系统数据集,简称CGDPA数据。通过实时提取全国2 419个站(包括国家气候观象台,国家气象观测一级站、二级站)逐日降水量,采用“基于气候背景场”最优插值方法,实时生成中国区域逐日降水量网格产品。
②中国区域地面气象要素数据集,简称CMFD数据。该数据集以Princeton再分析资料、GLDAS资料、GEWEX-SRB辐射资料和TRMM(Tropical rainfall measuring mission)降水资料为背景场,融合气象观测数据制作一套再分析数据集,包含近地面气温、近地面气压、近地面空气比湿、近地面全风速、地面向下短波辐射、地面向下长波辐射、地面降水率7个气象变量[12],将CMFD数据集地面降水率变量简写为CMFD_P。
③全球高分辨率陆面模拟系统,简称GLDAS数据,是基于多源观测数据和再分析资料同化形成的全球高分辨率陆面模拟系统。GLDAS降水数据基于CMPA得出,融合地面观测值和5种卫星估计值[7]。本研究将GLDAS气象驱动数据中降水率变量简写为GLDAS_P。
④东亚区域大气驱动场再分析数据集,简称CLDAS数据。该数据集利用多种来源地面、卫星等观测资料,采用多重网格变分同化(STMAS)、最优插值(OI)、概率密度函数匹配(CDF)、辐射传输模型物理反演、地形校正等技术研制而成,有气温、气压、比湿、风速、小时降水和短波辐射6个气象要素,本研究将CLDAS数据集小时降水变量简写为CLDAS_P。
⑤中国自动站与CMORPH融合逐小时降水量
0.1°网格数据集,简称CMPA数据。该数据集以地面逐时降雨格点数据为基础,使用最优插值(Optimal Interpolation,OI)方法与卫星降雨资料结合生成降雨融合产品。
此外,实测雨量站点数据来源于中国气象数据网(http://data.cma.cn)中国地面气候资料日值数据集(V3.0),该数据集内共包含三个呼兰河流域内站点,分别为北林站、海伦站、铁力站(见图1b)。
2.1.2 数据处理
由于各降水产品所使用源数据、生成方法和应用场景不同,5套网格化降水产品之间存在不相同储存格式、单位、时区、时间步长、空间分辨率和空间范围(见表1),为便于统一分析对比,需对5套降水产品预处理。
表1 降水产品基本信息Table 1 Summary of the precipitation products
5套网格化降水产品中,CMFD、GLDAS、CLDAS为再分析气象驱动数据集,储存格式为自描述文件格式NetCDF(Network common data form),单个文件中均包含多个气象要素,使用Python语言编程提取上述3套数据中逐1 h/3 h降水率(mm·s-1)变量并转换为累计1 h/3 h降水量(mm)。CGDPA与CMPA是实时更新降水量网格数据集,储存格式为GrADS标准格式,使用CDO(Climate data operators)工具将其转换为与上述3套再分析气象驱动数据集相同的NetCDF格式。
为便于分析和应用各套降水产品,使用双线性插值方法将所有降水产品原有网格尺度重新映射到1 km×1 km网格上,并投影转换(朗伯等角圆锥投影)、裁切至研究区域等处理。而后将5套数据时区统一转换为北京时间(UTC+8),并将其累积为3 h、日值、月值和年值降水量序列。
2.2.1 分析方法
由于呼兰河流域70%~80%降水来自夏、秋汛期(6~9月),本研究进一步将呼兰河流域全年分为汛期(6~9月)和非汛期(10月~次年5月)两个时期。CMFD_P、GLDAS_P、CLDAS_P、CMPA 4套降水产品时间和空间分布特征以CGDPA日数据和流域内3个国家级雨量站日观测资料作为参考值,通过日降水精度、月平均降水年内分配特征、各时段年际变化特征和多年平均降水量精度阐述CMFD_P、GLDAS_P、CLDAS_P、CMPA时间分布特征。以研究区域各点全年、汛期、非汛期3个时段多年平均降水量阐述CMFD_P、GLDAS_P、CLDAS_P、CMPA空间分布特征。
2.2.2 评估指标
4套降水产品多年平均降水量采用相对误差(RE)评价,日尺度定量精度使用相关系数(CC)、偏差(BIAS)、根均平方误差(RMSE)和泰勒图分析4种标准评价。当CC高于0.7时,变量显著相关[13],当BIAS值为-10%~10%,精度可接受[14]。泰勒图将模拟值归一化标准差和真实值之间相关系数绘制同一图中,模拟点同参考点距离表示评估值与真实值中心化均方根误差。通过泰勒图对比不同模拟方案优劣,即越靠近参考点说明相关系数越高,均方根误差越小[11]。
指标计算公式如下:
式中,n为样本总数;i为时次;P和O分别为降水产品估计值和参考值;Pˉ和Oˉ分别为降水产品估计值和参考值均值。
3.1.1 日降水量精度
由图2可知,对于3个时段,GLDAS_P对应点据距参考值点较远,精度最低;CMPA、CLDAS_P和CMFD_P对应点据距参考值点较近。根据泰勒图分析原理和4套数据对应点据距参考值点距离远近可知,4套降水产品表征的日面雨量和日点雨量在全年(见图2a)和汛期(见图2b)精度优劣程度排序相同,均依次为CMPA>CLDAS_P>CMFD_P>GLDAS_P。非汛期(见图2c)由于CMFD_P在不同空间尺度上均有较小离散程度(归一化标准差更接近“1.0”),整体精度最高;CLDAS_P和CMPA的CC和RMSE(具体数值见表2)在海伦站精度较低,同时CLDAS_P距参考值点近于CMPA,故CLDAS_P精度高于CMPA;结合上文GLDAS_P散点距参考值点最远、精度最低结论,最终得出4套降水品在非汛期精度优劣为CMFD_P>CLDAS_P>CMPA>GLDAS_P。
表2 列出4套降水产品不同空间尺度日降水量精度评价指标具体数值。据表2可知,对于相关系数,CMFD_P、CLDAS_P、CMPA在3个时段均与CGDPA显著相关,汛期相关系数在0.9以上,非汛期在0.7以上。对于RMSE,CMFD_P和CLDAS_P在全年和汛期RMSE值接近,全年RMSE在1.7~2.7 mm,汛期RMSE在2.2~5.0 mm,精度优于其他两套降水产品。对于BIAS,CMFD_P的BIAS值最小,3个时段BIAS绝对值均小于10%;此外,GLDAS_P在全年BIAS均小于10%,而汛期与非汛期BIAS较大,且正负不一致(汛期BIAS为正值,非汛期BIAS为负值)。
3.1.2 年内分配特征
4套网格化降水产品分别与CGDPA数据对比的多年平均年内月分配过程见图3。可见,4套数据体现年内月分配过程与CGDPA数据月分配过程变化趋势总体一致,其中月最大降水集中在7月,月最小降水出现在1月、2月和12月。此外,从年内降水量集中程度看,CLDAS_P、CMPA、CMFD_P年内分配过程均表征流域内70%~80%年降水量集中在汛期,其余少量降水分布在非汛期特征;与上述3套数据相比,GLDAS_P在年内降水量集中程度表现上相对较差,汛期降水量占比偏低、非汛期降水量占比偏高,与3.1.1得出该数据年内日降水量在汛期、非汛期精度低的结论一致。但这一结论与王福兴[5]在辉发河流域应用该数据的结论不同,原因可能是不同流域表征的年内分配特征存在较大差异。这也是网格化降水产品应用时需局地适用性评价的原因。
图2 4套降水产品的日降水量泰勒图Fig.2 Taylor diagrams of daily precipitation
表2 4套降水产品不同时段日降水量的精度分析Table 2 Accuracy analysis of daily precipitation during different period
图3 各降水产品在呼兰河流域多年平均年内分配Fig.3 Distribution of monthly average precipitation from different products in the Hulanhe Basin
3.1.3 多年平均降水量精度
由图4可知,4套数据汛期误差均高于全年和非汛期。对于全年降水量,与CGDPA相比,CMFD_P与GLDAS_P多年平均全年降水量分别高估8%和11%、CLDAS_P与CMPA多年平均全年降水量分别低估16%和23%;对于汛期,与CGDPA相比,CMFD_P高估10%,其他3套降水产品分别低估12%、16%和17%;对于非汛期,与CGDPA相比,CMFD_P与GLDAS_P分别高估12%和78%,CLDAS_P与CMPA分别低估38%和26%。
此外,需强调表3中CMFD_P在汛期多年平均降水量为490 mm,显著高于其他3套降水产品数值(370~390 mm),可能因该套数据在融合降水时以TRMM等卫星降水数据作为背景场[15]、而TRMM降水在呼兰河流域日尺度降水高估[16]有关。
图4 4套降水产品在呼兰河流域不同时段降水量相对误差Fig.4 Relative errors of four sets of precipitation products in Hulanhe Basin in different time periods
表3 各套降水产品在呼兰河流域多年平均全年、汛期和非汛期降水量及相对误差Table 3 Mean annual annual precipitation in a year,flood season and non-flood season and relative error for each precipitation products in Hulanhe Basin
3.1.4年际变化特征
4套降水产品在2008~2015年全年降水量(见图5a)和汛期降水量(见图5b)变化趋势均与CGDPA所表现趋势一致,呼兰河2009、2012和2013年发生全流域性洪水,与图4显示全年降水量(见图4a)和汛期降水量(见图4b)年际变化特征一致。在非汛期(见图5c),GLDAS_P、CMFD_P表现变化趋势均与CGDPA一致,但CMPA、CLDAS_P所表现变化趋势与CGDPA不一致,一方面是降水量级偏低、气候差异较大、参照地面观测数据精度低[15]等原因导致其融合数据误差较大。同时,也与在3.1.1、
3.1.3 中两套数据非汛期精度均不高的结论相符。
5套降水产品在呼兰河流域空间分布见图6。
图5 各降水产品在呼兰河流域不同时段降水量序列Fig.5 Precipitation series of each precipitation product in different time periods in the Hulanhe Basin
图6 各降水产品在呼兰河流域不同时段空间分布Fig.6 Spatial patterns of each precipitation products in different time periods in Hulanhe Basin
由图6可知,对于全年、汛期2个时段,不同降水产品表现各时段降水量自东北向西南递减的变化趋势。但不同降水产品对各时段降水量空间分布细节刻画上所表现的特征差异明显。CMFD_P降水空间分布和CGDPA空间分布特征具有较高相似度,均捕捉到降水空间极大值区域,但两者汛期极大值区位置有差异,可能因CGDPA数据制作方法中考虑地形因素[16],使该数据极大值趋向流域高程最高点;GLDAS_P所表现的空间细部差异小于CMFD_P和CGDPA,此外,GLDAS_P无法捕捉降水极大值区域,可能与该产品空间分辨较低有关(见表1);CLDAS_P和CMPA降水产品所表现的空间分布特征具有较高相似度,均可捕捉到降水空间的极大值区域,其极大值区域位置也较接近。但这两套降水产品所刻画的细部空间特征明显优于其他3套降水产品,可能与其空间分辨率高、数据融合所使用地面站点较多有关[17]。
对于非汛期,CGDPA、CMFD_P、GLDAS_P 3套降水产品所表现降水量空间变化趋势相同,均为自东南向西北递减,无法捕捉极大值区域;CLDAS_P、CMPA降水产品所表现降水量空间变化趋势接近,可捕捉到极大值区域。由此可见,不同降水产品在非汛期所表现出降水量空间变化趋势异于其他两个时段,与该流域不同时期降水成因不同有关[18],具体影响因素有待深入研究。