李炎坤, 高黎明,3, 张乐乐,3, 吴雪晴, 刘轩辰, 祁 闻
(1.青海师范大学地理科学学院,青海 西宁 810008;2.青海师范大学青藏高原地表过程与生态保育教育部重点实验室,青海 西宁 810008;3.青海省人民政府-北京师范大学高原科学与可持续发展研究院,青海 西宁 810008)
降水是气候系统中的一个重要参数,是水循环的重要组成部分,准确的降水数据对理解区域乃至全球气候变化和水循环过程具有重要意义[1-3]。目前,降水数据的获取方式包括地面气象站观测、降雨雷达和卫星遥感探测[4-6]。在这3种方法中,地面观测获取的降水量最为准确,高密度分布的雨量站理论上可以获取准确的降水空间分布特征,然而在高海拔山区流域,由于观测站点稀少且降水空间差异性大,准确的获取这些区域降水空间分布信息至今是一个挑战[6-7]。降雨雷达通过回波强度对地面进行降水预测,可以减小气象站点以点代面的误差,但其约束条件较多,适用性较差[4-5,8-9]。卫星遥感探测具有覆盖范围广、时空分辨率高和约束条件少的特点,能够弥补地面观测的不足[10-11]。随着遥感技术的发展,不断出现的卫星降水产品在气象水文研究领域得到了广泛应用[7,12-13],如CMORPH[14]、GPCP[15]、TRMM[16-17]、PERSIANN-CDR[18]以及GPM IMERG[19]等。
然而,现有的遥感降水产品普遍分辨率低,难以满足山区小流域的研究要求,因此对遥感降水产品的降尺度研究逐渐成为热点。Elnashar等[20]利用Google Earth Engine 和Google Cloud Computing 对TRMM 月降水量进行降尺度分析;范雪薇等[21]基于TRMM 数据在天山山区构建主成分-逐步回归模型,结果表明降尺度后的数据精度显著优于原始TRMM 3B43 数据;张寒博 等[22]对GPM IMERG 和TRMM 3B43数据进行空间降尺度,以此对华中地区进行降水时空变化分析和干旱监测;李豪等[23]采用MGWR与Kriging相结合的方法,建立了MGWRK模型进行降尺度,结果表明降尺度处理不能提高研究区数据精度;徐彬仁等[24]基于随机森林算法对青藏高原TRMM降水数据进行了空间统计降尺度研究;Ghorbanpour 等[25]利用5 种降尺度方法对乌尔米亚湖流域进行降尺度评估。类似的降尺度研究还有很多,但总体上并没有一个普适的降尺度标准。
青海湖流域位于青藏高原东北部,是重要的生态屏障[26-27]。流域内国家气象局公开数据的气象站点仅有1 个,对青海湖流域的水文研究造成很大限制[2,28-29]。张乐乐等[2]在青海湖流域及周边地区通过精度验证评价了TRMM 3B42V7、CMORPH、PERSI⁃ANN、PERSIANN-CDR 遥感降水资料,结果表明TRMM数据记录的降水量最为准确,精度最好,更适用于青海湖流域及周边地区。然而,TRMM 数据由于空间分辨率低(0.25°×0.25°),难以满足小流域尺度水文过程研究需求。因此,有必要通过降尺度获取更高分辨率的降水数据。
因青海湖流域气象站点稀少,本研究将研究范围扩大到包含周围20个气象站点的区域,并以此作为研究区,选用多元线性回归模型(Multivariable Linear Regression,MLR)、主成分-逐步回归模型(Principal Component Stepwise Regression,PCSR)和克里金插值法(Kriging)对TRMM 3B43 数据进行降尺度,并利用研究区内20 个气象站点的实测数据,从年、季、月尺度对降尺度结果进行精度评价。本研究的主要目的是选出最合适的青海湖流域TRMM 3B43数据降尺度方法,为流域开展高分辨率生态、水文过程模拟提供数据支撑。
青海湖流域位于36°15′~38°20′N,97°50′~101°20′E之间,流域面积约29661 km2,湖泊面积约为4400 km2。青海湖流域南至青海南山,西至阿木尼尼库山,东至日月山,北至大通山,形成一个完整的封闭型高原内陆盆地。整个流域呈西北-东南走向,地势西北高东南低[30-32]。因青海湖流域气象站点稀少,研究区划定范围扩大到包含周围20 个气象站点的区域,经纬度范围为35°~39°N,97°~103°E(图1)。研究区地形以高原为主,地势整体西高东低,海拔1330~5663 m,西北和西南整体海拔均在4000 m 以上。研究区降水量特征表现为季节分布不均,夏季降水量占主导地位且较为集中,其次是春秋季,冬季最少[33-34]。
图1 研究区位置及气象站点分布Fig.1 Location of the study area and distribution of meteorological sites
TRMM 3B43降水数据来源于NASA网站(https://search.earthdata.nasa.gov),空间分辨率为0.25°×0.25°,时间分辨率为月尺度,覆盖范围在全球南北纬50°之间,时间为1979年至今,本研究选取的数据年份为2010—2019 年。TRMM 数据为NetCDF 格式,处理时首先要借助ArcGIS 进行格式、投影转换。TRMM 3B43原始降水数据的单位为mm·h-1,乘以每个月的小时数即可得到月降水量。
DEM 数据采用SRTMDEM 90 m 分辨率原始高程数据,数据来源于地理空间数据云(http://www.gs⁃cloud.cn/search)。坡度和坡向数据由DEM 数据生成。并通过裁剪、重采样获得研究区0.25°和0.01°分辨率的高程数据,并基于ArcGIS水文分析工具得到了研究区0.25°和0.01°分辨率的坡度和坡向数据。
NDVI 数据采用MODIS数据MOD13A3产品,数据来源于NASA 网站(https://search.earthdata.nasa.gov),空间分辨率为1 km,时间分辨率为月尺度,数据下载年份为2010—2019 年。处理时首先运用ENVI 进行图像拼接、异常值处理、格式转换,再在ArcGIS中进行投影转换和研究区裁剪。
气象站点观测降水数据采用中国气象数据网(http://data.cma.cn),在本研究区内共有20个气象观测站点,分别为托勒、野牛沟、祁连、德令哈、刚察、门源、乌兰、都兰、共和、西宁、贵德、民和、兴海、贵南、同仁、茶卡、乌鞘岭、武威、永昌、山丹(图1)。本研究选取的降水观测数据时间尺度与TRMM 数据一致,观测数据的时间分辨率为日,通过叠加可以获取月、季节和年尺度的降水数据,研究期内数据无缺测。
降尺度方法选用多元线性回归模型(MLR)、主成分-逐步回归模型(PCSR)和普通克里金插值法(Kriging)。其中Kriging 方法可以在ArcGIS 软件中直接实现。MLR通过2个或2个以上的影响因素作为自变量来解释因变量的变化,以此建立影响因子与自变量的回归模型。降水的形成受到多种因素的影响[35],本文选取经度、纬度、高程、坡度、坡向和归一化植被指数(NDVI)作为影响因子,建立与TRMM降水数据的回归模型,一般方程如下:
式中:y为TRMM 降水数据;a0~a6表示回归系数;x1~x6表示回归因子;k表示降水残差值。
PCSR 方法可以将多个影响因子转化成几个独立因子进行分析。在保证信息最大化的前提下对原来的影响因子进行处理,并在处理过程中剔除不显著的解释变量,以此来提高研究效率并使信息更为精确[21]。本文通过构建PCSR模型建立TRMM数据与影响因子的方程,进行降尺度空间转换,模型构建如下:
式中:Y为TRMM 降水量降尺度后的数据;b~b3表示主成分回归系数;X1~X3表示主成分回归因子;(b+b1X1+b2X2+b3X3+∙∙∙)表示由PCSR 回归得到的降水回归值;K表示降水残差值。
具体步骤如下:将DEM 数据、经纬度、NDVI 处理到相同0.25°分辨率下,运用Matlab软件将各数据所有栅格中心像元点的数值进行汇总;通过Matlab、SPSS 计算得到回归系数,汇总得到0.25°分辨率降水预测回归值和降水残差;采用普通克里金法对降水残差进行插值,得到0.01°分辨率残差数据;将0.25°分辨率下得到的回归系数代入到0.01°分辨率下的回归因子中,并加上高分辨率残差数据,最终得到0.01°分辨率下TRMM降水量降尺度数据,实现降尺度的转换。
选择2010—2019年年均、季均和月份的降尺度数据,通过ArcGIS提取研究区范围内20个气象站点的值,与降水实测值进行精度评价,采用相关系数(CC)、均方根误差(RMSE)和相对偏差(Bias)评价降尺度结果[5,29]。其中CC 的取值范围为[-1,1],CC值越接近1,说明格点数据与观测降水数据的一致性越高。RMSE的取值范围为[0,+∞),值越接近0,表示格点降水数据越准确。Bias的取值范围为[-1,1]值,取值越接近0,表示格点降水数据与观测降水数据偏离程度越小。
利用MLR、PCSR 和Kriging 方法对TRMM 数据降尺度,并通过不同时间尺度处理,得到青海湖流域2010—2019 年年平均和春、夏、秋、冬4个季节平均降水量的空间分布(图2)。图2a~图2d 给出了TRMM原始数据以及3种降尺度方法得到的青海湖流域范围内年平均降水量空间分布。从结果来看,经过降尺度之后得到的年平均降水量与原始TRMM数据的空间分布一致,降水量高值区主要分布于青海湖北部,低值区主要集中在青海湖西部及西北部。从降水量的取值范围来看,Kriging降尺度降水量最大值与TRMM数据保持一致,MLR降尺度降水量最大值略高于TRMM 数据,而PCSR 降尺度降水量最大值略低于TRMM数据,此外,3种降尺度数据的降水量最小值均低于TRMM数据。
图2 青海湖流域降尺度结果空间分布Fig.2 Spatial distribution map of downscaling results in Qinghai Lake Basin
由图2e~图2t 可知,经过降尺度之后得到的季均降水量与TRMM 数据的空间分布一致。其中,春、夏、秋季空间分布与年均降水空间分布类似,而冬季降水量高值区分布在青海湖南部与西北部,低值区分布在青海湖流域中部。
为了进一步给出青海湖流域及周边区域不同海拔降水量的差异,按照500 m 间隔在研究区划分出了9 个海拔梯度,并统计了每个海拔梯度的年平均降水量(图3)。其中,5300~5663 m海拔范围内空间较少,因此将最后2 类合并为4800~5663 m 一级。结果表明,随着海拔的增高,研究区年平均降水量整体上呈现先升高后降低的趋势。在1330~2800 m,降水量随着海拔的升高不断增加,在2800~3300 m,降水量随着海拔的升高有小幅下降,在3300~3800 m 海拔范围内,降水量随海拔的升高而增加并达最大值,当海拔在3800~4800 m,降水量随海拔的增加不断降低,在海拔高于4800 m 后,除MLR降水量随着海拔上升而小幅增加外,其余降水量均呈下降趋势。
图3 研究区海拔划分(a)及降水量随海拔的变化(b)Fig.3 The elevation division of the study area(a)and the change of precipitation with elevation(b)
为了对降尺度模型进行精度验证,本文主要利用研究区域内20 个气象站点的年均、季均、月降水量进行对比验证分析。运用ArcGIS 中的提取分析工具,提取各站点降尺度后的年、季、月数据,并计算CC、RMSE、Bias 3种评价指标。
2.2.1 年降水量评价 从图4中可以看出,TRMM原始数据与观测数据的CC 和RMSE 值为0.83 和69.59;MLR、PCSR和Kriging降尺度数据与观测数据的CC 值分别为0.86、0.85 和0.85,RMSE 值分别为73.39、65.61和65.19。从这个结果来看,3种降尺度数据得到的降水量与观测数据的一致性均优于原始TRMM 数据,其中MLR 数据的CC值最优。PCSR与Kriging 数据的RMSE值优于TRMM,但MLR 数据差于TRMM 数据。此外,Kriging 数据的Bias 值优于TRMM原始数据,PCSR数据没有变化,而MLR则差于TRMM 原始数据。综合来看,在年尺度上基于Kriging 方法得到的降水数据精度最优,其次为PC⁃SR数据,MLR数据精度最差。
图4 实测降水量与TRMM数据及其降尺度数据年均散点图Fig.4 Annual average scatter plot of measured precipitation and TRMM data and its downscaled data
为了讨论TRMM 及其降尺度结果空间分布与气象站实际降水空间分布的一致性,以气象站点年均降水量为参考,计算了各站点的CC、RMSE 和Bi⁃as,并以100.7°E 将其划分为西部地区和东部地区,以此得到年尺度上东、西部地区的精度评价箱线图对比(图5和图6)。在空间上,TRMM及3种降尺度数据均显示东部地区的CC 值较高,RMSE 值较小,表明该地区格点数据与实测降水更一致,数据的误差在此区域更小;图5 中的Bias 显示在研究区西侧的各数据均低估了降水,研究区东侧格点数据高估了大多数站点的降水。由图6结果表明,TRMM及3种降尺度数据的CC 值在东部地区均高于西部地区,RMSE 和|Bias|值在东部地区低于西部地区。综上所述,TRMM 及3 种降尺度数据在东部地区精度最优。
图5 年尺度上TRMM、MLR、PCSR和Kriging的CC(a~d)、PCSR(e~h)和Bias(i~l)的空间分布Fig.5 Spatial distribution of CC(a-d),PCSR(e-h)and Bias(i-l)of TRMM,MLR,PCSR and Kriging on yearly scale
图6 年尺度上TRMM及3种降尺度数据在东西部地区的精度评价箱线图对比Fig.6 Comparison of boxplots for accuracy evaluation of TRMM and three types of downscaled data in the eastern and western regions on the annual scale
2.2.2 季降水量评价 由图7 可知,在数据精度方面,Kriging 数据在春季的CC、RMSE表现最好;从夏季来看,MLR数据的CC值表现最好,但RMSE及Bi⁃as均最差,PCSR与Kriging数据在RMSE与Bias值表现均较好;秋季的RMSE和Bias值中PCSR数据表现最好,但其CC值较差于Kriging 数据;TRMM 数据在冬季的CC、RMSE 和Bias 表现最好,Kriging 数据表现最差。此外,冬季的|Bias|值均为正值且较大,反映出4 种数据在冬季偏离程度均较大,且均大于实测降水量。以往研究表明,在站点尺度上,普遍认为雨量筒获取的降水量最为准确[36],然而雨量筒获取的降雨量受很多因素的影响,如自身误差、安装位置、蒸散发和降水类型等[37-38]。其中,降水类型按照气温划分,主要可分为液态降水、混合降水和固态降水,在寒冷的青海湖及周边地区固态降水占有很大比重,而雨量筒对固态降水的捕捉率最差[39],造成该地区冬季的实测降水量低于实际降水量。因此,在冬季固态降水观测误差本身比较大,可能是冬季TRMM数据及3种降尺度数据的Bias值为正值且比较大的原因。综合来看,春季的Kriging数据精度最优,在夏季PCSR 与Kriging 数据精度基本持平,在秋季PCSR数据最好,而冬季的TRMM数据表现最佳。
图7 TRMM数据及降尺度季均数据精度对比Fig.7 Accuracy comparison between TRMM data and downscaled quarterly average data
2.2.3 月降水量评价 运用提取分析工具提取了2010—2019 年各个站点12 个月的TRMM 数据、MLR、PCSR 及Kriging 降尺度数据。将2010—2019年的月气象站点数据降水量作为自变量,TRMM 数据与3 种降尺度降水数据作为因变量,得到散点图(图8)。从图8可以看出,TRMM数据与实测数据相关系数CC 为0.89,均方根误差RMSE 为17.51,相对误差Bias 为-0.03;MLR 降尺度数据与实测数据CC为0.90,RMSE 为17.36,Bias 为-0.10;PCSR 降尺度数据与实测数据CC 为0.89,RMSE 为17.21,Bias为-0.03;Kriging降尺度数据与实测数据CC为0.72,RMSE为27.75,Bias为-0.02。从相关系数CC来看,MLR降尺度数据同实测降水数据相关性最好,其次为PCSR 与TRMM 数据,Kriging 数据同实测降水数据相关性最差。从均方根误差RMSE 来看,TRMM数据和3种降尺度结果与实测降水值的接近程度表现为PCSR>MLR>TRMM>Kriging。从相对误差Bias来看,|Bias|表现为Kriging<PCSR=TRMM<MLR。此外,通过各散点数据与y=x线进行对比,发现可以看出,PCSR与MLR数据集中程度相近,其次为TRMM数据,Kriging 数据离散程度最高,精度最差。综合来看,在月尺度上PCSR数据精度较好,Kriging数据精度最差。
图8 TRMM原始月降水量、降尺度月降水量与实测月降水量散点图Fig.8 Scatter plot of TRMM original monthly precipitation,downscaled monthly precipitation and measured monthly precipitation
以往研究表明,海拔是影响山地降水的重要因素,随着海拔的升高,降水量一般呈上升的趋势,但遥感数据往往无法准确表达降水的变化[40]。为此将各站点海拔按照由低到高的顺序与其对应的格点数据精度评价指标进行统计(图9)。结果表明,CC 值与RMSE 值随着海拔的升高没有明显的变化趋势,且波动较大,说明海拔对研究区内TRMM 及其降尺度数据的影响不大;随着海拔的升高,Bias值由正转负,整体呈下降趋势,表明TRMM 数据随着海拔的升高逐渐出现低估降水的现象,这与卢新玉等[35]、李琼等[41]研究结果是一致的。综上所述,在1330~3800 m 海拔范围内,研究区降水量随着海拔的升高而逐渐增加,因此在降水量较多的山区对流性降水占总降水比率较高,而TRMM 数据微波降水率反演时对对流性降水有一定程度低估[42-43],导致降水量较高的山区出现低估降水的现象。
图9 各站点海拔与格点数据精度评价指标统计Fig.9 Statistics of the accuracy evaluation indicators of the altitude and grid data of each station
本文以青海湖流域及周边区域作为研究区域,选取经纬度、坡度、坡向、DEM、NDVI 作为影响因子,对2010—2019年间的TRMM数据进行降尺度处理,通过构建多元线性回归模型(MLR)、主成分-逐步回归模型(PCSR)和普通克里金插值法(Kriging)进行降尺度研究,并运用CC、RMSE、Bias 作为评价指标进行精度验证和对比分析,得到以下结论:
(1)TRMM 及3 种降尺度数据与气象站点数据在青海湖流域及周边区域得到降水空间分布具有一致性。年均及春、夏、秋季的降水量均表现为北部高,西部及西北部低,而冬季降水量表现为南部与西北部高,中部低。此外,研究区降水量随着海拔的增高,以3800 m为界整体上呈现先升高后降低的趋势。
(2)在精度评价方面,PCSR降尺度数据在青海湖流域及周边区域表现更为准确。从年尺度上来看,Kriging精度表现最好,在空间上TRMM及3种降尺度数据在东部地区精度最优;在季尺度上,数据精度表现为PCSR>Kriging>TRMM>MLR;在月尺度上,PCSR数据精度最好。
(3)研究区内TRMM 及3 种降尺度数据受海拔影响较小,但随着海拔的升高,TRMM及其降尺度数据逐渐出现低估降水的现象,其可能原因在于降水的低估与微波降水率反演时对对流性降水的低估有关。