覃金兰,韦梦思,张寒博,窦世卿
(桂林理工大学 测绘地理信息学院,广西 桂林 541006)
降水是全球水循环的关键部分,对调节全球气候有着重要的作用,推动全球物质循环和能量交换,在不同时空尺度的大气过程均扮演着非常重要的角色[1]。降水数据是水文模型模拟、水资源管理和洪涝灾害监测等的关键[2]。大量研究表明,基于气象站点的传统点测量无法有效反映降水的空间变化[3]。随着遥感地理信息的飞速发展,基于卫星观测开发出了一系列降水数据产品,热带降雨测量任务(Tropical Rainfall Measuring Mission,TRMM)数据被广泛应用。
近年来,TRMM数据的适应性备受关注,Ning等[4]对TRMM数据在天山地区的适应性做了研究,相关系数在0.7以上。王凯等[5]的研究表明,TRMM数据和实测站点数据具有良好的线性回归关系。
然而,TRMM数据的地面分辨率较低,不能满足大尺度分析的需求,需要用到空间降尺度的方法[6]。通过各种植被指数数据、数据高程模型(DEM)数据和降水量之间的响应关系可以实现TRMM数据降尺度。国外基于归一化植被指数(NDVI)、DEM[7-8]对TRMM数据进行了降尺度研究。国内基于海拔、坡度、坡向、增强型植被指数(EVI)、NDVI、GDP[9-11]等因子实现了TRMM数据的降尺度转换。有研究结果表明,EVI和TRMM数据之间存在较强的相关性。Wong[12]通过将EVI值对各种时空尺度上的降水数据进行线性回归,可以建立EVI值和降水量之间的关系,且研究表明,相对于NDVI,EVI和降水量的关系更为密切。
基于不同的降尺度方法,可以得到不同的降尺度降水数据。国外有两步空间缩减[13]、统计降尺度模型[14]等方法。国内有偏最小二乘法[15]和随机森林算法[16]等。近段时间以来,基于地理加权回归(GWR)模型进行TRMM数据降尺度的方法有很高的热度,LYU[17]等人通过GWR模型估计了柴达木盆地的TRMM空间分布。曾业隆等[18]利用GWR模型,对贵州喀斯特山区的TRMM数据进行降尺度和校正,提高了TRMM数据的分辨率和准确度。杜军凯等[19]通过GWR模型校正TRMM数据,校正前后TRMM降水与实测降水的决定系数提高了20%以上。姬世保等[20]的研究结果显示,GWR法的校正精度优于多元线性回归法。因此,本文基于GWR模型,在华中地区用EVI或NDVI数据结合其他影响因子对TRMM数据进行了降尺度处理和分析。
本文研究区域为华中地区。华中地区由湖南、湖北和河南3个省份组成,经纬度范围为24°38′N~36°24′N,108°21′E~116°39′E[21],面积约为5.6×105km2[22]。华中地区地处交通要塞,北接华北、西北,南接华南,西邻西南,东邻华东,轻工业发达,经济发展水平较高。华中地区的地理位置特殊,隶属于黄河的中下游和长江的中游,河系发达。气候类型以温带季风气候和亚热带季风气候为主,夏季以短时降雨为主,短时降雨对地表冲击力大,容易引发洪涝灾害,造成水土流失。地形主要由平原、丘陵、盆地和湖泊构成,年降水量在800~2 000 mm,年均温度在14~21 ℃[23],湿度较大,温度适宜,区域气候有利于植被生长。本文通过研究GWR模型实现TRMM数据降尺度,有利于华中地区的洪涝灾害研究。研究区及气象站点分布如图1所示。
图1 研究区及气象站点分布Fig.1 Distribution of study areas and meteorological stations
本文所采用的NDVI、EVI数据为MODIS13A3产品,时间分辨率为1个月,地面分辨率为1 000 m×1 000 m。TRMM数据是从美国NASA网站下载的MODIS13A3产品,空间分辨率是0.25°×0.25°,格式是HDF。气象站点数据是从中国气象局国家气象信息中心下载全国站点2010年1月—2019年12月的数据。MODIS数据首先在MRT进行波段提取、影像镶嵌、投影坐标变换、数据格式转换等一系列预处理,再通过Matlab最大合成法对月数据合成年数据,最终得到年NDVI和EVI数据。对于大陆表面地物,受气候因素影响,近红外波段和可见光相比反射作用弱时,NDVI数值一般在-1~0;裸露的地面NDVI的数值通常为0;草地、林地、湿地和农田数值在0~1.0,通过ENVI检验数据的正确性,剔除表现异常的数据,从而保证精度。华中地区DEM栅格数据是通过全国DEM栅格数据在ArcGIS中进行掩膜裁剪得出。TRMM数据是在MRT中将数据格式转换为TIF格式。气象站点数据是在ArcGIS利用栅格计算器累加得出年总降水量数据,再裁剪出研究区53个气象站点降水数据作为降水数据的真值。
Brunsdon等[22]提出了一种回归参数随着地理位置的改变而变化的GWR模型,根据距离的远近程度,建立距离权重比,从而得到最佳估值,结合地理位置得到的数据往往更加贴合局部的变化特征。GWR模型如下:
i=1,2,…,m,
(1)
TRMM降尺度步骤如下:
① 对数据进行预处理,将数据分为高分辨率HR(1 km)和低分辨率LR(0.25°)。
② 把TRMM(LR)栅格转点,通过多值提取至点把EVI(LR)、NDVI(LR)、DEM(LR)和坡向(LR)提取到TRMM点矢量图层上。
(2)
(3)
④ 对常数项、对应系数和残差项运用IDW插值,并将插值后的栅格数据转投影,重采样为1 km×1 km的地面分辨率。
⑤ 重构TRMM降水数据。第一种重构方法用1 km×1 km的地面分辨率的NDVI、DEM、坡向数据和重采样后的常数项、对应系数、残差进行模型回代,得到降尺度的TRMM:
(4)
第二种重构方法用1 km×1 km的地面分辨率的EVI、DEM、坡向数据和重采样后的常数项、对应系数、残差进行模型回代,得到降尺度的TRMM:
(5)
本文通过DEM、坡向、NDVI或EVI数据对TRMM数据降尺度,降尺度结果与实测气象站点数据相比,研究两两之间的相关性。相关性参考线性相关系数(R2)、相对误差(BIAS)、均方根误差(RMSE)和平均绝对偏差(MAE)[10]四个相关性评价指标。R2是用来评价数据之间存在的相关程度,当R2的值越接近1时,认为二者相关性越强;如果数值越接近0,则认为二者的相关性弱。BIAS是表示TRMM数据与通过插值得到的气象站点数据估值与真实值之间存在的平均相对中误差,当BIAS越接近0时,则说明误差较小,得到的数据精确度越高;反之,精确度低。RMSE是表示数据误差的总体大小,当RMSE越小时,表示数据的精度越高;反之,则表明精度较差。MAE是误差偏离的平均值,可以直观地表示和计算估值误差的真实大小,其数值也是越小精度越高。这4个指标如下:
(6)
(7)
(8)
(9)
在使用TRMM降水数据前,首先对TRMM降水数据和气象站点数据进行可行性分析,检验研究区域内二者是否呈现明显的相关性。TRMM数据与站点数据R2如图2所示。
图2 TRMM数据与站点数据R2Fig.2 R2 of TRMM data and meteorological stations
由图2可以看出,华中地区2010—2019年间TRMM数据和气象站点数据存在明显的相关性,且大部分数据的相关系数在0.8以上,相关系数最小也达0.544。由此可见,使用TRMM数据来实现华中地区的降水降尺度是可靠的。
运用栅格计算器对十年TRMM数据求平均,得到TRMM十年平均数据,如图3所示。同理,求取EVI降尺度十年平均降水量图,如图4所示;NDVI降尺度十年平均降水量图,如图5所示,并且运用IDW插值十年气象站点数据求取年平均,得到站点数据十年平均图,如图6所示,形成对比。
图3 TRMM数据十年平均Fig.3 Ten-year average of TRMM data
图4 EVI降尺度TRMM十年平均Fig.4 Ten-year average of EVI downscaling TRMM
图5 NDVI降尺度TRMM十年平均Fig.5 Ten-year average of NDVI downscaling TRMM
图6 气象站点数据十年平均Fig.6 Ten-year average of meteorological station data
通过ArcGIS导入站点数据,多值提取出TRMM十年数据、EVI降尺度降水十年数据和NDVI降尺度十年数据,导出属性表,以每一个站点数据十年平均值为X轴,TRMM十年平均数据、EVI降尺度降水十年平均数据和NDVI降尺度降水十年平均数据分别为Y轴做散点图,得到图7~图9。
图7 TRMM年均降水量与实测站点数据线性相关图Fig.7 Linear correlation diagram of TRMM annual precipitation and measured station data
图8 EVI降尺度TRMM十年平均降水量和站点实测数据线性相关图Fig.8 Linear correlation diagram of EVI downscaling TRMM ten-year average precipitation and the measured data at the station
图9 NDVI降尺度TRMM十年平均降水量和站点实测数据线性相关图Fig.9 Linear correlation diagram of NDVI downscaling TRMM ten-year average precipitation and the measured data at the station
研究结果表明,EVI降尺度TRMM十年平均数据、NDVI降尺度TRMM十年平均数据和站点数据十年平均降水量有相同的空间分布规律,降水量由南向北减少,降尺度后的TRMM数据相比降尺度前TRMM数据和插值后的站点数据有更多的细节信息。同时,由图8可知,EVI降尺度得到的TRMM十年平均数据和站点实测数据的R2为0.927 6。图9表明NDVI降尺度得到的TRMM十年平均数据和站点实测数据的R2为0.922 8,2种降尺度TRMM数据的R2都高于0.9,和图7显示的TRMM数据0.930 3的R2接近,说明降尺度后的TRMM数据精度是可靠的,且EVI降尺度TRMM十年平均数据R2稍大于NDVI降尺度TRMM十年平均数据R2。
通过多值提取出的数据,计算每一年的R2、BIAS、RMSE和MAE,各个指标的分布,如图10所示。
图10 TRMM数据、EVI降尺度TRMM和NDVI降尺度TRMM年际的R2分布Fig.10 Interannual R2distribution of TRMM data,EVI downscaling TRMM and NDVI downscaling TRMM
由图10可以看出,EVI降尺度TRMM的R2几乎每一年都比NDVI降尺度TRMM的R2稍高,只是在2015年偏低。BIAS越接近0精度越高。
TRMM数据、EVI降尺度TRMM和NDVI降尺度TRMM年际的BIAS分布如图11所示。
图11 TRMM数据、EVI降尺度TRMM和NDVI降尺度TRMM年际的BIAS分布Fig.11 Interannual BIAS distribution of TRMM data,EVI downscaling TRMM and NDVI downscaling TRMM
由图11可以看出,除2019年BIAS偏高外,其他年份BIAS在0.07以下,但从BIAS来看,NDVI降尺度TRMM数据的精度比EVI降尺度TRMM数据精度高。
TRMM数据、EVI降尺度TRMM和NDVI降尺度TRMM年际的RMSE和MAE分布如图12和图13所示。
图12 TRMM数据、EVI降尺度TRMM和NDVI降尺度TRMM年际的RMSE分布Fig.12 Interannual RMSE distribution of TRMM data,EVI downscaling TRMM and NDVI downscaling TRMM
图13 TRMM数据、EVI降尺度TRMM和NDVI降尺度TRMM年际的MAE分布Fig.13 Interannual MAE distribution of TRMM data,EVI downscaling TRMM and NDVI downscaling TRMM
RMSE和MAE越小精度越高,由图12和图13可以看出,RMSE和MAE有相同的分布。整体来说,EVI降尺度TRMM数据的RMSE和MAE都比NDVI降尺度TRMM数据小,只有2015年比较异常。4个指标中,其中3个指标都表明EVI降尺度TRMM数据精度比NDVI降尺度TRMM数据高,所以,EVI降尺度TRMM数据较为准确。
将十年(2010—2019年)TRMM数据和EVI数据、DEM、坡向数据构建GWR模型,通过模型计算得到EVI降尺度TRMM数据,同理可得NDVI降尺度TRMM数据。对每一年的站点数据进行插值,得到1 km地面分辨率的站点数据,如图14~图17所示。
图14 2010—2019年EVI降尺度TRMM降水量分布Fig.14 2010—2019 EVI downscaling TRMM precipitation distribution map
图15 2010—2019年NDVI降尺度TRMM数据降水量分布Fig.15 2010—2019 NDVI downscaling TRMM data precipitation distribution map
图16 2010—2019年TRMM数据降水量分布Fig.16 2010—2019 TRMM data precipitation distribution map
图17 2010—2019年站点数据插值后降水量分布Fig.17 Distribution of precipitation after interpolation of station data from 2010 to 2019
可以看出,各组数据有相近的降水分布,降水量分布符合纬度地带性和经度地带性规律,且降尺度降水数据比TRMM数据、站点插值得到的数据降水信息更加细致,特别是站点相对较少的地区。从降水量的最大值和最小值来看,TRMM数据和站点数据偏差较大,而降尺度TRMM数据和站点数据偏差较小。降尺度TRMM数据普遍比站点插值数据的值域范围大一些,且EVI降尺度TRMM数据和NDVI降尺度TRMM数据的最大值相差不大,但是最小值EVI降尺度TRMM数据比NDVI降尺度TRMM数据更接近站点插值数据的最小值。
本文基于EVI、NDVI、DEM和坡向数据,通过GWR模型对研究区TRMM数据进行降尺度,从而提高了研究区降水数据的地面分辨率,并用研究区站点数据进行检验,验证降尺度数据精度,得出以下结论:(1)用TRMM数据来研究华中地区的降水降尺度方向是可行的,通过计算空间分辨率为0.25°×0.25°的TRMM数据和站点数据的R2,发现年际R2普遍偏高,R2最大为2012年的0.94,最小为2011年的0.544,其他年份都在0.8以上。(2)结合降尺度后的TRMM十年平均降水和年际降水分布,基于4个相关性评定指标分析,用EVI、DEM和坡向数据或NDVI、DEM和坡向数据通过GWR模型,将TRMM数据地面分辨率提高到了1 km×1 km,对于站点数据分布相对较少的区域能够比较细致地反映出降水量,和原TRMM数据相比有较多细节信息,且降尺度数据精度相对于原始TRMM数据没有降低。(3) 通过EVI降尺度降水数据和NDVI降尺度降水数据十年平均R2和4个相关性评定指标年际对比,总体来看,研究区内EVI降尺度降水数据比NDVI降尺度降水数据精度更高,更加接近真实值,适用性更好。
本文研究了2010—2019年十年降尺度数据,但由于所获取的资料有限,且只考虑了降水的年数据,有一定的局限性;同时,在选择降水数据时只采取了MODIS系列产品,没有结合其他获取降水数据的卫星数据进行对比,会有些许偏差。