莫跃爽, 索惠英, 焦树林, 赵宗权, 张 洁, 赵 梦, 刘 炜, 李银久
(贵州师范大学 地理与环境科学学院, 贵阳 550025)
降水是气象、水文模拟最重要的信息之一[1],降水量是决定干湿的主要因子[2],空间化的降雨信息对于对水资源管理、建立流域水文模型、以及生态环境治理和研究气候的变化都具有重要的意义。由于地形地貌、人力财力等因素的限制,气象观测站点的数量有限且空间分布不均衡,想要获取降水的空间分布情况,需要根据观测站降水数据进行空间插值。空间插值的方法有很多[3-5],在降水量插值方法方面得到了广泛应用。卓静等[6]在秦岭主脊区分别采用反距离权重法、普通(泛)克里金法、样条函数法和趋势面法对多年气象要素进行空间插值分析,发现规则样条法的插值效果最优。朱芮芮等[7]对日降雨量的时空变化特异进行分析,得出普通克里金和反距离权重法整体效果较好。封志明等[8]认为降水与经纬度和海拔高程复相关系数偏小时,反距离权重法插值效果更理想。Bussires等[9]在日累计降水量的插值研究中发现地统计学克里金法优于简单的泰森多边形法和反距离权重法。赵冰雪等[10]采用反距离权重法、径向基函数法、普通克里金法和协同克里金等内插方法对安徽省的逐月降水数据进行最优方法选取的探讨。林金煌等[11]对福建省的多年平均降水和月均降水的最优插值方法进行探究,得到克里金方法的插值精度更高。综合分析现有的研究成果发现:研究工作大多集中在其他研究区域,针对贵州省降水的空间插值方法的研究不多,贵州省是全国唯一没有平原支撑的省份,以往对贵州省降水的研究主要侧重于时空变化的特征规律、极端降水[12]、雨日数变化[13]和气候干旱等[14]方面,通常采用一种插值方法来简单模拟降水的空间变化情况,并没有对多种插值方法进行比较,从而得出最优的插值方法,即现阶段缺乏对贵州省喀斯特地区复杂地形下多年平均降水空间插值方法的讨论和研究。另一方面,贵州省喀斯特山区地形复杂多变[15],地势起伏大,贵州省土壤侵蚀和土地荒漠化严重[16],降水量时空分布不均,其空间降水信息是该区域的植被生产力、农业灾害及水文水资源涵养能力等研究的重要数据支撑。因此研究该地区的降水空间插值方法具有十分重要的意义。
本文利用贵州省17个气象站1960—2018年59 a的月值降水观测数据,将研究时段划分,在ArcGIS中采用最常见的反距离权重法、普通克里金法、样条函数及趋势面法共4种方法进行降水空间插值,利用留一法交叉验证比较每种方法的精度,通过分析验证,试图寻求最合适的降水插值方法,以期为利用有限气象观测点更有效地反映出喀斯特地区降水空间分布特征提供参考,并为相关研究提供借鉴[17]。
贵州省位于中国西南部(103°36′—109°35′E,24°37′—29°13′N),东接湖南,北邻四川,西连云南,南界广西,东西长570 km,南北宽510 km,总面积17.61万km2,约占全国土地总面积的1.8%,是一个隆起于四川盆地和广西丘陵之间的亚热带高原山地地区。境内山峦起伏,地貌类型复杂,气候类型多样,自然景观独特,区域差异明显。贵州省由于海拔较高,纬度较低,故冬温较高,夏温较低,省内各地年均温在8~20℃。全省云量多,日照较少,湿度较大,各地降雨日数一般在180 d左右,年变化较小,与江南广大地区相比,全省降雨日数约偏多20 d。贵州离海洋近,处于冷暖空气经常交锋的地带,降水量较多,年降水量在850~1 600 mm,西南部苗岭西段南坡,地处西南季风的迎风坡,是范围最大的多雨区,以晴隆县为代表年降水量约达1 580 mm,威宁、毕节一带是全省的少雨地区,年降水量在900 mm左右。
本文对贵州省数据较完整的17个气象站月值气象数据进行分析(图1),数据来源于中国气象数据网(http:∥data.cma.cn)。根据各站资料的代表性长度,本文的研究序列采用1960—2018年。同时,为了进一步验证降水量的大小对插值精度的影响[18],本文选取多年平均降水量、月降水量,降水量最大的3个月(5—7月)及年降水量最小的3个月(12月至翌年2月)进行计算。错误或缺测的数据采用其他年份同期的平均值代替;空间插值时,若附近站点数据同时缺失,则采用该站多年平均值进行插补[19]。并对降水数据的准确性进行验证。
图1 贵州省气象站分布
空间自相关是按照空间赋值状况测量各变量值之间的相关关系,若同一研究区内的观测数据在空间上相互靠近,则可描述为相关;反之,则为独立或随机分布。空间临近区域单元的相似程度可根据来Moran′sI判断,来Moran′sI取值范围为-1~1,值越接近-1代表单元间属性值差异越大,值越接近1代表单元间属性值关系越密切,相关性越高,性质越相近,值接近0代表单元间属性值不相关[20]。本文基于ArcGIS相关工具,采用反距离加权的欧几里得距离法(Euclidean Distance),算得59 a年均降水量Moran′sI值为0.33,说明贵州省降水数据具有的空间自相关性。
在数据分析之前,运用平方根、对数、立方根等变化对数据进行预处理,可使数据更趋于正态分布会提高气象数据的插值精度[21]。因此,本文对原始数据和对数、平方根、立方根3种数据变化进行标准偏度系数分析,偏相关系数结果见表1:4种数据的偏度系数均为负值,说明不对称部分的分布呈负偏态,且原始数据的偏相关系数更接近0,即原始数据的偏相关系数比对数、平方根和立方根变化的数据更趋于正态分布,因此采用降水原始数据进行空间插值分析。
表1 降水量偏相关系数
反距离权重法(IDW)是一种常见而简便的空间插值方法,根据插值点与样本点间的距离为权重进行加权平均,离插值点越近的样本点赋予的权重越大,IDW通过对邻近区域的每个采样点值平均运算获得内插单元值,其表示公式为:
(1)
式中:Z(x0)为x0处的估计值;n为预测点周围参与预测的站点数量;z(xi)为xi处实测值;di0为预测点x0与已知样点xi之间的距离;p为距离的幂。在日常研究中,普遍采用的是令p=2的反距离平方加权法,在ArcGIS中;p的值默认也为2,故本文将空间插值时将p的值设为2。
克里金插值法(Kriging)又称空间局部插值法,它不同于反距离权重插值和样条函数插值,前两种插值是确定性的插值,克里金插值是基于统计学的插值方法,以变异函数理论和结构分析为基础[22],在有限区域内对区域化变量进行无偏最优估计的一种方法。这种方法不但能够量化已知点之间的空间自相关性,而且能够说明站点在预测区域范围的空间分布。本文采用普通克里金插值法(OK),其计算公式为:
(2)
式中:Z(X0)为X0处的估计值;λi为权重系数;n为雨量站点个数;Z(xi)为xi处的实测值。
样条函数插值法(Spline)的原理是采用函数逼近曲面,进而推算出整个研究区的降水量分布[23],适用于非常平滑的表面,一般要求有连续的一阶和二阶导数,该方法的优点是保留了局部地形的细微特征,生成一个平滑、渐变的拟合曲面,具有较好的保凸性和逼真性[24-25]。本文采用基于ArcGIS的规则样条法进行插值,其计算公式如下:
(3)
式中:Z(X0)为X0处的估计值;n为雨量站点个数;λi为线性方程组求解确定的系数;di0为预测点x0与已知样点xi之间的距离;x,y分别为区域上的横、纵坐标数值;R(di0)是以di0为自变量的方程式;T(x,y)是以x,y为自变量线性方程组;di0与T(x,y)的公式见参考文献[26]。
趋势面插值法(Trend)是采用全局多项式回归方法,它可以作为长距离渐变特征的描述方法[11],将由数学函数定义的平滑表面与输出采样点进行拟合,得到研究区域表面渐进趋势的平滑表面。使用的多项式越复杂,其赋予的物理意义也越复杂[22]。本文采用基于ArcGIS的线性趋势面插值法,其计算公式如下:
(4)
式中:Z(X0)为残差平方和;n为雨量站点个数;εi为残差值;Z(xi,yi)为实测数据;Z′(xi,yi)为趋势面拟合值。
本文采用留一法交叉验证不同插值方法的精度,研究中将17个站点随机排列,依次假设其中一个站点的降水量未知,用其余16个站点的降水量进行插值,得到所有站点的降水量估计值,最后计算每个站点观测值与估计值的误差。
本研究采用平均绝对误差(mean absolute error,MAE),均方根误差(root mean squared error,RMSE)和平均相对误差(mean relative error,MRE)作为4种插值方法的评价指标。平均误差总体反映估计值误差的大小,MAE可反映估计值可能的误差范围,RMSE反映估计值的灵敏度和极值效应,MRE能更直观地反映出测量值与计算值的差距。MAE,RMSE,MRE值越小,表示表面插值误差越小[10],精度越高,模拟效果也越好。
(5)
(6)
(7)
式中:Zx和Zy分别代表降水量实测值和预测值;n为测站数。
通过交叉验证对4种方法插值的MAE,MRE和RMSE的对比分析(图2),结果表明:月降水量的MAE的排序为IDW>Trend>Spline>OK,其值依次为13.59,12.41,11.83,10.72。MRE和RMSE的排序与MAE的排序一致,MRE的值分别为0.15,0.13,0.13,0.12,RMSE的值分布为15.83,15.12,14.56,13.50。4种方法的MAE,MRE和RMSE的变化都呈现出明显的季节性,MAE和RMSE整体表现为秋冬两季低于春夏两季,从1月到7月,MAE和RMSE的值呈上升趋势,7月至12月呈下降趋势。MRE月值变化情况较为特殊,表现为冬季和夏季较高,春季和秋季较低。根据MAE,MRE和RMSE的结果可知,4种插值方法在贵州省普遍得到精度较高的空间降水信息,MAE和RMSE的误差春夏两季低于秋冬两季,MRE的误差在春季和秋季较低。总体来看,4种插值方法误差值排序为IDW>Trend>Spline>OK,即OK法的3项评价指标值最低,可得贵州省月降水插值来说OK法的降水插值结果精度最高。故对这一结果作进一步的分析发现(表2),通过4种插值方法获得的贵州省近59 a的月平均降水量基本一致,标准差、变差系数和偏差系数都是OK法插值数值最小,充分说明普通克里金插值精度最好[27]。
图2 4种插值方法对贵州省1960-2018年降水的MAE,MRE和RMSE对比分析
表2 月降水4种插值效果的比较结果
贵州省近59 a的月均降水量为96.27 mm,春季、夏季、秋季、冬季的平均降水量分别为101.14 mm,182.90 mm,77.87 mm,23.17 mm,从高到低排序为夏季>春季>秋季>冬季,秋冬两季的降水量少,4种方法在秋冬两季的MAE和RMSE值均较小,夏季降水起伏较大,使得MAE和RMSE的值较大,采用空间插值方法不能有效地模拟降水情况。可看出月降水量的变化趋势与MAE和RMSE的走向大致一样,可推测随着降水量的增加,MAE和RMSE值也会增加。
从表3可以看出,对于贵州省而言,年均降水量插值精度最高的是Spline样条函数插样法,其MAE,MRE,RMSE分别为89.31 mm,7.77%,105.69 mm;其次为普通克里金插值OK法,其MAE,MRE,RMSE分别为95.20 mm,8.42%,116.99 mm;插值精度最低的是趋势面法,Trend法的MAE,MRE,RMSE分别为109.64 mm,9.49%,126.77 mm,即对于年降水来说,4种方法在MAE上的排序为Trend>IDW>OK>Spline,在MRE,RMSE的排序为IDW>Trend>OK>Spline;最大3个月平均降水插值中,MAE上的排序为IDW>OK>Trend>Spline,MRE,RMSE上的排序为IDW>Trend>OK>Spline;最小3个月平均降水量的插值中,MAE,RMSE上的排序为IDW>Spline>Trend>OK,MRE上的排序为IDW>Spline>OK>Trend。
表3 不同空间插值方法精度的比较
综合MAE,MRE,RMSE,整体来说,在贵州省年降水和最大3个月平均降水量的插值中,Spline的3种评价指标值均最小,IDW的指标值最大,说明Spline法的插值效果最好,IDW法的效果较差,即Spline>OK>Trend>IDW,最小3个月平均降水量插值方法精度OK>Trend>Spline>IDW。
通过对17个站点的年均降水数据分别采用不同的插值方法生成降水表面栅格图(图3),插值结果的参数均为系统默认参数。从图中可以看出:4种插值方法整体上反映出,贵州省多年平均降水量的空间分布纬度地带性比较明显,大体呈自南向北递减的规律。贵州省年均降水量为891~1 359 mm,降雨量最高区域主要位于西南部,水量在1 250 mm以上,安顺~盘县一带达到了最高值,为1 358.85 mm。东北部的铜仁市是贵州省的次降水中心,年降水量在1 200 mm左右。中部的贵阳到湄潭、黔东南的三穗的降水量为1 100~1 200 mm之间。最低区位位于毕节地区,威宁—毕节一带降水量在1 100 mm以下,极易发生干旱现象[16]。
图3 多年平均年降雨量空间分布插值结果
4种方法的年降水量插值结果显示:Trend法的插值效果最差,从南到北,降水量均匀递减,降水量等值线呈平行线,较为笼统,未能体现气象站降水分布的区域性特征。IDW,OK和Spline法插值结果比较相似,降水低值中心位于毕节地区,降水区域主要在西南部的安顺—兴义—盘县、南部的独山、东北部的铜仁一带,IDW法明显受到站点的影响[28],OK法的插值结果不太均匀,存在突变异常值,Spline法兼顾插值曲面的准确性与平滑度,其插值结果较为均匀,在空间分布上符合贵州省的实际情况,空间插值较好。
(1) 贵州省月降水量插值结果的MAE,MRE和RMSE的变化都呈现出明显的季节性,降水量从高到低排序为夏季>春季>秋季>冬季,在秋冬两季降水量较少,MAE和RMSE值均较小,夏季降水起伏较大,使得MAE和RMSE的值较大;MRE月值变化情况较为特殊,表现为冬季、夏季较高。4种插值方法误差值排序为IDW>Trend>Spline>OK,OK法的插值结果较好,随着降水量的增加,模拟的降水量插值情况越差。
(2) 综合MAE,MRE,RMSE,整体来说,在贵州省年降水和最大3个月平均降水量的插值中,Spline的3种评价指标值均最小,IDW的指标值最大,说明Spline法的插值效果最好,IDW法的效果较差,即Spline>OK>Trend>IDW,最小3个月平均降水量插值方法精度OK>Trend>Spline>IDW。
(3) 插值结果整体上反映了贵州省降水量由南向北减少的特点,IDW,OK和Spline法插值结果的最大值和最小值情况基本一致,年降雨量最高区域主要位于西南部,东北部的铜仁市次之,毕节地区降水最少。相比之下,采用Spline时插值结果的降水量出现渐变平滑条带现象,其插值结果较为均匀准确,在空间分布上符合贵州省的实际情况,空间插值较好。
4种常见雨量插值模型误差呈现出不同的时空分布特性,总体而言,对于贵州省来说,Spline方法适用于降水量较大的时期和区域,OK方法则适用于降水量较小的时期和区域,在选用时可以综合考虑。为取得更好的插值精度,可进一步引入海拔、坡向、坡度等因子。另外,插值软件本身的局限性在短时间内很难突破,本文所用的气象台站不多,为进一步提高插值精度可尽可能多的增加观测点的数量[29],如增加邻省或县市级台站等。在大尺度的研究中,还可引入经度、纬度、海拔等因子进行模拟,采用分区域插值法相结合进一步提高插值精度。