王 宁,刘万青,姚志宏,刘春春
(1. 西北大学城市与环境学院,陕西 西安 710127; 2. 华北水利水电大学资源与环境学院,河南 郑州 450046)
数字高程模型(digital elevation model,DEM)是利用有限的地形高程数据实现对地形曲面的数字化模拟,即通过数字化的形式来表达区域海拔高程[1]。随着新的空间测量技术的出现,DEM的生产技术得到了快速的发展,为数字地形分析提供了充足的数据保障。地形因子作为各类土壤侵蚀评估模型的重要变量,其提取的精度受DEM数据源的直接影响,在很大程度上也反映出DEM的数据质量。目前,对不同数据源DEM的质量评价主要集中在SRTM(shuttle radar topography mission)和ASTER GDEM(advance space borne thermal emission and reflection radiometer global digital elevation model)两方面[2-4],选取样本点与对应的高精度高程值进行相关性分析和统计计算[5]。Avtar等[6]将TanDEM-X DEM和其他不同数据源的DEM进行相关性分析和统计计算,得出TanDEM-X DEM具有更高的精度。Manas等[7]通过计算SRTM高程与对应点的GPS实测高程的均方根误差(RMSE)并进行线性回归分析,得出SRTM X波段的高程数据具有更高的精度。而对地形因子的研究也仅局限在同一DEM数据源,利用较高分辨率的DEM进行重采样,生成一系列低分辨率的DEM进行对比分析[8-9]。本文利用由资源三号立体像对构建的DEM、30 m和90 m分辨率的SRTM及两个版本30 m分辨率的ASTER GDEM 5种不同数据源的DEM,分别提取马家沟流域的坡度和坡长因子,将结果分别与由1∶10 000数字地形图生成的5 m分辨率的DEM进行对比分析,探讨不同数据源的DEM数据与实地地形因子间的关系,以及不同数据源间DEM的质量。
研究区位于陕西省延安市安塞县马家沟流域,如图1所示。该流域地处黄土丘陵沟壑区的第二副区、半干旱森林草原地区,海拔1 048.74~1 495.91 m,地面相对起伏440多米,地面坡度差异55°。该流域沟壑纵横,地表破碎复杂,水土流失明显,选取该区域对地形因子进行分析更能凸显本文研究的目的。
图1 研究区位置及采样点位置
本文选取了5种不同数据源生成的DEM:资源三号卫星数据生成的DEM,30 m SRTM DEMX30、90 m SRTM DEMC90、30 m ASTER GDEMv1和30 m ASTER GDEMv2。另外利用1∶10 000数字地形图生成的5 m分辨率的DEM作为参考DEM。
利用ENVI 5.3软件的DEM Extraction模块处理资源三号数据生成DEM,左右影像分别选择正视和后视影像,地形细部等级为6,地形地貌级别为高,其他具体生成参数见表1。
表1 ZY3-DEM生产参数
定义如图1所示的选点方式作为采样点进行DEM精度评定和地形因子提取对比分析。评价方法选用独立样本T检验和相似性综合评价指标(SI),独立样本T检验仅反映了两组数据的均值与其所代表的总体差异显著程度,并没有将数据的离散程度考虑在内,而SI指数综合样本数据组的均值和标准差,进行定量化评价,有效解决了对样本数据组进行相似性评价的问题。
(1) 独立样本T检验:检验两个样本平均数与其所代表的总体差异是否显著。
(2) 相似性综合评价指标:反映两个样本数据的相似性。
式中,MEi和MEr,SDi和SDr分别为第i组及参考数据组的均值和标准差;n为组数。SI值越小,表示样本数据的相似性越高。
图2所示为由资源三号卫星立体像对提取的ZY3-DEM1、ZY3-DEM2、ZY3-DEM3和ZY3-DEM4。
在图1的样点选取方式下,评价资源三号数据生产的DEM质量,结果见表2。
结果表明,ZY3-DEM1均值1 250.79 m,p-value<0.01,与参考DEM有极显著的差异;ZY3-DEM3均值为1 205.05 m,p-value=0.48(>0.05),与参考DEM相似性最高,ZY3-DEM4次之。从SI值的计算结果也能直接体现试验数据与参考数据的相似性程度,计算结果真实具有说服性。
图2 由资源三号数据生成的DEM
参数参考DEMZY3-DEM1ZY3-DEM2ZY3-DEM3ZY3-DEM4ME/m1210.221250.791202.251205.051203.06SD/m78.8778.3078.1478.0476.44SI00.790.290.270.65T-test(p-value)—<0.010.270.480.32
为进一步验证资源三号数据结果的质量及SI指数的可靠性,利用高分二号遥感卫星数据对试验样区进行土地利用分类,对分类后样点计算SI指数,结果如图3所示。
结果表明:有控条件下DEM质量比无控条件下DEM质量好;ZY3-DEM1、ZY3-DEM2和ZY3-DEM4在不同土地利用类型中SI指数差别不明显,但ZY3-DEM1数据质量最差,结果符合实际情况,与马保东等[10]学者研究结果相同;ZY3-DEM3的SI指数在不同土地利用类型中差别明显,反映出对裸地具有较高质量的描述。试验结果真实符合实际,再次证明了以SI指数评价样本数据组相似性是可靠的。
图3 不同土地利用类型下资源三号DEM相对于参考DEM高程的SI指数
提取不同数据源的坡度,结果如图4所示,并对采样点结果进行统计分析(见表3)。
图4 不同数据源的坡度
结果表明,基于不同数据源的坡度提取结果基本格局相似,但基于资源三号数据提取结果更为细腻,SRTM DEMC90最为粗糙。从统计特征上分析,基于资源三号DEM数据提取的坡度结果SI指数相差不大,体现出了与参考DEM更高的相似性。其次为SRTM DEMX30,数据质量优于ASTER GDEMv2和SRTM DEMC90,与杜小平等[11-12]学者研究成果相符,再次验证了SI指数的可靠性。ASTER GDEMv2较ASTER GDEMv1有更为明显的相似性,但相对于参考DEM,坡度均值衰减也达到了8.64°,将对地形因子的计算产生明显的影响。
表3 DEMs与DEMr的坡度对比
为了更详细地描述各数据源坡度结果之间的差异,进一步对提取结果进行不同高程分组和不同土地利用类型下的SI指数统计,结果如图5所示。
结果表明:10 m分辨率的资源三号数据在低于1300 m的海拔高度及在不同的土地利用类型分组条件下对坡度的描述具有明显的优势,但4 m分辨率的资源三号数据在不同的分组条件下对坡度的描述差异较大,表明由资源三号数据生产DEM并非分辨率越高数据质量越好;其次SRTM DEMX30和ASTER GDEMv2数据相对于现有常用DEM而言,具有一定优势。
本文提取的坡长指的是流域分布式土壤侵蚀学坡长,利用D8算法(最大坡降算法)[13-15]进行计算,结果如图6所示,对采样点结果进行统计分析,得到坡长对比结果,见表4。
图5 不同分组条件下各DEM相对于参考DEM坡度的SI指数
图6 不同数据源的坡长
DEMMin/mMax/mME/mSD/mSIT-test(p-value)参考DEM5.00218.9939.8938.150—ZY3-DEM15.00249.7134.9939.110.020.17ZY3-DEM25.00238.9941.4844.900.030.68ZY3-DEM35.00270.2143.5547.560.050.36ZY3-DEM42.5993.8416.7115.630.16<0.01ASTER GDEMv115.00670.96119.8290.270.45<0.01ASTER GDEMv215.00789.41123.30112.050.54<0.01SRTM DEMX3015.46416.9963.4458.920.15<0.01SRTM DEMC9045.00606.84142.62114.470.61<0.01
结果表明:参考DEM和资源三号数据的计算结果表面结构最为相似,但参考DEM的结构更为精细;而基于SRTM和GDEM数据的结果明显偏大,与参考DEM数据结果差异明显,坡长表面结构不清晰,对相关的土壤流失程度计算会产生明显的影响。统计结果进一步表明10 m分辨率下的资源三号数据结果与参考数据相似程度最高,增加控制点个数并没有对坡长的结果产生较为明显的影响。而在现有应用最广泛的DEM数据中[2],SRTM DEMX30的坡长结果与参考DEM的结果较为接近,且坡长随着数据源分辨率的降低有明显增大。
为了进一步描述各数据源坡长结果之间的差异,对采样点结果进行不同高程分组和不同土地利用类型下的SI指数的统计,结果如图7所示。
图7 不同分组条件下各DEM相对于参考DEM坡长的SI指数
统计直方图表明:10 m分辨率的资源三号数据在低于1300 m的海拔高度下及在不同的土地利用类型分组条件下对坡长描述较好,但ZY3-DEM4在不同的分组条件下对坡长描述差异大,进一步证明由资源三号数据生产的DEM质量并非随分辨率提高而变优;其次,在1000~1100 m的低海拔及土地利用类型为裸地的坡长结果中具有一定优势,虽然ASTER GDEMv2坡长整体评价结果与参考DEM相差明显,但在1000~1100 m的低海拔高程范围中,依然具有较高的数据质量。
本文利用研究区1∶10 000数字地形图生成的DEM作为参考数据,分析了资源三号、SRTM和ASTER GDEM数据在高程、坡度和坡长等方面的精度差异,并得出以下结论:
(1) 由资源三号数据在有控制点条件下生产的10 m分辨率的DEM表现出与参考DEM最高的相似性;通过增加控制点的个数并没有明显提高DEM数据质量;提高数据生产的分辨率非但没有提高DEM数据质量,反使之降低,表明资源三号数据生产的DEM有最适分辨率范围,有待深入研究。
(2) 由资源三号10 m分辨率DEM数据提取的坡度和坡长地形因子在海拔1300 m以下和不同的土地利用类型分组中凸显优势;SRTM DEMX30结果次之,尤以1000~1100 m及土地利用类型为植被的区域内质量最高;ASTER GDEMv2提取的坡度结果均值衰减程度较大,达到8.64°,相比坡度而言,SRTM和ASTER GDEM提取的坡长与参考数据差异更明显,结果表面结构异常模糊;本文对其他地形影响因素尤其是坡向因素对数据质量的影响有待更为深入地分析。
(3) 建立了基于多组数据进行总体相似性评价的指标SI指数,能够对试验结果进行定量化描述,直观反映数据组之间的联系,结果可靠,符合实际情况。
本文揭示了不同海拔高程下及不同土地利用类型对不同数据源数据质量的影响,可对进行数字地形分析的数据选取及数据质量评估等提供借鉴,对土壤侵蚀及水土保持研究有重要参考意义。