重采样方法对DEM数据质量的影响

2016-10-10 03:08龙永清杨勤科
水土保持通报 2016年4期
关键词:格网比率基准

王 雷, 龙永清, 杨勤科

(1.西北大学 城市与环境学院, 陕西 西安 710127; 2.中国科学院 水利部 水土保持研究所, 陕西 杨陵 712100)



重采样方法对DEM数据质量的影响

王 雷1,2, 龙永清1, 杨勤科1,2

(1.西北大学 城市与环境学院, 陕西 西安 710127; 2.中国科学院 水利部 水土保持研究所, 陕西 杨陵 712100)

[目的] 针对在数字地形分析的实际应用问题,利用重采样方法得到的DEM数据精度,旨在分析不同的重采样方法对所获得的DEM数据质量的影响。 [方法] 从数据误差的角度,以陕西省绥德县窑家湾沟流域的以全数字摄影测量得到的DEM数据为基准,计算并比较利用重采样方法得到的DEM的数据误差。 [结果] 无论采用何种重采样方法,得到DEM数据质量均未得到提高,其高程误差的空间分布与重采样方法相关,地形变化剧烈的地方,误差较大;中误差的大小则取决于重采样方法与原始格网尺寸。 [结论] 最近邻法得到的重采样DEM数据的中误差最高,三次立方卷积法的最小,双线性内插法则略高于三次立方卷积法。

数字高程模型; 重采样; 中误差

文献参数: 王雷, 龙永清, 杨勤科.重采样方法对DEM数据质量的影响[J].水土保持通报,2016,36(4):72-77.DOI:10.13961/j.cnki.stbctb.2016.04.013

重采样方法是一种重要的栅格数据处理方法,在遥感数字图像处理和地理空间分析中都有着广泛的应用。在基于数字高程模型(DEM)的数字地形分析及与地形相关的空间分析(如水文,光照模拟等)当中,重采样方法常常被用来改变DEM的数据格网尺寸,获取新的格网尺寸的DEM,用以讨论尺度变化对分析结果的影响[1-7]。尽管重采样方法在基于DEM的空间分析中广泛得到应用,但这种方法对于DEM数据质量和分析结果的影响并未得到充分的重视。Dixson和Earls[7]就指出,如果缺乏对重采样方法的正确理解,那么模型分析的结果就缺乏实践意义。对于这一问题,一些研究者也从不同角度对重采样方法对地形分析的结果的影响进行讨论。陈永刚等[8]分析了最近邻法,双线性内插和三次立方卷积3种重采样方法的误差的空间分布特征,以及采样方法和坡度对重采样误差的影响,认为双线性内插和三次立方卷积差异并不显著,且优于最近邻法;苟卫涛等[9]在进行实际生产时,分析了使用重采样方法进行格网起算点位置平移时的精度损失,认为需要根据不同地形类别具体选择不同的重采样方法;王宇等[10]则讨论了使用重采样后的DEM提取的坡度,剖面曲率的信息损失。Dixson和Earls[7]在讨论重采样方法对于SWAT模型模拟结果的影响分析中得出,重采样方法得到的DEM与具有相同格网尺寸,但是直接获取的原始DEM的模拟结果具有较大的差异,并指出重采样前的原始分辨率的DEM的影响,无法通过重采样的方法抵消。在具体应用当中,出于研究目标的差异,用重采样方法改变DEM格网尺寸,既有从精细的小格网尺寸向较粗的大格网尺寸转变的(Upscaling)做法[1,4-6];也有反过来从大格网尺寸向小格网尺寸转变的(Downscaling)[2-3];甚至有二者兼有的[7]。对于第一种做法,Usery[6],Dixson和Earls等[7]在其研究中都已指出,随着格网尺寸的增大(分辨率降低),DEM的质量下降,模型输出结果可靠性降低。陈楠[1]、吴险峰[4]、张勇[5]、王宇[10]等研究结果也基本上符合这一结论[1,4-5,10]。在实际应用中采用第二种做法,即通过重采样方法降低DEM格网尺寸,往往是为了使DEM数据与其他栅格数据的格网尺寸一致[2-3],但这种做法会对DEM的质量及模拟结果产生的何种影响考虑较少。另一方面,在具体采用哪种重采样方法的问题上,不同的研究者的结论也不尽相同[8,11]。为了能够更好地理解重采样方法对于DEM数据的影响,本研究希望能够从数据误差的角度,以全数字摄影测量的方法获取的高精度的DEM数据为基础,分析在利用重采样方法降低格网尺寸的过程中,原始DEM数据会如何改变,并会对数据结果造成怎样的影响。

1 研究区域与基础数据

1.1研究区域

研究区域位于陕西省绥德县城西北的清水沟流域,主要包括该流域的3个子流域。窑家湾沟的全部、东西两侧的野狐子沟和折家峁沟的大部分,总面积约1.9 km2,最大高程差约为203 m。试验区内地形复杂,仅在梁峁顶部相对平缓,大部分梁峁顶部修筑有梯田,并有少量坡耕地。在3个沟道内发育有各种规模冲沟,切沟、浅沟等。侵蚀强烈,沟坡陡峭,其中坡度大于25°以上的面积约占试验区总面积的66.1%,根据现行航测规范GB/T7931-2008和GB/T7930-2008的规定[12-13],属于高山地地形类别。

1.2试验数据

基础数据是利用19幅航摄比例尺为1∶4 000,扫描分辨率为25 μm,地面分辨率约为0.1 m的彩色航摄像片,采用全数字摄影测量的方法得到的比例尺1∶1 000,1 m格网尺寸的DEM。在航摄外业控制测量过程中及精度要求依据GB/T7931-2008[12],采用GPS-RTK方式,采用全野外布点方式布设并测量了49个像控点/平高控制点;在航摄内业加密建模之后,进行矢量地形数据采集,包括等高线,地形特征线,特征点。基本等高距为1 m,内业作业依据为GB/T7930-2008[13]。保证每个格网点均切准于立体模型,按点编辑模式采集DEM格网点数据,格网尺寸为1 m,格网点高程精确至小数点后两位。为保证数据精度,实际DEM生产精度要求按CH/T9008.2-2010中山地一级DEM数据精度要求执行[14]。

2 研究方法

2.1基准数据获取

为了能够研究重采样方法在改变DEM格网尺寸过程中的影响,首先要获取一组具有不同格网尺寸的DEM数据,用以作为基准的参考数据,而这一组数据不能由重采样方法生成。具体做法为:对利用全数字摄影测量得到的研究区1 m格网尺寸的DEM数据进行直接抽稀采样,即按一定的间距从1 m的DEM数据上提取各种格网尺寸的格网高程数据,这相当于直接从立体模型上按一定格网间距量测生成不同格网的DEM数据。这一组数据全部来自于立体量测模型,其数据不包含DEM内插方法带来的系统误差,仅包含测量误差(因本研究讨论重采样方法的影响,将测量误差忽略不计),可将其视为基准值。按照上述方法,先按1 m间隔递增,得到格网尺寸从1~10 m的DEM数据10个,然后按照5 m间隔递增,得到格网尺寸从15~100 m的DEM数据18个,总共得到基准DEM数据28个。

2.2依据尺度比率重采样

在上述基准数据的基础上,可对每个数据按一定的尺度比率进行缩小及放大重采样。共定义2组共18种尺度比率,一组为缩小尺度:1/10,1/9,1/8,1/7,1/6,1/5,1/4,1/3,1/2;另一组为放大尺度:2,3,4,5,6,7,8,9,10。根据上述尺度比率对急转数据进行重采样。如对100 m格网尺寸的DEM,可以按1/2的尺度比率缩小,即重采样为50 m的DEM;也可根据1/5的尺度比率缩小,重采样得到20 m的DEM。尺度放大过程与之类似。由于要将重采样数据系列与基准数据进行对比,因此不是每个数据都能按上述尺度比率缩小或放大。如10 m尺寸的基准数据,按1/3的比率缩小或按1/4的比率缩小,格网尺寸为约3.33和2.5 m,在基准数据系列里没有对应尺寸的数据,因此对于10 m尺寸数据缩小的格网尺寸话,只能使用1/2,1/5,1/10这3种尺度比率,而对于10 m数据放大格网尺寸的话,则可从使用全部放大尺度。

在按尺度比率进行重采样时,利用ArcGIS软件提供的3种主要的重采样方法:最近邻法(Nearest),双线性内插(Bilinear)和三次立方卷积方法。这样每一个基准DEM在按一定尺度比率重采样到一定的格网尺寸时,都会得到3个对应的重采样DEM。按照上述方法,一共提取了按照不同重采样方法得到的不同格网尺寸的重采样DEM数据390个(每种重采样方法放大及缩小各65个)。

2.3重采样数据的误差计算

在获取上述重采样数据与基准数据的基础上,可以利用栅格计算的方法,将重采样得到的DEM数据,减去对应的与其具有相同格网尺寸的基准DEM,即可得到重采样DEM在该格网尺寸水平上每一格网的误差值及其空间分布。即:误差DEM =重采样DEM-基准DEM。共计得到390个DEM误差数据。在误差DEM的基础上,为了能够进一步评判重采样后的DEM数据的整体质量,可利用我国目前评价DEM数据质量的主要方法,即计算重采样DEM数据中误差(RMSE)。中误差计算公式为:

(1)

式中:ZK——重采样DEM数据的格网高程;zk——对应的基准DEM数据高程(K=1,2,…,n)。根据公式(1),上述利用栅格计算得到的误差DEM的每一格网上的值即为ZK-zk。通过逐格网统计误差DEM数据的值,代入公式(1),即可得到每一个重采样DEM的中误差的值(RMSE)。

3 结果与讨论

3.1重采样DEM数据的误差的空间分布

图1为用25 m的基准DEM重采样至5 m时,3种重采样DEM与5 m基准DEM的差值DEM。图2为使用5 m的基准DEM重采样至20 m时,3种重采样DEM与20 m基准DEM的差值DEM。根据图1—2所反映的误差分布状况,对于双线性内插和三次立方卷积方法而言,误差较大的地方主要分布在谷底线、坡脚线,山脊线,沟沿线等地形发生较剧烈转折的地方。通常是在谷底线,坡脚线等地形出现凹形转折的地方得到正误差,而在沟沿线,山脊线等地形出现凸形转折的地方得到负误差(图1—2)。出现这样的误差分布状况的根本原因是由于这两种重采样方法所采用的数学函数曲面要比实际地表光滑,在凹形地形区,重采样高程要比实际地形高,而在凸形地区,则恰好相反。而对于最近邻法而言,当缩小格网尺寸时,在上坡的方向,采样后的值采用了原来位于较低位置的中心栅格的值,比实际值低,因此得到负误差,而在下坡方向则相反,为正误差(图1);当放大格网尺寸时,当放大尺度比率为奇数时,重采样后的值使用中心栅格的值,这与具有相同格网尺寸的基准DEM的值相同,计算得到的误差值为0;而放大尺度比率为偶数时,重采样的栅格值,在ArcGIS中采用的是右下方向的栅格值,这就造成在这一方向上,东南坡向上重采样后的值小于实际值,为负误差,而西北方向为正误差(图2)。

3.2重采样DEM数据的中误差分析

图1—2反映了重采样后DEM数据的误差值的大小和空间分布,对于重采样数据的误差总体情况则要通过中误差(RMSE)来分析。图3—4即反映了按尺度比率缩小与放大时,重采样前的原始格网尺寸,尺度比率与中误差的关系。从图3可以看出,按尺度比率进行缩小格网尺寸重采样后,当重采样前的格网尺寸一定时,重采样后的格网尺寸无论多小,其中误差水平基本上是稳定的。例如:利用30 m的基准DEM数据进行双线性内插法重采样,无论是将格网尺寸缩小1/2(15 m),1/5(6 m),1/6(5 m),还是缩小1/10(3 m),得到的重采样后的DEM的中误差均约在3.7 m左右,而使用最近邻法和三次立方卷积法则分别约为6.6和3.4 m。当按尺度比率进行放大格网尺寸重采样时(图4),则有两种情况:当按偶数倍比率放大时,也有类似缩小格网尺寸时的规律。如利用双线性内插法将5 m的基准DEM数据的格网尺寸放大2,4,6,8,10倍时,得到重采样后的DEM数据中误差稳定在0.85 m左右。最近邻法和三次立方卷积则分别为1.85和0.79 m;当按奇数倍比率放大时,由于使用ArcGIS提供的3种重采样方法,其重采样得到的数据均为中心栅格的点,与原始基准数据相同,因此计算出的误差数据均为0。例如将1 m的基准数据放大3倍时,重采样后格网尺寸为3 m,一个格网相当于原先3×3个格网大小,无论使用哪种重采样方法,格网的值均被直接赋为3×3个格网中的中心格网的值,相当于在基准数据上直接取值,这样得到的误差数据和中误差都为0(图4)。而当放大偶数倍时,则要重新计算格网高程,因此,可以得到误差数据。对于利用重采样方法进行格网尺寸缩小,重采样后的格网高程均需要重新计算,因此不存在上述问题(图4)。图3—4的结果说明,重采样以后得到的DEM数据的高程中误差,基本上只与重采样前的原始数据的格网尺寸相关。原始数据的格网尺寸越大,其重采样以后得到的DEM数据的高程中误差就越大。当原始DEM的格网尺寸及重采样方法确定以后,无论其重采样后的格网尺寸有多大,其误差水平基本是稳定的。这就是说,通过重采样得到的DEM,其数据质量实质上由重采样前的原始数据质量决定。一旦原始DEM的格网尺寸确定,无论采用哪种重采样方法改变DEM格网尺寸,也不论重采样后的格网尺寸大小,均不能改变DEM数据质量,特别是对于试图利用重采样方法减小格网尺寸,并不能得到更高质量的所谓“精细”DEM。

图1 基于25 m基准DEM数据,重采样得到5 m格网尺寸DEM与5 m基准DEM的差值DEM

图2 基于5 m基准DEM数据,重采样得到20 m格网尺寸DEM与20 m基准DEM的差值DEM

3.33种重采样方法的比较

通过对图3—4中3种重采样方法得到的数据中误差水平进行比较,3种重采样方法得到数据的误差水平并不一致。

如上所述,利用30 m的基准DEM,重采样减小格网尺寸,最近邻法得到的中误差最大,约为6.6 m;三次立方卷积法得到的中误差最小,约为3.4 m;而双线性内插略高于三次立方卷积,约3.7 m。而利用重采样方法放大格网尺寸,也有类似的规律。同时,无论重采样前的格网尺寸大小,均有上述规律。即:三次立方卷积方法得到的DEM数据精度最高,且仅略高于双线性内插方法,而最近邻法得到的DEM数据精度最低。这一结果与张祖勋[15]对重采样方法进行遥感影像灰度内插的误差分析结果一致。综上所述,利用重采样方法改变DEM格网尺寸,并不能改善DEM的数据质量。其原因在于,当原始DEM数据确定的情况下,利用重采样方法内改变格网尺寸得到新的DEM数据,其实质为利用原始DEM格网点作为采样点进行内插。当原始数据的格网尺寸确定后,内插得到的值实际上就是由参与内插的原始DEM格网点的值确定的,其误差水平就与内插后的格网水平无关,而仅与重采样方法相关。不同的重采样方法,其内插时假设的数学函数不同,因此其误差水平就有不同。

图3 利用三种重采样方法缩小格网尺寸时,原始格网尺寸、尺度比率与高程中误差关系

图4 利用三种重采样方法增大格网尺寸时,原始格网尺寸、尺度比率与高程中误差关系

4 结 论

根据上述试验结果,在利用DEM进行数字地形分析时,对于利用重采样方法改变DEM格网尺寸,并以此为依据进行的有关DEM数据尺度分析,其方法和结果均需要进行认真谨慎地分析。从数据误差的角度来看,首先,重采样方法得到的DEM数据,其误差的空间分布规律总体来讲为,地形变化较为剧烈的地方,误差较大,但不同的内插方法也会对误差的空间分布有影响,特别是最近邻法影响较大。其次重采样得到的DEM数据精度与原始DEM数据格网尺寸紧密相关,原始数据的格网尺寸越大,其重采样以后得到的DEM数据的高程中误差就越大。在重采样方法确定的情况下,重采样得到的DEM的数据质量实质上由重采样前的原始数据决定。第三,不同的重采样方法得到的DEM数据误差水平也不相同。最近邻法得到的DEM数据精度最低,三次立方卷积法得到的数据精度最高,但也仅仅是略高于双线性内插。综上所述,在使用重采样得到的DEM数据时,需要充分考虑重采样前的原始数据质量,重采样方法以及分析结果在空间分布上的可靠程度。同时要认识到,重采样得到的DEM的数据质量,其数据质量不会比重采样前的原始数据有实质性的提高。特别是对于在实践中希望利用重采样方法派生出的所谓的“高分辨率”的DEM的做法是不可行的。

致谢:对在本研究中基础数据获取的过程中,陕西测绘局国家第一航测遥感院的王伟丽、王小燕、王劲、薛争光等同志提供的帮助和支持,表示衷心的感谢。

[1]陈楠,王钦敏.基于地形因子信息量的数字高程模型分辨率的选择:以黄土高原的研究为例[J].武汉大学学报:信息科学版,2009,34(6):692-695.

[2]陈燕,汤国安,齐清文.不同空间尺度DEM坡度转换图谱分析[J].华侨大学学报:自然科学版,2004,25(1):79-82.

[3]邓仕虎,杨勤科. DEM采样间隔对地形描述精度的影响研究[J].地理与地理信息科学,2010,26(2):23-26.

[4]吴险峰,刘昌明,王中根.栅格DEM的水平分辨率对流域特征的影响分析[J].自然资源学报,2003,18(02):148-154.

[5]张勇,陈良富,柳钦火,等.日照时间的地形影响与空间尺度效应[J].遥感学报,2005,9(5):521-530.

[6]Usery E L, Finn M P, Scheidt D J, et al. Geospatial data resampling and resolution effects on watershed modeling: A case study using the agricultural non-point source pollution model[J]. Journal of Geographical Systems, 2004,6(3):289-306.

[7]Dixon B, Earls J. Resample or not? Effects of resolution of DEMs in watershed modeling[J]. Hydrological Processes, 2009,23(12):1714-1724.

[8]陈永刚,汤国安,祝士杰. DEM重采样误差空间分布格局及差异性分析[J].中国矿业大学学报,2011,40(4):653-659.

[9]苟卫涛,李学清,王秀霞,等.规则格网DEM格网点位移重采样方法探讨[J].测绘标准化,2012,28(3):28-29.

[10]王宇,白天路.重采样方法对DEM地形表达的影响分析[J].工程勘察,2013(3):67-70.

[11]Tao Yang, Tang Guoan, Jia Yini, et al. Research on Optimal Analysis Window Size and Resampling Method According to DEM Analysis Scale[C]∥International Workshop on Education Technology and Training & 2008 International Workshop on Geoscience and Remote Sensing. IEEE Computer Society, 2008:369-372.

[12]国家测绘局. GB/T7931-2008 1∶500,1∶1000,1∶2000地形图航空摄影测量外业规范[S].北京:中国标准出版社,2008.

[13]国家测绘局. GB/T7930-2008 1∶500,1∶1000,1∶2000地形图航空摄影测量内业规范[S].北京:中国标准出版社,2008.

[14]国家测绘局. CH/T9008.2-2010基础地理信息成果1∶500,1∶1000,1∶2000数字高程模型[S].北京:测绘出版社,2010.

[15]张祖勋.影象灰度内插的研究[J].测绘学报,1983,12(3):178-188.

Effects of Resampling Method on Data Quality of DEMs

WANG Lei1,2, LONG Yongqing1, YANG Qinke1,2

(1.CollegeofUrbanandEnvironment,NorthwestUniversity,Xi’an,Shaanxi710127,China; 2.InstituteofSoilandWaterConservation,ChineseAcademyofSciencesandMinistryofWaterResources,Yangling,Shaanxi712100,China)

[Objective] The influences of different resampling methods on the quality of DEMs were analyzed to explain the accuracy of those methods which were widely used in digital terrain analysis. [Methods] Based on data error analysis, the RMSEs of elevation of those DEMs were calculated from different resampling methods, and from the original DEMs generated by digital photogrammetric method in Yaojiawan valley, Suide County of Shaanxi Province Were compared. [Results] No improvement of the quality of resampled DEMs was observed for all the resampling methods. The spatial distribution of elevation error of resampled DEMs depended on the resampling methods. The larger errors emerged in the positions with the vigorous changing of surface. Meanwhile, the values of RMSE were decided by original grid size and the methods of resampling. [Conclusion] The DEMs resampled by nearest method had the highest RMSE, while the Cubic method obtained the lowest RMSE and Bilinear method got slightly higher RMSE than that of Cubic method.

digital elevation models; resample; grid size; RMSE

2015-09-06

2015-09-26

国家自然科学基金项目“黄土高原小流域侵蚀沟道网络的空间频谱分析”(41101264),“地表坡度的统计分布理论模型研究”(41371274), “梯田对坡度坡长因子的扰动特征研究”(41271284)

王雷(1977—),男(汉族),陕西省兴平市人,博士,研究方向为DEM数字地形分析。E-mail:montez@nwu.edu.cn。

杨勤科(1962—),男(汉族),陕西省陇县人,博士,教授,主要从事区域水土流失定量评价和侵蚀地形分析等方面的研究。E-mail:qkyang@126.com。

B

1000-288X(2016)04-0072-06

P238

猜你喜欢
格网比率基准
一类具有时滞及反馈控制的非自治非线性比率依赖食物链模型
遥感数据即得即用(Ready To Use,RTU)地理格网产品规范
实时电离层格网数据精度评估
明基准讲方法保看齐
一种适用于微弱信号的新颖双峰值比率捕获策略
滑落还是攀爬
巧用基准变换实现装配检测
Imagination率先展示全新Futuremark 3DMark OpenGL ES3.0基准测试
平均Helmert空间重力异常格网构制方法
基于位置服务的地理格网编码设计