(1.南京工业大学 测绘科学与技术学院,江苏 南京 211816; 2.大连市勘察测绘研究院有限公司,辽宁 大连 116021)
径向基函数插值(Radial Basis Functions, RBF)为典型的精确性插值算法,它要求插值表面经过所有已知采样点,插值表面比较平滑,在DEM建模[1-3]、岩体变形[4]、水文预报[5]中获得有效应用。选用合适的径向基插值参数是保证DEM插值效果的前提,为此一些学者对其进行了深入研究。和娴等对不同地形条件下径向基核函数的适用性进行了探讨[6]。对于光滑因子取值而言,相关文献提出了数值近似表达法[2,7-8]、交叉验证法[9]、递归算法[10]等,文献[11]根据地貌类型、采样密度和插值算法对规则格网精度影响的研究,认为多重二次曲面和多重对数径向基函数应使用接近于零的光滑因子,反多重二次曲面、自然三次样条曲面和薄板样条曲面径向基函数则应使用非常大的光滑因子。对于径向基搜索方式,张锦明等采用ASTER GDEM数据源基于多重对数径向基函数对搜索方向和搜索点数进行实验分析,结果表明光滑因子为零时,采用四方向并适当增加搜索点数对提高插值精度更有效[12]。
不同地貌类型区适用不同类型核函数,那么不同类型核函数在搜索方式设置上是否存在差异值得研究。为此,本文在上述研究基础上,拟对常用的5种径向基核函数插值时搜索方向和搜索点数进行优选分析,以消除搜索方式参数设置的不确定性,从而为DEM径向基插值参数选择提供参考和指导。
本文选用平原、丘陵和山地3种不同地貌类型区,其地形特征描述参数如表1所示。从表1中可以看出,实验所选取的3个样区地表高程集中于平均数附近,平原和丘陵地区处于正偏度状态,山地地区高程差值最大,处于负偏度状态。实验数据为1∶2 000地形图矢量散点和等高线。
径向基函数算法是一系列精确插值方法的组合,这种插值方法类似于将橡胶膜的径向基表面穿过各个已知采样点,并保证表面的总曲率最小[13]。径向基核函数在插值过程中决定采样点权重分配方案,对插值效果有着重要影响[14-15]。本文选用常用的5种核函数(见表2)进行实验分析。式中,h为由点(x,y)到第i个数据点的距离;R2为用户指定的平滑因子,平滑因子越大,山顶等高线则越平滑。5种核函数都是准确的插值器,都能适应本实验中的离散采样点数据。
表1 实验样区地形描述参数统计Tab.1 The description of study sites
表2 常用5种径向基核函数Tab.2 The five frequently-used RBF kernel functions
2.2.1搜索点数实验设计
搜索点数(Search Point)是指参与内插计算的采样点个数。在对参与计算的采样点进行选择时,应考虑所选点是否具有代表性,同时也要避免选择过多采样点参与计算,从而造成插值速度变慢。内插过程中,无论是搜索半径控制,还是搜索方向限制,究其本质都是为了控制参与计算采样点个数的问题。所以,搜索点数选择也是影响内插质量重要因素之一,最优搜索点数范围也应随地貌类型区的差异而改变。
为了探究径向基插值中最优搜索点数,实验中采用固定搜索方向和光滑因子,搜索点数设置包括两个方面:一是单向改变上、下限值,即固定上限减小下限和固定下限增大上限;二是双向改变上、下限值,即同时增大上、下限和同时减小上、下限。基于上述实验方案研究搜索点数对插值效果的影响,探寻不同地形条件下搜索点数最优参数范围。
2.2.2搜索方向实验设计
搜索方向(Search Direction)是指在搜索采样点时增加考虑方向因素。当采样点呈不规则分布时,预测点周围可能出现某个方向采样点不足,而另一个方向采样点过量的现象,从而对内插效果产生影响。因此,限制搜索方向可以尽可能地满足各个方向对采样点数量的要求。
DEM插值精度与搜索方向关系密不可分,传统的空间插值很少考虑各个方向变化,通常在进行DEM 内插时,默认选择四方向搜索。但是不同地形条件对搜索方向敏感度具有较大差异,并非所有地貌类型都适合四方向搜索。因此在进行空间内插时,需要考虑不同搜索方向对内插结果的影响。本次实验分别从无方向、四方向、四方向45°旋转、八方向等四个搜索方向进行内插计算,进而探讨搜索方向对内插精度的影响,寻找适合不同地形条件的最佳搜索方式组合(见图1)。
图1 搜索方向实验设计Fig.1 The search directions for the experiment
2.2.3精度评价方案
考虑到 DEM 中误差(RMSE: root mean square error)是目前通用的DEM 质量评价标准,本文将RMSE作为评价DEM内插精度的主要指标。该方法可以从整体意义上描述地形参数与其真值的离散程度,中误差越小,预测值越接近真实值,模拟效果越好。中误差的计算公式为
(1)
式中,zk为假设预留样本点的实际高程,ZK为内插DEM上对应预测点的高程值,n为布设检验点的个数。
(1) 根据插值需要,将每个实验样区原始等高线数据进行预处理得到离散采样点,并将其分为训练数据集和测试数据集两部分,其中85%采样点作为训练数据集生成插值表面,预留15%采样点作为测试数据集,用以评测插值精度。平原区、丘陵区和山地区训练数据集点数分别为6 735,15 538,42 752,测试数据集点数分别为1 189,2 742,7 545。
(2) 根据实验方案中搜索点数和搜索方向不同取值,使用训练数据集应用上述5种径向基核函数分别建立5 m分辨率的格网DEM;然后将预留样本点作为检查点,计算残差值,并生成每个实验样区残差中误差值。
(3) 分析探讨不同实验样区搜索点数和搜索方向对DEM径向基插值精度的影响规律,在此基础上确定搜索方式的最优取值区间。
在进行搜索点数分析实验时,搜索方向采用常用默认的四方向搜索,同时不考虑光滑因子的影响,即将光滑因子值设定为0。
3.1.1单向改变搜索点数上下限值
一方面固定搜索点数上限值为15,不断减小下限值,分别设置为3~15,7~15,10~15,13~15;另一方面固定搜索点数下限值为10,不断增大上限值,分别设置为10~15,10~18,10~21,内插生成3种地形样区5 m分辨率的DEM,其中误差值变化如图2所示。
(1)当降低搜索点数下限值时,同种径向基核函数在同一地形样区中得到的DEM高程中误差值变化较小,但在不同地貌类型区中得到的DEM高程中误差值则存在显著差别。其中,5种径向基核函数在平原样区得到的高程中误差值均小于其他地貌类型区,中误差最大值都出现在山地样区。针对地貌类型区而言,平原样区中,5种径向基核函数得到的DEM高程中误差值大小顺序为TPSF=NCSF (2)当增大搜索点数上限值时,同种径向基核函数在同一地形样区中生成的DEM高程中误差值存在差异,但并没有呈现单调递增或单调递减的趋势。MQF在山地样区中误差值减小,而NCSF在平原样区当上限值为21时中误差值急剧上升,MLF在平原样区中误差值增加幅度显著,IMQF在三种地形样区中误差值都出现不同幅度上升;相对地,TPSF对搜索上限值变化灵敏度较差。针对地貌类型区方面,平原样区中, TPSF与MQF中误差受搜索点数上限值影响较小,并且其值远小于另外3种核函数;丘陵样区中,TPSF和NCSF中误差值较小并且基本保持不变,MQF中误差值随搜索点上限值增加降低明显,插值精度与TPSF和NCSF近乎相同;山地样区中,TPSF始终最小并且远小于其它核函数。 3.1.2双向改变搜索点数上下限值 将搜索点数上、下限值分别以15,10为基准,调节步数为2,得到6组搜索点数,即4~9,6~11,8~13,10~15,12~17,14~19,16~21。研究该系列搜索点数对不同地貌类型区DEM插值精度的影响,DEM高程中误差值统计结果如图3所示。 (1) 平原样区中搜索点数双向改变对MQF和NCSF插值效果影响不大,高程中误差值均控制在0.3 m以下;当邻域搜索点上限值达到21时,MLF和TPSF内插得到的高程中误差值会骤增;IMQF在该样区插值结果几乎呈线性增加趋势,随着搜索点数上限值增加中误差值不断变大。 (2) 丘陵样区中,MQF插值精度随内插点数增多得到有效提高,TPSF、NCSF和MLF,无论搜索点数增加或减少,中误差值变动幅度均较小,相比较而言,TPSF和NCSF插值效果更优。 (3) 山地样区中,随着搜索点数增加,MQF中误差值总体上得到有效降低,是该样区径向基插值核函数的首选;NCSF和TPSF插值精度也得到一定程度的提高,MLF中误差值基本保持稳定,而IMQF插值精度却逐渐降低。 图2 单向改变搜索点数对DEM插值精度的影响Fig.2 The impacts on DEM accuracy when either the maximum or minimum of search point number is changed 图3 双向改变搜索点数对DEM插值精度的影响Fig.3 The impacts on DEM accuracy when both the maximum and minimum of search point number are changed 图4 搜索方向对DEM插值精度的影响,横坐标为搜索方向Fig.4 The impacts on DEM accuracy when different search directions are applied 在进行搜索方向分析实验时,搜索点数采用常用10~15个,同时不考虑光滑因子的影响,即将光滑因子值设定为0,采用无方向、四方向、四方向45°旋转和八方向搜索进行径向基函数插值,生成的DEM中误差如图4所示。 (1) 平原样区中,搜索方向对插值结果影响较小,整体上DEM高程中误差值小于其他样区;当搜索方向改变时,MQF、TPSF、NCSF高程中误差值相对稳定,均保持在0.3 m以下;对于MLF和IMQF而言,当进行无方向和四方向45°旋转搜索时,二者具有相对较高的中误差值,当使用四方向以及八方向搜索时,二者与另外三种核函数相比,插值精度仍然表现较差,但相对而言可以将插值效果控制在较为理想的范围。 (2) 丘陵样区中,TPSF和NCSF插值精度受搜索方向影响较小,二者高程中误差值均在0.5 m以下并且近乎相同;IMQF中误差值远高于其他核函数,同时在不同搜索方向变化很小;MLF和MQF在无方向以及四方向45°旋转搜索时插值精度表现优良,中误差值在0.5 m左右,当使用四方向以及八方向搜索时,MLF中误差值达到1.3 m和1.1 m,MQF中误差值均在0.8 m左右。 (3) 山地样区中,IMQF表现出较差的内插效果,其中误差值在各个搜索方向均超过1.0 m,当使用无方向搜索时高达1.5 m;MQF较其他四种径向基核函数的插值精度最优,在四方向45°旋转搜索时高程中误差值为0.5 m,较其它搜索方向降低幅度明显; 而MLF、TPSF和NCSF插值精度受搜索方向影响并不显著。 (1) 单向改变搜索点数下限值时,所有核函数内插生成的DEM高程中误差值基本稳定;当增加搜索点数上限值时,只有MQF在3种地形样区中插值精度得到不同程度的提高,其他核函数中误差值保持不变甚至增大。 (2) 当同时增加搜索点数上下限时,不同核函数插值精度在3种地形样区呈现出不同变化特点。 (3) 当改变搜索方向时,除TPSF和NCSF中误差值变化较小外,另外3种核函数在不同样区也具有各自的变化规律。 综合而言,为获取更好的插值效果,建议平原样区使用NCSF或TPSF核函数,NCSF搜索点数上限值为18,TPSF搜索点数上限值为21;丘陵样区同样宜采用NCSF或TPSF核函数,二者搜索点数上限值控制在14~21之间;山地样区适宜采用MQF或TPSF核函数插值,MQF采用四方向45°旋转搜索,搜索点数上下限值设置为16~21,而TPSF采用常用的四方向搜索,搜索点数可为默认10~15个,单向改变搜索点数对插值精度影响较小。3.2 搜索方向对DEM插值精度的影响
4 结 论