马英莲,彭树宏,钱 静
(1.中国科学院新疆生态与地理研究所,新疆乌鲁木齐 830011;2.新疆第二测绘院,新疆乌鲁木齐 830002)
基于 Surfer软件的两种数据插值方法研究
马英莲1,2,彭树宏1,钱 静1
(1.中国科学院新疆生态与地理研究所,新疆乌鲁木齐 830011;2.新疆第二测绘院,新疆乌鲁木齐 830002)
对 Surfer中的两种数据网格化插值方法——改进谢别德插值法和径向基函数插值法进行研究,采用特定的数学曲面函数进行插值分析和计算,从理论上分析这两种数学插值方法在不同数据源下生成的 Grid表面模型的差异,并对如何获取有效数据源来提高数据网格化的插值效果进行总结。
Surfer;Grid表面模型;改进谢别德插值法;径向基函数插值法
在当前的各种制图软件中,美国 Golden软件公司的 Surfer软件以其生成图像质量高、生成快速、易于修改、使用方便、成图直观、快捷等特点,在绘制等高线、向量图、3D表面图等方面应用广泛,并受到越来越多使用者的青睐。目前该软件的最高版本是 Golden Software Surfer8.0(以下简称 Surfer8.0),其中提供了 12种插值方法来创建 Grid表面模型,包括了克里金插值法、反距离加权插值法、改进谢别德插值法、径向基函数插值法等,基本上包括了目前所有的插值方法,可以满足不同应用的插值需求。
与ArcGIS的统计分析扩展模块中提供的五种插值方法相比,Surfer 8.0提供的内插方法在对中、小离散数据进行插值处理方面有明显的优势,但在其空间分析方面不及ArcGIS空间分析扩展模块,在参考文献[1]中就 ArcGIS和 Surfer下生成的 Grid表面模型进行了比较,并提供了两种环境下 Grid文件相互转换的具体方法,在应用过程中可以结合数据源选用合理的插值法[1]。
在 Surfer软件的使用中,有研究工作者对 Surfer提供的各类插值方法进行了许多应用性的研究,并证实了当数据源间隔较小时插值方法对插值精度影响较小,当数据源间隔较大时克里金与局部多项式插值精度较优,稀疏源数据的数据网格化精度由高到低排列顺序为“改进谢别德法、径向基函数插值法 >Kriging、局部多项式插值法 >反距离加权插值、线性插值三角网法、移动平均植插值”[2-3]。所以本文就较优的两种插值方法——改进谢别德法和径向基函数插值法进行数学分析,并对这两种数学插值方法在不同数据源中生成的 Grid表面模型特性进行研究,为实际工作中的数据源采集和分类提供参考依据。
为能选取合适的数学曲面函数进行网格化插值,本文首先分析改进谢别德法、径向基函数插值法插值的基本概念及特点。
改进谢别德法是在反距离加权插值法的基础上,利用最小二乘准则,引入节点函数 (插值点的二次多项式)的数据插值方法,其公式为
其中,Zj为待求网格数据值;,hij为权导数;为网格点至离散点的距离;δ为平滑因子;Qj为二次曲面函数;k为权的方次。
其具体特点是:①利用节点函数的二次曲面拟合值来代替离散点值,提高了内插值精度和曲面的光滑度;②修改了反距离加权插值法的权函数,使其只在局部范围内起作用,克服了反距离加权插值法增加点后重新计算权函数的缺陷;③利用了局部最小二乘法来消除或减少所生成等值线的“牛眼”外观,可以说改进谢别德法是改进了的反距离加权插值法。
2.径向基函数插值法
径向基函数插值法是多个数据插值方法的组合,它引入了平滑因子,以插值点与离散点之间的距离视为单一的变量函数,并以此函数作为基函数,利用基函数来确定权重值进行插值的数据插值方法,其公式为
其中,Zj为网格数据值;λi为权导数;B(hi)为基函数(距离基函数);hi为插值点到第 i个数据点之间的距离。其基函数的类型主要有五种[3],本文就目前广泛使用到的复二次函数作为基函数进行讨论分析,其中 R参数是平滑因子。
其具体特点是:插值点与离散点之间的距离作为变量,并引入光滑系数,提高了插值精度,同时也增加了数据的计算量。
从这两种数据网格化插值的特征中不难看出,改进谢别德法和径向基函数插值法在数据网格化过程中都提供了光滑曲面的效果,这种光滑效果在数据源间隔较小时比其他插值方法有明显的优势。
急性胸痛在急诊内科中是一种常见的疾患[1-2],指的是突发性胸痛,病情严重者甚至会危及到患者的生命安全[3],当出现急性胸痛时,应立即去医院进行X线检查、心电图检查,及时确诊并接受对症治疗。急性胸痛的病因复杂,确诊难度大,常见的病因包括张力性气胸、急性主动脉夹层、急性冠脉综合征、急性肺动脉栓塞等,及时鉴别急性胸痛的病因,对于挽救患者的生命及改善预后存在重要意义[4]。超声心动图是一种操作简单且无创的检查方法[5],本文旨在探讨其应用于急性胸痛诊断中的效果,择取我院收治的急性胸痛患者80例开展本次研究,具体内容见正文阐述。
为能满足这两种插值法的最佳效果,可以构建一个光滑曲面性质的双曲抛物面面函数,其具体形式如下
这个函数能很好地反映曲面的光滑效果,为使曲面出现大的变化,且使得插值分析有对比性,可使 Z值为正,相当于两组抛物线曲面相交,故可以将曲面函数表达为
下面是获取源数据,获取思路是根据这组曲面函数特性,在靠近 x=2y+18.24直线附近和偏离该直线附近选取插值点,观察这条变化线是怎样影响曲面插值变化的。
获取数据源的具体方法如下:①利用 Surfer自带的网格函数编辑功能编辑出函数,函数式为:Z= ABS((POW(x-10,2))/20-(POW(y-20,2)/ 10)),并生成 Grid文件;②利用函数自动生成的Grid表面模型数据,在 Grid图形文件中画出直线 x =2y+18.24;③以靠近和偏离该直线为原则,随机获取两组数据;④把选取的 Grid表面模型数据转换为 XLS文件,以此作为插值的数据源。
依照上一节获取数据源的方法,可以得到两组随机数据,为方便观察取点数为 50点,它们是随机生成的具有双曲抛物面曲面性质的离散数据点,故根据这两组离散数据的分布情况,可以画出数据的分布图,以及离散数据与直线 x=2y+18.24之间的关系,如图 1所示。
图1 离散数据分布图
为了能够找到与曲面函数 (4)的最佳拟合模型,可以利用改进谢别德插值法、径向基函数插值法分别生成两组数据源的等直线图,得到图 (2),该图是两种插值方法下,生成等高值为 20 m的等值线图。
图2 两种插值法下的等值线图
为了比较插值效果,首先从横向上看,从图 2中可以看到在利用离散数据 1插值的过程中,由于缺少在直线 x=2y+18.24附近急剧变化的数据源点,使得插值结果与目标曲面函数的实际情况偏离较大,且在使用径向基函数插值法时还生成了负插值数。而离散数据 2中的插值结果也恰好从反面证实了这一点,这使得离散数据 2的插值结果更接近于目标曲面函数(4),如图 3所示,这说明了急剧变化线附近的源数据点有助于提高插值精度。
图 3 径向基函数插值法透视投影曲面图
然而我们又会发现一个矛盾的现象,在离散数据 2中左下方变化线附近集中了大量的源数据点,而在离散数据 1中左下方变化线附近只有少量的源数据点,但生成的等值线都较为平缓,与曲面函数(4)的拟合程度较低,这与前面得出的结论是矛盾的。
为分析出产生这一矛盾的原因,再对图 2作纵向的比较,会发现在使用径向基函数插值法时数据源 1和数据源 2都有负插值数生成 (见图 3),但目标曲面函数的值都是正数,而且使用改进谢别德法也没有产生负插值数。故从插值方法的性质入手分析,从式(1)和式 (2)中可以看出,改进谢别德法是利用节点函数的二次曲面拟合值来代替离散点值,只是在局部范围内起作用;而径向基函数插值法是以插值点与离散点之间的距离作为变量,在全局范围内起作用。
故从本质上说径向基函数插值法在数据插值的过程中自动偏向了式 (3),由此而产生了负插值数;而改进谢别德法的插值虽然也在向式 (3)靠近,但由于受密集(稀疏)插值数据源点范围约束,与范围内已知的插值点相互约束形成了较为平直的曲面。由此可以知道,在进行数据网格化插值时,靠近变化线的已知插值点的数量并不是越多越好。
本文通过特定的数学曲面函数生成的两组随机离散变量,利用改进谢别德插值法和径向基函数插值法在 Surfer环境下进行数据插值分析,总结出以下结论:①在变化线附近的源数据点有助利于提高插值精度;②在进行数据网格化插值时,靠近变化线的已知插值点的数量并不是越多越好。
以上结论可以在实际的生产过程中加以利用,如在地形测量工作过程中,测量坡向变化较大的沟谷地形,为节省工作量并达到测量效果,可以在沟谷两侧较均匀地采集数据点;在进行地质填图工作的过程中,在对向斜脊或背斜脊范围内的地层编录或采样时,应当合理地平均分配工作量。当然,本文没有对变化线周围的数据点密度作定量的分析,更没有提供可靠的数据源密度参考值,这些都需要感兴趣的研究者作进一步的详细研究。
[1] 白世彪,闾国年,杨一鹏.关于 ArcGIS和 Surfer格网文件的转换方法[J].测绘通报,2005(2):48-50.
[2] 罗亦泳,张立亭,陈竹安,等.基于 Surfer的数据网格化与体积计算精度分析[J].测绘科学,2009(5):97-99.
[3] 陈欢欢,李星,丁文秀.Surfer 8.0等值线绘制中的十二种插值方法 [J].工程地球物理学报,2007,4(1):52-57.
A Study of Two Data Interpolation M ethods Based on Surfer Software
MA Yinglian,PENG Shuhong,Q IAN Jing
0494-0911(2010)08-0054-04
P208
B
2010-01-26
国家自然科学基金面上项目亚类青年科学基金项目(40701050)
马英莲(1972—),女,新疆沙湾人,博士生,高级工程师,研究方向为定量遥感与数据挖掘。