孟雪莹,张新新
(安徽理工大学 测绘学院,安徽 淮南 232001)
土壤的有机质含量是土壤肥力水平的一项重要指标,其空间分布影响土壤养分供应、土壤结构、土壤的生态功能[1]。准确地获取地表土壤有机质的空间分布和变异规律,可为土地管理和农业施肥提供科学依据[2]。实际中无法对研究区域内的所有点都采样分析土壤有机质,目前,主要采用空间插值法通过已知的部分空间样本信息对未知的地理空间特征进行估计;不同的插值模型的插值原理和计算方法不同,其预测结果反映的土壤有机质空间变异性也有所不同,因此,选择适量的样本个数和合适的插值方法对揭示其空间分布规律具有重要意义[3-9]。研究主要以皖苏两省四市交界处宣城市宣州区水阳镇为研究区,以耕地中土壤有机质为研究对象,采用普通克里格插值、反距离权重插值、局部多项式插值和径向基函数插值方法分别对样本有机质进行空间插值,并采用独立验证和交叉验证分别对空间差异和布局进行解析和预测,对结果的预测精度进行分析和比较。
研究区域为宣城市宣州区水阳镇(见图1),位于我国安徽省东南部,地处皖苏两省四市交界,是皖南山区与长江中、下游平原的结合部,地理坐标为30°34′~31°19′N,118°28′ ~119°04′ E。全镇格局“三水七田”,气候温润,光照充足,属于圩畈地貌,典型的江南水乡,境内沟渠纵横,河道交错,土地肥沃,水面宜养殖鱼蟹虾蚌鳖等名特优水产品,圩田宜种植粮油棉和瓜果菜等多种作物。全镇总面积30.75万亩 ,耕地面积10.1万亩,水面5万亩。
图1 研究区概况及样点分布
样品来源于宣城市2009年开展的测土配方施肥项目,选择水阳镇的农田调查样点 403个。样品采集深度均为0~20 cm,同一田块内进行随机多点取样混匀后按四分法取2 kg 土样装袋备用。将样品置于实验室内进行自然风干,先用木棍捣碎剔除干净样本中的植物残根等杂质,再将样本研磨成粉状并用 100目筛子进行过滤装袋;最后采用重络酸钾-硫酸消化法测定土壤的有机质含量。
1.3.1 空间插值方法
空间插值是通过已知的样本点数据推算该区域内的其他未采集点的数据。常见的空间插值方法有:克里格方法、反距离权重法、局部多项式插值法、径向基插值法。
1)普通克里格法(Ordinary Kriging,OK)是一种无偏最优线性的克里格插值方法,也是最稳健最常用的方法。
2)反距离权重插值法(Inverse Distance Weighting , IDW)是一种加权移动平均方法,以内插点与样本点之间的距离为权重,属于确定性的内插方法[10]。
3)局部多项式插值法(Local Polynomial , LP)采用多个处在特定重叠邻近区域内的多项式进行插值[11]。该插值方法拟合的数据着重反映大比例尺的数据分布状况,体现数据的局部特征。在局部多项式插值过程中,邻近区域的形状、样点数量的最大值和最小值以及扇区的构造都需要进行设定,局部多项式产生的表面多用于局部变异的解释。研究中的局部多项式插值采用二次多项式进行拟合。
4)径向基函数插值法(Radial Basis Function , RBF)是多个数据插值方法的组合 ,通过各个已知样点生成一个圆滑曲面, 并使表面的总曲率最小,是一种精确插值方法[12]。径向基函数插值法适用于对大量点数据进行插值计算,但当无法确定采样点数据的准确性时,径向基函数插值将不适用。
1.3.2 半方差函数
半方差函数用于描述区域化变量的空间自相关性,能较好地揭示土壤属性的空间结构变异和随机变异特征[13]。半方差函数的本质是二阶矩函数,半方差函数值为非负值,如式(1)所示。
(1)
式中:h为矢量距离;N(h)为相距间隔为h的点对数;Z(xi)、Z(xi+h)分别为点xi与xi相距h的样点的属性值。
求出半方差后,利用指数模型和球状模型等进行拟合,得到块金值(Nugget)、偏基台值(Partial Sill)及变程(Range)等参数进行空间分析。
1.3.3 精度评价
利用独立验证和交叉验证方法检验插值的结果精度;采用均方根误差作为精度评价指标,确定不同的插值方法对研究区土壤有机质预测精度最优的插值模型。其中,均方根误差(RMSE)如式(2)所示。
(2)
利用ArcGIS软件对原始数据进行样点子集的创建。按1∶3比例构建校验数据子集与实验样本点子集,即100个样本点作为独立验证的样本点集,剩余的303个样点作为实验样本点子集参与空间插值过程。
原始采样点土壤有机质(SOM)含量介于5.28~8.64 g/kg之间,有机质平均含量为6.62 g/kg,有机质含量的偏度值为0.019 5。在此基础上,通过ArcGIS软件对原始数据进行正态性检验,显示符合正态分布,能够进行空间插值处理和分析。水阳镇土壤样本有机质含量的统计特征如表1所示。
表1 水阳镇土壤有机质含量的统计特征
为了了解研究区土壤有机质的空间变异结构,在ArcMap软件中对原始的403个样本点进行变差函数拟合,研究中所描述的土壤有机质属性变异是各个方向上的加权平均。原始样本点土壤有机质在不同变差函数模型下的相关参数如表2所示。
表2 水阳镇土壤有机质含量半变差函数模型及参数
由表2可知,指数模型和球状模型的块金值都很小,且偏基台值均与1相差远远超过0.3,所以宣城地区农田土壤有机质含量具有空间趋势性。对比两种模型参数可知,土壤有机质含量半变异函数最佳理论模型为指数模型,如图2所示。
图2 土壤有机质最优半变差函数
在进行半变差函数的模拟后,对原始样本点有机的空间分布进行趋势分析,用1个三维视图来探察空间数据,如图3所示。样本点分布在X,Y平面上,用平行于Z轴的线段表示样本点的数值;将样本点的数值分别投影到X,Z平面和Y,Z平面上,形成平面上的散点图。通过散点拟合出1条拟合线,并用它来模拟特定方向上存在的趋势。
图3 样本点有机质分布趋势分析
从图3可以看出,投影在X,Z平面上(南北方向上)的趋势线近似呈现倒U形,投影在Y,Z平面上(东西方向上)的趋势线近似呈倒“~”形;从这两个趋势方向上可以大致了解到研究区域的土壤有机质含量从东北向西南递减。
本文采用303个实验样本子集和100个验证样本子集,分别采用普通克里格、反距离加权法、局部多项式和径向基函数插值法对样本有机质含量进行空间插值,结果如图4所示,并对这4种插值的效果进行分析。
图4 基于各插值方法的土壤有机质空间分布
整体来看,图4的4种插值结果都反映出水阳镇的土壤有机质含量在空间分布上呈现出从东南向西北倾缓的特点,西北部土壤有机质含量较低,南及东南部普遍较高。局部来看,不同的插值方法呈现的插值结果在空间特征上表现出一些差异。普通克里格插值是一种依赖于测量误差模型实现精确和平滑插值的插值法,此插值结果呈带状分布;反距离权重插值是一个快速精确的确定性插值方法,该插值结果中“牛眼睛”现象明显,出现局部高亮的情况;局部多项式插值是一个平滑的中等速度插值方法,插值结果中平滑现象明显,呈现出平滑曲面的特征;径向基函数插值是一个中等速度精确的确定性插值方法,该插值结果在局部出现高亮现象,表现形式与反距离权重插值结果相近,但稍微平滑一些。
由于不同插值方法的基本原理不同,实际插值结果的表现形式也有所不同。本研究是为了探讨在皖南地区哪种空间插值方法在土壤属性预测中的精度最优,结合上述4种插值方法,以独立验证和交叉验证结果中均方根误差为参数,对4种插值方法进行比较。先计算出不同插值方法下的交叉验证与独立验证的误差平均值,结果如表3所示,再计算其均方根误差,均方根误差越小,代表该插值方法对土壤有机质预测精度越高,结果如表4所示 。
表3 不同插值方法下的交叉验证与独立验证的误差平均值
表4 交叉验证与独立验证的均方根误差
由表4可知,独立验证结果表明反距离权重插值、局部多项式插值和径向基函数插值预测精度结果相近,相对其他3个方法普通克里格插值的预测精度最好,均方根误差为0.382 7。交叉验证结果表明各空间插值方法预测精度结果相近,其中,普通克里格插值方法的预测结果的均方根误差为0.460 4,预测精度最高;反距离权重插值的预测精度最差;局部多项式插值与径向基函数插值效果相近,处中等水平。
通过不同空间插值方法对水阳镇土壤有机质进行预测,以独立验证和交叉验证为检验方法,以均方根误差为精度评定标准,发现相对于反距离权重插值、径向基函数插值和局部多项式插值,普通克里格的插值方法最佳。于伟宣等对蒙城县的土壤有机质的预测结果也表明400个样本下普通克里格插值预测精度最好[11]。
基于宣城市水阳镇地区403个样本点,通过综合比较反距离权重、普通克里格、局部多项式和径向基函数4种插值方法对水阳镇地区土壤属性空间预测精度分析的预测结果和插值结果分布,得到以下主要结论:
1)研究区土壤有机质含量介于5.28~8.64 g/kg之间,平均值为6.62 g/kg,偏度为0.019 5,土壤有机质含量最北部较高,西北部土壤有机质含量较低,南部普遍偏高,有机质含量较低的位置一般是人类活动区,有机质含量较高的位置一般是耕地,该研究区域的有机质含量从东北向西南递减。
2)从独立验证与交叉验证的均方根误差来看,普通克里格插值对水阳镇的土壤有机质空间变异预测精度最优,局部多项式和径向基函数法插值次之,反距离权重插值结果最差;但从整体数值上来看,这4种插值方法对水阳镇的土壤有机质空间变异预测精度的差别不大。