陈 飞 香,戴 慧,胡 月 明*,赵 元,周 永 章
区域土壤空间抽样方法研究
陈 飞 香1,2,3,戴 慧2,3,胡 月 明2,3*,赵 元2,3,周 永 章1
(1.中山大学地球环境与地球资源研究中心,广东 广州 510275;2.广东省土地利用与整治重点实验室,广东 广州 510642;3.华南农业大学,广东 广州 510642)
对不同空间抽样方法进行对比研究是寻找具有空间相关性的不同资源和调查对象的最适宜抽样设计方案的重要手段。该文以广东省增城市土壤铬含量为空间要素,分别采用空间简单随机抽样、空间分层抽样和三明治抽样3种方法进行抽样;为便于比较3种方法的抽样精度,设定相同样本容量,采用Kriging插值对抽样结果进行精度评价。结果表明:在较为丰富的先验知识的情况下,三明治空间抽样方法所抽样点在预测土壤重金属含量分布情况时得到的克里格估值误差最小,是一种抽样精度更高、适用范围更广的抽样方案。
地统计分析;空间抽样;GIS;土壤铬含量
土壤要素空间分布一直是土壤学与地理学的研究热点之一。长期以来,因受客观条件所限,不能对区域内所有位置的土壤性状一一进行调查,因而抽样调查方法成为获取土壤空间分析信息的基本方法,即从研究对象中抽出部分单位进行分析,通过其数量特征推断总体数量特征。目前,常用的抽样调查方法有经典抽样方法和空间抽样方法。经典抽样方法野外采样点多,耗费大量人力、物力和时间,因而效率低、成本高[1];空间抽样方法是在地统计学支持下,设计抽样样点时考虑区域土壤空间自相关性[2],适合于具空间相关性的土壤性状调查[3,4],广泛应用于耕地资源调查与监测[5]、社会问卷调查[6]、人均农业总产值调查[7]等领域。
随着抽样技术的发展和应用的广泛性,抽样过程中逐渐融入空间信息,并将其与GIS、RS技术结合,形成高效的空间抽样方法,如空间随机抽样、空间分层抽样和三明治抽样模型。本文采用空间随机抽样模型、空间分层抽样模型和三明治抽样模型估算广东省增城市土壤铬含量的空间分布,并对三种方法的抽样结果进行精度评价,选出最适合于获取区域土壤重金属含量空间分布信息的空间抽样模型,进一步完善我国区域土壤重金属含量空间分布的抽样研究,为土壤重金属污染治理提供依据。
在空间简单随机抽样中,抽样均值是总体均值的无偏估计。考虑到空间对象的空间自相关性,其均值估计方差需要根据空间抽样对象的相关程度而调整。在抽样中,主要是通过样本点估计一个连续表面上的均值[3],公式为:
式中:¯Z为均值,n为样本量,Z(xi)为样本值。
在分层抽样的基础上,将空间研究区域N按其空间属性特征分成L个互不重复的类型或层,先计算研究区域总体样本量;再利用平均分配、按各层离散方差与总体规模乘积分配等方法将样本量按权重Wh分配到每个层内;最后在每个层内进行简单随机布样,计算各层的样本均值(式(1))、方差(式(2))[3]和权重(式(3))。
式中:Wh是h层的权重,N是样本量,Nh是h层中所有的样本数。
先将研究区域划分为多个分区(知识层),根据用户对抽样精度的要求计算所有层总的抽样样本量,依据分层抽样样本分配理论,将样本分配到每个知识层;利用用户调查的样本值计算知识层的样本均值和方差,并将其传递到报告层,得到每个报告层的样本均值和方差[3]。报告层由用户感兴趣的空间报告单元构成,如果抽样结果需要在多个报告单元进行统计与推断,抽样费用将大大增加;报告单元的灵活性表现可由用户定义,这也是三明治空间抽样方法的一大特性,该特性既解决了经典抽样理论默认只有唯一报告单元的局限性问题,也解决了在多个报告单元布设样本带来的昂贵费用问题[3]。
根据研究区土壤类型和地形特点,在保证样品代表性的前提下,在研究区电子地图上布点,再根据当地实际情况用GPS手持机获取实际坐标。采用“X”法,在10 m半径的范围内取0~20 cm耕层土壤,5个点混合为一土样,共采集194个土样;所有样品经风干、剔出杂质、研磨、分别过20目和100目筛后,采用GB/T 17137火焰原子吸收光谱法测定土壤铬含量。
空间自相关性反映了一个区域单元上某一地理现象或某一属性值与邻近区域单元上同一现象或属性值的相关程度。本文利用Arc Map,采用Moran′sI系数法检测研究区域内土壤铬空间自相关的指标;检测到 Moran′sI为0.4691,且p<0.01,表明研究区域内土壤铬属于空间正相关,且相关性显著。
经典采样技术广泛应用于样本容量大小的确定,本文采用Cochran提出的纯随机采样方法确定样本容量,计算公式为:
式中:n为样本容量大小,t为与显著性水平α相对应的标准正态偏差,Std为样本标准差,d为样本平均值与相对误差(%)的乘积。
经计算,90%、95%和99%置信水平下对应的标准正态偏差t值依次是1.6449、1.96、2.5758,样本标准差Std值为14.3744,样本平均值为35.6583。为了更好地表达样本容量的代表性,置信水平取99%,相对误差分别取15%、10%、5%条件下得到的合理样本容量依次为48、108、432。根据研究区域实际情况,本文选取相对误差10%条件下得到的108个样点进行空间抽样对比研究。
传统的分层将属性值相对近似的尽可能分到同一层,根据这个分层标准对空间对象分层时,在同一层的对象属性值相差可能很大。而知识层分区,考虑了样本点的空间信息,兼顾了同一层的对象能够在空间上相连。目前,知识层分区的方案主要有两类,一类是直接利用已有的分区单元对样本划分,另一类是根据单一要素或多要素相结合进行分层。本研究主要采用第一类方法,根据研究区土地利用类型,将研究区分成耕地层、园地层、林地层和非农用地4层(图1)。报告层是用户感兴趣的空间报告单元(用户希望了解的抽样调查对象所分布的空间区域)的集合,当前常见的报告单元有省、市、县等行政区,也可以是流域等自然带,本研究的报告单元采用增城市行政区划图。
图1 增城市知识层分区Fig.1 The partition of knowledge level in Zengcheng City
抽样过程中,空间简单随机抽样不涉及分层,空间分层抽样只涉及空间分层,三明治空间抽样既涉及空间分层,又涉及报告单元的选取。采用SSSampling软件包对3种抽样方法进行对比抽样。
空间简单随机抽样样本量取108,总体方差根14.3744,绝对误差1.7,空间相关系数0.13,其抽样结果如图2a。空间分层抽样在分层抽样知识层分区(图1)的基础上进行,其样本量108,用户给定抽样方差0.000045,均值标准差3.66,均值空间标准差4.15,结果如图2b;样点在各层分布情况如表1,在园地分布最少(9个),占样本容量的8.33%,在耕地层分布最多,占样本容量的60.19%。三明治空间抽样也是在分层抽样基础上进行的,其知识层如图1,报告单元取增城市行政区划图;其样本量108,用户给定抽样方差0.000045,知识层均值13.51,知识层均值标准差3.01,知识层均值空间标准差4.06,抽样结果如图2c;各层样点数量分布情况如表1,抽样点主要分布在耕地层,占样本容量的62.96%,园地样点分布最少,仅10个。
图2 3种抽样方法的抽样结果Fig.2 Sampling results of the three sampling methods
表1 空间抽样模型各知识层的样点数分布Table 1 Sample distribution for different knowledge level of spatial sampling methods
借助地统计学方法,对3种方法抽样结果进行Kriging插值,以便评价抽样结果的精度。Kriging方法也称为空间局部估计或空间局部插值,它是一种非常重要的最优、线性、无偏空间插值方法,首先考虑的是空间属性在空间位置上的变异分布,确定对一个待插点值有影响的距离范围,用此范围内的采样点估计待插点的属性值[8]。经柯尔莫哥洛夫-斯米诺(Kolomogorov-Semirnov,K.S)正态分布检验,土壤铬含量满足正态分布,符合采用Kriging插值的前提条件。本文采用普通克里金法(Ordinary Kriging)对抽样结果和原始样点的土壤铬含量进行最优内插,几种插值结果如图3所示。
图3 不同布局样点下土壤铬含量普通Kriging插值Fig.3 The ordinary Kriging interpolation of soil Cr under different distribution of sample points
3种空间抽样方法所抽样点与原始样点土壤铬含量Kriging插值后的交叉验证(Cross Validation)结果见表2,总体上,平均误差(ME)和标准化平均误差(MSE)的绝对值均趋近于0,均方根误差(RMSE)和平均标准误差(ASE)的值都较小且较接近,表明预测结果均比较理想。但从局部验证差异看,不同空间抽样方法所抽样点的插值交叉验证(Cross Validation)结果却有所差异。3种空间抽样方法中,|ME|的值最接近于0(0.0973)的是三明治空间抽样方法,最大(0.3421)的为空间简单随机抽样。|RMSE-ASE|大小排序为空间简单随机抽样(1.74)>空间分层抽样(1.44)>三明治空间抽样模型(1.04),说明三明治空间抽样模型所抽样点通过插值预测的结果最接近真实值。表2中各样点插值的RMSSE值均大于1,说明预测值全部被低估了,但三明治空间抽样模型RMSSE值为1.057,最接近于1,表明被低估的程度最小。与原始样点插值的交叉验证相比,鉴于原始样点样本量大(为208),原始样点的各项指标均为最理想,预测精度最高;而3种空间抽样方法中,三明治空间抽样方法所得样点插值的精度与原始样点最为接近,其次是空间分层抽样。
表2 不同布局样点下普通克里格插值估测精度Table 2 The predict accuracy of ordinary Kriging under different distribution of sample points
在区域土壤空间抽样中,空间简单随机抽样、空间分层抽样、三明治抽样3种方法均可以设置相同样本容量,但空间简单随机抽样仅考虑样点自身位置,而空间分层抽样与三明治抽样可以利用技术人员已有经验,抽样结果能满足不同研究目的的需要。采用三明治抽样方法,因其引入报告层与知识层的处理,抽样结果具有更高的精度与效率,在对区域土壤空间要素具有较丰富先验知识的情况下尤为适用。
区域土壤重金属含量抽样是其空间预测制图的基础,必须选用可靠的、高精度的抽样方法,才能够为设计科学合理的野外采样方案提供切实的依据。本文因数据所限,未能对3种抽样方法在其他土壤要素的空间抽样上做出对比分析;另外,在三明治空间抽样方法的知识层选择时,仅以研究区土地利用现状作为知识层分层,未能进一步考虑其他可能对土壤铬含量空间分布造成影响的因素,如产业布局、人类活动、地形坡度和种植作物等。
[1]杨琳,朱阿兴,秦承志,等.一种基于样点代表性等级的土壤采样设计方法[J].土壤学报,2011,48(5):938-946.
[2]WANG J,LIU J,ZHUAN D,et al.Spatial sampling design for monitoring the area of cultivated land[J].International Journal of Remote Sensing,2002,23(2):263-284.
[3]王劲峰,姜成晟,李连发.空间抽样与统计推断[M].北京:科学出版社,2009.
[4]邓仕虎,杨勤科.DEM采样间隔对地形描述精度的影响研究[J].地理与地理信息科学,2010,26(2):23-26.
[5]刘海启.大尺度耕地变化监测的遥感抽样方法研究[J].农业工程学报,2001,17(2):168-171.
[6]高丽玲,李新虎,王翠平,等.空间抽样的理论方法与应用分析——以厦门岛问卷调查为例[J].地球信息科学学报,2010(3):358-364.
[7]连健,李小娟,宫辉力,等.GIS支持下的空间分层抽样方法研究——以北京市人均农业总产值抽样调查为例[J].地理与地理信息科学,2008,24(6):30-33.
[8]KNOTTERS M,BRUS D J,OUDE VOSHAAR J H.A comparison of Kriging,co-Kriging and Kriging combined with regression for spatial interpolation of horizon depth with censored observations[J].Geoderma,1995,67(3):227-246.
Study on Regional Soil Spatial Sampling Method
CHEN Fei-xiang1,2,3,DAI Hui2,3,HU Yue-ming2,3,ZHAO Yuan2,3,ZHOU Yong-zhang1
(1.CenterforEarthEnvironment&Resources,SunYat-SenUniversity,Guangzhou510275;2.KeyLaboratoryofGuangdongProvinceLandUseandRemediation,Guangzhou510642;3.SouthChinaAgriculturalUniversity,Guangzhou510642,China)
The comparative study on different spatial sampling method is an important means to find a spatial correlation of the different resources and survey the most appropriate sampling design.In this paper,the soil Cr content in Zengcheng City in Guangdong Province was taken as spatial elements,three kinds of methods for sampling analysis that respectively were the spatial simple random sampling and spatial stratified sampling,spatial Sandwich sampling were discussed.For ease of comparison of three methods of sampling precision,this paper set the same sample size,and then used the Kriging interpolation on the sampling accuracy evaluation,and then did cross-validation after Kriging interpolation.In cross-validation process,|ME|value of the Sandwich space sampling method is the most closet to zero,it is 0.0973,and the value of spatial simple random sampling is the largest.The order of the|RMSE-ASE|value is:spatial simple random sampling>spatial stratified sampling>spatial Sandwich sampling.The results show that,in the case of more rich of prior knowledge,the sample points which gained by Sandwich sampling attain the minimum Kriging estimation error in the case of predicting the distribution of the contents of heavy metals in soil,Sandwich sampling has higher sampling precision and wider range of application.
geo-statistical analysis;spatial sampling;GIS;soil Cr concentration
P 208;X53
A
1672-0504(2012)06-0053-04
2012-04- 28;
2012-06-27
国家自然科学基金项目(40971125);广东省科技计划项目(2011B020313020)
陈飞香(1978-),女,壮族,博士研究生,讲师,研究方向为地理信息系统应用。*通讯作者E-mail:ymhu163@163.com