土壤重金属调查采样数目的确定方法研究进展

2019-03-05 04:04黄亚捷李菊梅马义兵
农业工程学报 2019年24期
关键词:正态分布数目对数

黄亚捷,李菊梅,马义兵

土壤重金属调查采样数目的确定方法研究进展

黄亚捷1,李菊梅1,马义兵2※

(1. 中国农业科学院农业资源与农业区划研究所,北京 100081;2. 澳门科技大学澳门环境研究院,澳门 999078)

在土壤重金属调查中,合理确定采样单元的采样数目对保障其数据精确性及土壤污染风险评估和防治具有重要意义。该文通过广泛查阅国内外相关文献,对表层土壤重金属采样数目确定方法现状及未来研究方向进行了评述;基于经验型、统计学及经验统计学方法系统分析了土壤重金属采样数目确定方法的优缺点。结果显示在确定采样数目时缺乏对采样单元的考虑;采样数目更多的集中于经验型,相对缺乏基于统计学及经验统计学的应用。在采用统计学方法确定采样数目时,更多地集中于正态分布下的采样数目确定,而大多忽视了土壤重金属含量的非正态分布及其对采样数目的影响;尽管有部分学者提出对数正态分布下采样数目的确定方法,但是该分布下采样数目的精确算法过于复杂,不同修正公式的应用范围也有所限制,不足以涵盖在不同变异下的采样布点,而且存在高估或低估采样数目的风险。因此,明确采样尺度或采样单元,加强基于统计学或经验统计学确定采样数目方法的研究,探索对数正态分布下合理采样数目的确定方法,寻找出适合中国土壤重金属采样数目确定方法是实现土壤重金属风险评估和污染治理的重要保障。

土壤;重金属;采样;统计学;正态分布;对数正态分布

0 引 言

土壤采样是进行土壤相关研究工作的前提和基础。为使有限的样本值能够尽可能精确地代表总体样本的期望值,土壤取样数应当达到一定的数量,即为合理采样数目[1]。田间土壤重金属的风险评估和污染防治离不开合理的采样数目。而受制于采样强度、分析成本和研究结果精度等因素限制,进行大规模的土壤重金属密集采样需要考虑现实性和必要性[2]。因此,如何确定土壤重金属合理采样数目始终是研究者和环境管理者关注的一个重点和难点问题。

然而,目前对于科学的田间表层土壤采样研究相对较少,也缺乏科学的采样方法作指导[3]。Zhang等[4]查询两份重要的环境期刊(Environmental Science and TechnologyAnalytical Chemistry)上已发表的论文数量,结果表明关于采样的论文数目占已全部发表论文的数目不足1%。而对于田间土壤重金属采样数目确定方法的研究关注的更少。因此,为了更加清楚地认识表层土壤重金属采样数目确定方法,推动土壤重金属采样研究的发展,本研究从土壤重金属采样数目现状、确定方法以及未来研究方向进行评述。

1 土壤重金属采样数目研究现状

在确定土壤重金属采样数目时,采样单元的定义至关重要,不同的土壤采样单元定义直接影响土壤采样区域面积及采样数目的确定[5-6]。不同学者对土壤污染物的采样单元定义并不相同。联合国粮农组织(FAO)认为最小的土地单元为土壤采样单元(Soil Sampling Unit),采样单元内具有相似的土壤污染情况[7]。Ramsey 等[8-9]、Minnitt等[10]及美国洲际技术和法规委员会(ITRC)[11]认为在抽样理论中基于采样物的平均浓度可以代表的土壤面积、体积的区域被称为“决策单元”,决策单元由一个或多个采样单元组成。而在欧洲国家主要是依据土地利用、历史背景、地质水文等共同确定土壤污染物的采样单元[5-6]。

以欧洲国家为例(表1),瑞士的土壤污染物采样单元定义取决于土壤、土地利用、筛查、采样站点的相关性,卢森堡的采样单元定义取决于土地利用、历史背景、筛查,而荷兰的采样单元定义考虑土壤、土地利用、历史背景、地形水文条件、筛查、采样点的相关性。根据不同定义确定的采样单元面积并不相同,从瑞士的100 m2到卢森堡/葡萄牙/奥地利的10000 m2,进而决定了采样密度从瑞士1 600个/hm2到荷兰的2~3个/hm2,采样数目从卢森堡的每公顷面积内采样2~5个到瑞士每公顷面积内采样1 600个。Wagner 等[6]也选取了来自不同欧洲国家的15个参与者分别制定土壤污染物的采样策略,确定采样单元的准则或只依据土地利用,或同时考虑土壤状况及土地利用情况。以在6 100 m2区域内确定土壤污染物的采样数目为例,欧洲国家的不同参与者基于不同准则最终确定的混合采样数目从4个到16个。

表1 欧洲国家采样单元内土壤污染物的采样策略

注:数据来源见Theocharopoulos等[5]。

Notes: see Theocharopoulos et al.[5]for data sources.

比较中国不同部门(如环保、农业及国土资源部门)对土壤污染物的采样策略,结果发现不同部门之间确定土壤污染物的采样单元及采样数目相差很大(表2)。例如,依据《土壤环境监测技术规范》(HJ/T 166—2004)确定农田土壤污染物的采样策略,需在每个采样单元内设置3~7个采样区,并要求单个采样单元面积为40 000 m2;依据《农田土壤环境质量监测技术规范》(NYT 395—2012)确定污水灌溉农产品生产区的土壤污染物采样标准,要求在每个采样单元布设10~12个采样点。中国不同部门(如环保、农业及国土资源部门)之间的采样单元定义或确定准则不同,可能会造成不同土壤调查过程中所确定的重金属采样数目不具有可比性。同时,也可能会导致在同一变异系数及精度要求下所确定的土壤重金属采样数目有较大差异。

回顾中国土壤重金属的相关研究,基于文献搜索方法总结归纳表层土壤重金属的采样数目。其中,文献搜索的准则包括土壤主要污染物为镉(Cd)、数据来源于表层土壤(0~20 cm)、采样区域为农业土壤、城市土壤及矿区土壤,最终确定案例222个(图1)。由于篇幅限制,只列出部分代表性参考文献[12-22]。研究发现土壤重金属Cd的采样数目主要集中于200个以内。在变异系数相近的情况下,不同研究者基于不同的研究目的及采样单元划分准则等所确定的土壤重金属采样数目有很大差异。如在变异系数约为15%时,Cd的采样数目有21[12]、91个[13];在变异系数约为50%时,Cd的采样数目多达144个[14],少到16个[15]。

表2 中国不同部门采样单元内土壤污染物的采样策略

注:为正方形网格调查点间距,m;为场地敏感环境区域的最小面积,m2;为置信度水平。

Notes:is the sampling interval of survey points on the square grid, m;is the minimum area of site sensitive environment regions, m2;is the confidence level.

同时,本文依据农业土壤、城市土壤、矿区土壤对中国重金属Cd的采样数目分类统计,其中城市土壤58个、农业土壤101个、矿区土壤63个(图1)。研究发现相比于农业土壤及城市土壤,矿区土壤重金属Cd的变异系数较高,采样数目却相对较少,约60%的案例中矿区土壤采样数小于100个。在同一变异系数下不同研究者所确定的采样数目有很大差异,如在农业土壤中变异系数约为26%时,不同案例中的采样数目分别为22[16]、97[17]、140个[18];在变异系数约为31%时,不同案例中的采样数目分别为20[19]、79[20]、100[21]、147个[22]。在同一精度水平下,随着区域变异系数增加,对应的采样数目应有所增加[23-24]。然而,在实际采样中,无论是城市土壤、农业土壤或是矿区土壤对Cd的采样均出现变异系数高却采样数目相对少的情况,这可能会造成土壤重金属样本数或过少不足以支撑所得结果,或过多带来人力和财力的浪费。究其原因可能是目前中国在土壤污染调查中仍没有形成统一的采样数目确定标准,不同部门之间的采样单元划分、布点原则等并不相同。

a. 全部土壤a. All soilb. 城市土壤b. Urban soilc. 农业土壤c. Agricultural soild. 矿区土壤d. Mine soil

2 土壤重金属合理采样数目确定方法研究

在表层土壤重金属合理采样数目确定方法研究中,本文将其分为三类:经验型(如目的性采样法)、统计学(如地统计学)及经验统计学(如分阶段采样)。其中,经验统计学就是以经验型方法为辅、统计学方法为主,共同确定土壤重金属合理采样数目。因此,本研究从这三大方面出发,系统论述表层土壤重金属合理采样数目确定方法,深入分析当前方法优劣势,以期为未来土壤重金属合理采样数目确定方法提供新思路。

2.1 基于经验型方法确定土壤重金属合理采样数目

基于专家经验确定表层土壤重金属采样数目是早期常用的方法。从事多年土壤采样工作的专家综合考虑所需精度(如在土壤环境监测中一般设所需精度为70%~80%)、费用及研究目的等得出合理的土壤采样数目。如Oliver等[25]认为在没有严格的精度限制下,在几平方米内需要布置16个采样点。Leung等[26]在研究土壤砷的空间变异时,根据研究目的及地质背景等,认为在1 600 m × 2 700 m区域内可取388个样品。然而,上述仅仅依靠于经验型方法进行土壤采样,可能会造成采样数目过多,出现土壤采集信息重复的现象。

目的性采样是常用的基于经验型确定土壤重金属采样数目的方法。它是根据研究目的,通过专家的先验知识布设具有“代表性”或“平均状态”的样点的采样方案[27-28]。在早期土壤调查制图中,拥有多年野外经验的土壤普查专家根据经验确定采样数目及选择样点位置。如杨琳[29]认为基于获取典型样点的目的性采样法,在76%的制图精度要求下,60 km2的研究区域内取35个样点即可。但是,目的性采样过分依赖于具有多年实践经验积累的专家和先验知识的指导,主观性过强,没有成熟的理论基础和方法框架[30-31]。由于采样精度是建立在专家主观选择的基础上,很难得到客观的误差评价[32]。因此,随着统计学尤其是地统计学的发展,基于统计学确定土壤重金属合理采样数目的方法越来越得到重视。

2.2 基于统计学方法确定土壤重金属合理采样数目

土壤样本的数据一般为正态分布和偏态分布。在土壤重金属污染区域,由于土壤重金属含量较高,空间分布差异性较大[33],变异系数高[34-35],土壤重金属采样数据多为偏态分布,一般为对数正态分布[36-38]。因此,本研究从采样数据满足正态分布或偏态分布方面出发(图 2),系统论述基于统计学方法确定表层土壤重金属合理采样数目。

图2 基于统计学确定土壤重金属合理采样数目框架图

2.2.1 正态分布下合理采样数目确定方法

(1)经典统计学

土壤合理采样数目不仅取决于土壤样本的变异性,而且需要估计样本总量均值所要求的精度水平和置信区间。当土壤采样数据符合正态分布、相互独立且采样数目足够多时,可以认为中心极限定理成立[39]。可依据 Cochran等人提出的合理采样数计算公式确定采样数目[40]。

式中,为合理的采样数目,(α, f)为某一置信水平下相对应的标准正态偏差,可由分布表查询,为显著水平,通常设为90%及95%;为自由度;为样本变异系数,为相对误差。其中一般可通过前期土壤普查、历史区域文献查找、邻近相似区域替代或专家经验判断获取。

基于经典统计学方法,可以高效快速地求出在一定置信水平和相对精度要求下的整个区域所需土壤样本数量。土壤重金属空间变异越大,则满足一定精度所要求的取样数量也会相应增加;同一变异系数下,要求的采样精度越高,所需的样点数也会越多[41-42]。如阎波杰等[43]指出在土壤砷的变异系数为19.09%时,如果相对误差为从10%降低到5%,所需采样数目从6个增加到35个。王圣伟等[44]认为当相对误差为10%,汞的变异系数由11.3%增加到35.3%时,所需采样数目从5个增加到51个。

依据经典统计学方法,土壤重金属采样数目可以通过样本均值、方差等进行简单计算[45-46]。然而,土壤特征的变化并非完全随机,在不同尺度上土壤特征均呈现出一定的空间结构,具有很明显的空间相关性。这种空间相关性的发现表明基于经典统计学的采样数目计算方法具有较大的缺陷,往往难以避免采样区域局部样点冗余和局部样点数目无法满足精度要求的情况。而且通过变异系数或标准差等参数推出的合理采样数目偏少,无法得出局部变异情况,只能获得变化的大致趋势[47]。如果在确定土壤重金属合理采样数目时,考虑土壤特性的空间相关性,可以更加合理地布置采样点及优化采样数目,从而更加精确地描述土壤特征整体和局部的变化。为了对土壤特性的空间相关性进行描述,地统计学逐渐被引入土壤采样调查研究当中[48]。

(2)地统计学

地统计学是基于区域化变量、随机函数和平稳性假设等概念,依据半方差函数,利用克里格(kriging)方法对未采样点的区域化变量取值进行线性无偏最优估计[49]。其中,应用最广泛的为普通克里格法。它是一个多元线性回归过程,是在给定一个随机过程实测值的条件下,得到该过程的无偏最优估计。在相同的置信区间水平,满足同一精度的条件下,地统计学方法所需要的样本数比传统采样方法所需的样品数少许多[50]。基于克里格确定合理采样数目的方法通常包括:①设置不同采样密度,基于普通克里格法优化采样数目使得插值误差最小化;②以半方差函数为标准确定采样距离,结合研究区面积确定合理采样数目;③结合辅助变量信息的克里格插值法确定合理采样数目,如协同克里格、回归克里格。

依据一定的先验知识,获取研究区原始土壤采样布局,在此基础上进行抽样,进而形成不同的采样密度。分析不同采样密度对土壤重金属空间变异结构的影响,并在不同采样密度下对土壤特性的精度进行评估,使得普通克里格法插值误差最小化的采样数即为合理采样数目。如阎波杰等[43]、李凯等[51]通过比较不同采样密度下的插值精度确定出土壤重金属的合理采样数目。

通过地统计学中的半方差函数确定土壤采样间距也是一种常用的方法。如McBratney等[52]认为在未进行采样的区域,可用已知土壤属性半方差函数变程的平均数作为采样间距。Kerry等[53]将目标区域内不同母质和不同地形部位上的土壤属性进行半方差拟合,将半方差函数变程的一半作为采样间距,并通过结合研究区面积确定合理采样数目。

为了提高插值精度,优化采样数目,众多学者提出结合辅助变量信息的克里格插值方法[54-55]。如李润林等[56]研究表明,基于辅助变量的协同克里格插值的精度高于普通克里格插值,并指出该研究在保证精度条件下的采样数目下限。庞夙等[57]将有机质作为辅助变量研究农田土壤铜含量空间变异,并开展插值分析和采样数量优化研究。李艳等[58]将土壤电导率作为辅助变量分析土壤的全盐含量,并发现通过协同克里格法,深层的采样数减少40%仍能够满足精度要求,据此实现优化采样数目,节省成本费用。

一般认为基于地统计学优化采样数目方法优于经典统计学[43,59],但是在应用于土壤重金属采样数目确定上也有很大的不足。其主要问题在于地统计学采样精度的增加主要依赖于块金方差和空间相关结构方差的比值。如果发生纯块金效应,也就是说土壤特性不存在空间相关性,地统计学不再适用于土壤合理采样布点[60];同时,合理采样数目设定依赖于大量采样后所得的变异函数,而变异函数通常只有在采样后才知道。因此,对于不具备区域先验知识的条件下,难以利用该法指导采样;最后,变异函数需满足正态分布、二阶平稳假设,然而由于土壤重金属采样分布具有较大的变异性[34-35],一般属于偏态分布[61]。因而基于地统计方法确定土壤重金属合理采样数目具有一定的局限性。

(3)模拟退火算法

克里格估计的最大标准误差是评估合理取样数目好坏的一个有效标准,因此提出一种利用模拟退火算法优化土壤样点数目及空间分布的方法,即设定一个目标函数克里格方差,然后利用模拟退火算法优化样点数目及样点布局,使样点的克里格方差最小。模拟退火算法是由Metropolis首次提出,并将其应用于空间统计及合理采样设计当中。如Van Groenigen等[62]通过利用模拟退火算法最小化克里格方差优化采样数目。Vašát等[63]在模拟退火法中通过克里格法和加权克里格法优化采样数目及布局,对不同土壤属性得到全局或局部最优布设。韩宗伟等[64]通过多种地形因子在道路周边设置采样尺度,通过模拟退火法对各样点的空间布局进行优化,并通过设计不同采样点数目,优化土壤采样数目。

已有研究认为对于土壤合理采样数目确定方法,模拟退火算法优于地统计学法[65-66]。然而,模拟退火算法的应用仍然离不开一定的先验知识作支撑,因此这并不适用于没有先验知识情况下的采样布点设计,而更偏重于为多次采样和后期监测点的布置提供参考。同时,模拟退火算法要求采样数据满足正态分布,对于直接应用于偏态分布下土壤重金属采样数目优化并不合理。

2.2.2 偏态分布下合理采样数目确定方法

由于土壤重金属的空间变异性较高[34-35],空间分布不规则[21],为了满足在正态分布下的合理采样数目计算,常常通过对采样点离群值进行剔除或者平滑化。而在实际情况中,土壤污染样点的重金属含量往往显著高于周围样点,简单的剔除会导致一些污染样点被人为删除,从而影响土壤重金属污染评估结果。国内外学者认为土壤污染采样数据并不符合正态分布,而是属于偏态分布,且在土壤地球化学背景下多数为对数正态分布[61,67-70],而基于正态分布下合理采样数目的确定,可能会导致所需数目的低估[71-72]。因此,满足对数正态分布下的合理采样数目确定方法逐渐发展起来。

对数正态分布和正态分布紧密相连,即是一个对数正态随机变量,变量ln是一个正态随机变量,即

式中,为数学期望,为标准差,则称服从对数正态分布。对数正态概率的密度函数为

基于对数正态概率函数,Land[73-76]通过复杂迭代算法给出对数正态分布下区域样本算数平均值的置信宽度、置信区间上限/下限,并列出不同精度下可供查询置信区间的表格。因此,通过给定的置信区间,进而确定出对数正态分布下合理采样数目。Perez等[36]和Armstrong[77]指出这种迭代算法是对数正态分布下合理采样数目的精确算法。遗憾的是,这种计算太过于复杂,且给出的可供查询表格不足以涵盖多数情况[77]。随后,Hale[78]提出对数正态分布下合理采样数目确定公式(如表3,公式4),并比较相对误差为10%和15%下不同几何标准差(geometric standard deviation,GSD)所对应的合理采样数目。

Armstrong[77]通过对Box和Cox提出的置信区间计算方法进行修正,认为公式(5)(表3)计算的置信区间更接近于Land[73-76]所提出的精确采样数目计算结果,更优于正态分布下Cochran算法(公式1)的计算结果。Zhou和Gao等[79]也认为基于这种方法构造的置信区间比较优良。Perez等[36]基于中心极限定理,提出经典对数正态分布公式(表3,公式6)。然而,这个公式对合理样本数的计算多存在低估的现象[24]。

Box 等[80]认为合理采样数目是一个关于采样精度和几何标准差的函数,可以基于对数转化和二次函数公式计算获得,并给出在95%的置信区间下公式。基于Box等[80]提出的算法,Perez 等[36]给出了合理采样数目的计算公式(表3,公式7),然而这个公式更适用于相对误差<25%,且GSD相对较小(如GSD=1.5)的条件,对于>25%且GSD较大时并不推荐[36]。随之,Perez等[36]认为可以通过对经典对数正态分布计算公式进行校正,获取较精确的计算公式(表3,公式8),并适应于较大的相对精度>25%的计算。通过结合经典对数正态分布计算公式和线性回归模型,给出不同置信水平下对应不同GSD(如GSD为1.1,1.5,2.0,2.5,3.0,3.5,4.0)的计算公式。然而,这种方法仍不能计算涵盖不同几何标准差下土壤重金属的合理采样数目。

Singh等[81]采用切比雪夫不等式确定对数正态分布下的土壤污染物的置信区间上限。基于切比雪夫不等式推断出对数正态分布下土壤重金属合理采样数目计算公式(表3,公式9)。多点增量团队(Multi-increment Sampling team)于2012年将切比雪夫不等式应用于美国夏威夷州土壤污染物的置信区间计算,并在多个州进行应用和推广[11]。

表3 对数正态分布下合理采样数目确定方法

注:为合理采样数目;(α, f)为某一置信水平下相对应的标准正态偏差,为显著水平;为自由度;classic为基于经典对数正态分布计算公式所求采样数目;为相对误差;S为随机变量的标准差;GSD为几何标准差(GSD= exp(S);0、1、为给定参数值。

Notes:is an optimum sampling number;(α, f)is the standard normal deviation corresponding to a certain confidence level,is the significance level, andis a degree of freedom;classicis a calculated sampling number based on the classic lognormal distribution equation;is a relative error;Sis a standard deviation of the random variable;GSD is a geometric standard deviation of the lognormal distribution (GSD= exp(S);0,1andare given parameter values.

Augus[82]、Krishnamoorthy等[83]及Wu等[84]分别提出采用自助程序、值方法和有符号的对数似然比修正法构造对数正态分布均值置信区间的方法。张志国[85]通过比较这3种方法计算的置信区间覆盖概率、覆盖误差、上限或下限误差概率及平均偏差,指出有符号的对数似然比修正法优于其他两种方法。通过给定的置信区间反推出对数正态分布下的合理采样数目是一种常用的确定方式。但是这些确定方法更多的是针对于小样本容量,对于应用于较大尺度的区域土壤重金属合理采样数目确定并不合适[85]。

因此,尽管有一些学者提出了对数正态分布下合理采样数目的确定方法,但是这些方法在表层土壤重金属采样布点方面的应用极少。同时,对数正态分布下采样数目的精确算法过于复杂,不同修正公式的应用范围也都有所限制,不足以涵盖土壤重金属在不同变异系数下的采样布点。

2.3 基于经验统计学方法确定土壤重金属合理采样数目

经验统计学是指以经验型方法为辅、统计学方法为主,共同确定表层土壤重金属采样数目的方法。只依靠专家经验确定土壤重金属采样数目的人为主观因素太强,缺乏科学的理论作支撑,而基于统计学方法确定土壤重金属采样数目更多依赖于先验知识,如地统计学在合理采样数目应用中离不开半方差函数。在无先验知识情况下,有必要通过专家经验获取研究区内的先验知识[86]。因此,基于专家经验及统计学相结合的方法确定采样数目是一种有效的土壤重金属采样数目确定方式。

基于经验统计学方法确定土壤重金属合理采样数目一般是先通过专家经验初步判断采样数目,后通过统计学方法优化采样数目。在选用统计学方法时更多的集中于正态分布下的确定方法,如经典统计学、地统计学与专家经验的结合,对于偏态分布特别是对数正态分布下的确定方法的应用极少。Su等[87]在研究土壤铜的采样策略及空间变异时,先基于主观经验以1.72 km2为间距,采集623个样点,后基于协同克里格法优化采样数目使得插值误差最小化,最终使采样数目减少10%;樊燕等[88]在评价汞、铅等土壤重金属污染现状时,依据经验在1 km2的地块内采集121个土壤样品,进而获取土壤重金属的变异系数,后结合经典统计学方法确定合理采样数目,指出在5%的允许误差下,汞的推荐采样数目为83,铅的推荐采样数目为51。李凯等[51]依据土地质量地球化学调查,以1 km×1 km 的网格为基准共采集2 033个土壤样品,后结合地统计学方法优化,得出研究区内采集1 017个样点是比较合理的采样数目。

分阶段采样也是典型的基于经验统计学确定表层土壤重金属采样数目的方法[89-92]。它主要包括两个阶段:初步采样和加密调查。初步调查的主要目的是识别土壤主要污染物及潜在污染区域,为后续的加密调查提供先验知识[93]。法国在环境污染风险评估之前,一般会通过初步采样设计进行污染现场的初步诊断,以便为后续的详细评估提供必要的先验知识[94]。德国和荷兰对初步采样和加密调查有明显的区分,认为初步采样是提供污染区域的基本特征信息,加密调查是为环境和人类健康风险评估提供一切必要的信息[95-96]。

分阶段采样中的初步调查样本量一般是通过专家经验确定。加密调查是在初步调查基础上,通过统计学方法对潜在的污染区域增加采样点。如谢云峰等[93]通过专家经验在初步调查时均匀布点97个,基于地统计学在加密调查区域布点154个,总共采样数目为251个,并指出通过分阶段确定采样数目可显著提高污染区面积和污染区空间位置的估计精度。Hsiao等[97]通过专家经验确定初步调查时的采样数目,后利用贝叶斯定理和条件概率分阶段调查土壤污染,并指出这种方法更有利于发现土壤污染中的热点区。

2.4 其他方法

从成本分析出发确定合理采样数目也是较为常用的方法。Tenenbein[98]通过对土壤样本采集的可靠性及不可靠性进行区分,给出在固定预算成本下使区域土壤样本平均值的变异最小化的合理采样数目计算公式。Gilbert[99]通过Tenenbein 提出的采样数目计算公式,确定了在5 000美元固定预算成本下美国华达州的土壤污染物样本的合理采样数目。

信息价值分析也是一种基于成本分析确定合理采样数目的方法。信息价值分析是对贝叶斯风险-成本-效益决策分析框架的应用,它是基于增加采样点数是否会增加有价值的信息确定合理采样数目。通常将增加采样数会带来的价值信息与增加的采样成本做差定义为信息期望的净价值(ENV),所以当在采样过程中,信息期望的净价值达到最大,从成本效益上看,此时的土壤样本数即为合理采样数。目前VOIA已应用到土壤污染过程中合理采样数目的确定中。如Norberg等[100]应用信息价值分析计算区域内土壤重金属的合理采样数目,并指出该方法可以明显的节省成本。Back[101]通过分析采样数目与预算成本的关系,建立信息价值分析概念模型(VOIA),并指出对于100 m的土壤污染修复单元内,合理的采样数目为16~18个。遗憾的是,这种模型需要通过先验分析、预后验分析及信息价值计算确定合理采样数目,应用较为复杂。

除了上述土壤重金属合理采样数目确定方法之外,国际上也发布了土壤污染物的合理采样数目确定标准。如澳大利亚于1999年针对挥发性物质发布了潜在污染土壤调查与采样导则[102],于2005年发布了针对非挥发性与半挥发性物质的潜在污染土壤调查与采样导则[103]。在确定合理采样数目时分为三类,计算公式如表4所示。

表4 澳大利亚污染土壤采样数目确定标准

基于澳大利亚导则改编,新西兰环保部也发布了关于污染土地管理文件,对于所需合理采样数目确定也是采用澳大利亚导则的方法[104]。关于土壤污染物采样布点方法,美国夏威夷卫生部提出多点增量采样方法(ISM)。其中,当采样数据满足正态分布时确定合理采样数目是通过经典统计学公式(公式1),当采样数据满足对数正态分布时确定合理采样数目是通过切比雪夫不等式(公式9),并且这些方法在多个州进行应用和推广[11]。

3 结论和展望

为了有效合理地确定表层土壤重金属采样数目,本文从土壤重金属采样数目研究现状及土壤重金属采样数目确定方法等方面进行总结,并从经验型、统计学及经验统计学等方面归纳整理国内外常用的土壤重金属采样数目确定方法,发现当前研究存在一些问题:在确定土壤重金属采样数目时缺乏对采样尺度或采样单元的考虑;当下对合理采样数目的研究多热衷于经验型方法,而对统计学及经验统计学的应用相对较少。在采用统计学方法确定采样数目时,更多的集中于正态分布下土壤采样数目确定方法,在满足对数正态分布下土壤采样数目确定方法的研究较少;尽管有学者提出对数正态分布下合理采样数目确定方法,但是对数正态分布下采样数目的精确算法过于复杂,不同修正公式的应用范围也有所限制,不足以涵盖土壤重金属在不同变异系数下的采样布点,且存在对合理采样数目高估及低估的现象;最后,目前极少有研究将对数正态分布下合理采样数目确定方法应用于土壤重金属采样中。鉴于此,建议未来土壤重金属采样数目确定方法研究从以下方面展开:

1)在确定表层土壤重金属采样数目之前,不仅要关注土壤重金属的空间变异情况,更需要明确土壤采样尺度或采样单元。

2)加强基于统计学或经验统计学方法确定合理采样数目的研究。鉴于土壤重金属采样数目确定方法多热衷于专家经验型,导致采样过程主观性强,缺乏科学的统计理论做支撑,因此,通过统计学或经验统计学方法确定土壤重金属采样数目将是未来土壤重金属合理采样数目确定方法研究的关键。

3)由于中国尚未提出对数正态分布下土壤重金属合理采样数目确定方法,造成土壤重金属在同一变异及精度要求下采样数目差异性大,缺少统一有效的土壤重金属采样数目确定方法作指导。因此,从统计学出发,基于对比分析法探索偏态分布特别是对数正态分布下合理采样数目确定方法,并将其应用于中国土壤重金属采样过程中,这将成为中国未来土壤重金属研究的新趋势。

[1]王子龙,陈伟杰,付强,等. 土壤优化采样策略研究进展[J]. 水土保持通报,2017,37(5):205-212. Wang Zilong, Chen Weijie, Fu Qiang, et al. Research progress of soil sampling strategy optimization[J]. Bulletin of Soil and Water Conservation, 2017, 37(5): 205-212. (in Chinese with English abstract)

[2]张继光,陈洪松,苏以荣,等. 喀斯特地区典型峰丛洼地表层土壤水分空间变异及合理取样数研究[J]. 水土保持学报,2006,20(2):114-117. Zhang Jiguang, Chen Hongsong, Su Yirong, et al. Spatial variability of soil moisture content and reasonable sampling number in cluster-peak depression areas of Karst region[J]. Journal of Soil and Water Conservation, 2006, 20(2): 114-117. (in Chinese with English abstract)

[3]Dulski T R. A Manual for the Chemical Analysis of Metals[M]. West Conshohocken: American Society for Testing Material, 1996.

[4]Zhang J, Zhang C. Sampling and sampling strategies for environmental analysis[J]. International Journal of Environmental Analytical Chemistry, 2012, 92(4): 466-478.

[5]Theocharopoulos S P, Wagner G, Sprengart J, et al. European soil sampling guidelines for soil pollution studies[J]. Science of the Total Environment, 2001, 264(1/2): 51-62.

[6]Wagner G, Desaules A, Muntau H, et al. Harmonisation and quality assurance in pre-analytical steps of soil contamination studies—conclusions and recommendations of the CEEM Soil project[J]. Science of the Total Environment, 2001, 264(1/2): 103-118.

[7]FAO. A framework for land evaluation[R]. FAO Soils Bulletin 32, FAO, Rome, 1976.

[8]Ramsey C A, Hewitt A D. A methodology for assessing sample representativeness[J]. Environmental Forensics, 2005, 6(1): 71-75.

[9]Ramsey C A. Considerations for sampling contaminants in agricultural soils[J]. Journal of AOAC International, 2015, 98(2): 309-315.

[10]Minnitt R C A, Rice P M, Spangenberg C. Part 1: Understanding the components of the fundamental sampling error: A key to good sampling practice[J]. Journal of the South African Institute of Mining and Metallurgy, 2007, 107(8): 505-511.

[11]Interstate Technology Regulatory Council (ITRC). Incremental Sampling Methodology[M]. Washington, DC: Interstate Technology & Regulatory Council, Incremental Sampling Methodology Team, 2012.

[12]李双喜,吕卫光,雷艳芳,等. 上海郊区典型农业土壤重金属累积和评价[J]. 上海农业学报,2018,34(3):6-10. Li Shuangxi, Lv Weiguang, Lei Yanfang, et al. Accumulation and evaluation of heavy metals in typical agricultural soil of Shanghai suburbs[J]. Acta Agriculturae Shanghai, 2018, 34(3): 6-10. (in Chinese with English abstract)

[13]袁润杰,于高伟,邱晓蕾,等. 区域土壤重金属空间差异及对蔬菜品质安全影响的分析:以南京八卦洲、江心洲为例[J]. 农业环境科学学报,2015,34(8):1498-1507. Yuan Runjie, Yu Gaowei, Qiu Xiaolei, et al. Regionally spatial variation of soil heavy metals and their influences on vegetable quality: A case study of Baguazhou and Jiangxinzhou, Nanjing, China[J]. Journal of Agro-Environment Science, 2015, 34(8): 1498-1507. (in Chinese with English abstract)

[14]刘勇. 广西某矿区农用地土壤重金属含量分析与污染评价[D]. 南宁:广西师范学院,2012. Liu Yong. Analysis and Assessment on the Heavy Metal Content and Pollution of Farmland Soil in a Mining Field of Guangxi[D]. Nangning: Guangxi Teachers Education University, 2012. (in Chinese with English abstract)

[15]敬久旺,赵玉红,张涪平,等. 藏中矿区表层土壤重金属污染评价[J]. 贵州农业科学,2011,39(7):126-128. Jing Jiuwang, Zhao Yuhong, Zhang Feiping, et al. Evaluation of heavy metals pollution of surface soil in central Tibet mining area[J]. Guizhou Agricultural Sciences, 2011, 39(7): 126-128. (In Chinese with English abstract)

[16]肖明,杨文君,张泽,等. 柴达木农田土壤Cd的积累及风险预测[J]. 植物营养与肥料学报,2014,20(5):1271-1279. Xiao Ming, Yang Wenjun, Zhang Ze, et al. Cadmium accumulation in soil and risk prediction in the Qaidam Basin[J]. Journal of Plant Nutrition and Fertilizer, 2014, 20(5): 1271-1279. (in Chinese with English abstract)

[17]孙超,陈振楼,毕春娟,等. 上海市崇明岛农田土壤重金属的环境质量评价[J]. 地理学报,2009,64(5):619-628. Sun Chao, Chen Zhenlou, Bi Chunjuan, et al. Evaluation on environmental quality of heavy metals in agricultural soils of Chongming island, Shanghai[J]. Acta Geographica Sinca, 2009, 64(5): 619-628. (in Chinese with English abstract)

[18]陈永,黄标,胡文友,等. 设施蔬菜生产系统重金属积累特征及生态效应[J]. 土壤学报,2013,50(4):693-702. Chen Yong, Huang Biao, Hu Wenyou, et al. Heavy metals accumulation in greenhouse vegetable production systems and its ecological effects[J]. Acta Pedologica Sinica, 2013, 50(4): 693-702. (in Chinese with English abstract)

[19]阿吉古丽·马木提,麦麦提吐尔逊·艾则孜,艾尼瓦尔·买买提. 新疆喀什市城乡交错带耕地土壤重金属污染风险评价[J]. 环境工程,2018,36(4):160-164. Ajigul Mamut, Mamattursun Eziz, Anwar Mohammad. Pollution risk assessment of heavy metals from farmland soils in urban-rural ecotone of Kashgar city, Xinjiang[J]. Environmental Engineering, 2018, 36(4): 160-164. (in Chinese with English abstract)

[20]肖雪,赵南京,袁静,等. 淮河流域某镇农业土壤重金属含量特征及污染评价[J]. 光谱学与光谱分析,2014,34(7):1785-1788. Xiao Xue, Zhao Nanjing, Yuan Jing, et al. Analysis of heavy metals distribution characteristics and pollution assessment in agricultural region soils of Huaihe basin[J]. Spectroscopy and Spectral Analysis, 2014, 34(7): 1785-1788. (in Chinese with English abstract)

[21]王波,毛任钊,曹健,等. 海河低平原区农田重金属含量的空间变异性:以河北省肥乡县为例[J]. 生态学报,2006,26(12):4082-4090. Wang Bo, Mao Renzhao, Cao Jian, et al. Spatial variability of the heavy metal contents in cropland of the low Hai river plain: A case study in Feixiang county of Hebei province[J]. Acta Ecologica Sinica, 2006, 26(12): 4082-4090. (in Chinese with English abstract)

[22]曾妍妍,周金龙,王松涛,等. 新疆若羌县农田土壤重金属分布特征及污染评价[J]. 干旱区资源与环境,2017,31(9):87-91. Zeng Yanyan, Zhou Jinlong, Wang Songtao, et al. Distribution characteristics and assessment for farmland soil heavy metals pollution in Ruoqiang county of Xinjiang[J]. Journal of Arid Land Resources and Environment, 2017, 31(9): 87-91. (in Chinese with English abstract)

[23]Utset A, Cid G. Soil penetrometer resistance spatial variability in a Ferralsol at several soil moisture conditions[J]. Soil and Tillage Research, 2001, 61(3/4): 193-202.

[24]Visschers R, Finke P A, De Gruijter J J. A soil sampling program for the Netherlands[J]. Geoderma, 2007, 139(1/2): 60-72.

[25]Oliver M A, Webster R. Combining nested and linear sampling for determining the scale and form of spatial variation of regionalized variables[J]. Geographical Analysis, 1986, 18: 227-242.

[26]Leung Y F, Liu W, Li J S, et al. Three-dimensional spatial variability of arsenic-containing soil from geogenic source in Hong Kong: Implications on sampling strategies[J]. Science of the Total Environment, 2018, 633: 836-847.

[27]Webster R. Quantitative and Numerical Methods in Soil Classification and Survey[M].Oxford: Clarendon Press, 1979.

[28]Webster R, Oliver M A. Statistical Methods in Soil and Land Resource Survey[M]. Oxford: Oxford University Press, 1990.

[29]杨琳. 目的性采样下样本设计与制图精度的关系研究:以数字土壤制图为例[D]. 北京:中国科学院,2009. Yang Lin. Relationships between sample selection and mapping accuracy under purposive sampling: A case study in digital soil mapping Chinese Academy of Sciences[D]. Beijing: Chinese Academy of Sciences, 2009. (in Chinese with English abstract)

[30]Topp L, Barker B, Degenhardt L. The external validity of results derived from ecstasy users recruited using purposive sampling strategies[J]. Drug and Alcohol Dependence, 2004, 73(1): 33-40.

[31]Zhu A X, Burt J E, Smith M, et al. The Impact of Neighborhood Size on Terrain Derivatives and Digital Soil Mapping[M]. Advances in Digital Terrain Analysis, Springer, Berlin, Heidelberg, 2008: 333-348.

[32]Trochim W, Donnelly, J P. Research Methods Knowledge Base[M]. Cincinnat, OH: Atomic Dog Publishing, 2001.

[33]张小敏,张秀英,钟太洋,等.中国农田土壤重金属富集状况及其空间分布研究[J].环境科学,2014,35(02):692-703. Zhang Xiaomin, Zhang Xiuying, Zhong Taiyang, et al. Spatial distribution and accumulation of heavy metal in arable land soil of China[J]. Environment Science, 2014, 35(02): 692-703. (in Chinese with English abstract)

[34]Niu L, Yang F X, Xu C, et al. Status of metal accumulation in farmland soils across China: From distribution to risk assessment[J]. Environmental Pollution, 2013, 176: 55-62.

[35]Song W, Chen B M, Liu L. Soil heavy metal pollution of cultivated land in China[J]. Research of Soil and Water Conservation, 2013, 20(2): 293-298.

[36]Perez A, Lefante J J. Sample size determination and the effect of censoring when estimating the arithmetic mean of a lognormal distribution[J]. Communications in Statistics-Theory and Methods, 1997, 26(11): 2779-2801.

[37]Reza S K, Baruah U, Sarkar D. Hazard assessment of heavy metal contamination by the paper industry, north-eastern India[J]. International Journal of Environmental Studies, 2013, 70(1): 23-32.

[38]王茜. 南陵—泾县国家商品粮基地农田区土壤特征元素分布差异性及潜在生态效应[D].北京:中国地质科学院,2017. Wang Qian. Distribution variability and potential ecological effect of feature elements of farmland top-soil in Nanling-Jing county national commodity grain base[D]. Beijing: Chinese Academy of Geological Sciences, 2017. (in Chinese with English abstract)

[39]史海滨,陈亚新. 土壤水分空间变异的套合结构模型及区域信息估值[J]. 水利学报,1994 (7):70-77,89. Shi Haibin, Chen Yaxin. Combination structure model of soil moisture spatial variability and regional information estimation[J]. Journal of Hydraulic Engineering, 1994 (7): 70-77, 89. (in Chinese with English abstract)

[40]Cochran W G. Sampling Techniques[M]. 3rd edition. New York: John Wiley, 1997.

[41]Gee G W, Bauder J W, Klute A. Methods of Soil Analysis, Part 1: Physical and Mineralogical Methods[M]. Soil Science Society of America Book Series. American Society of Agronomy, Inc. and Soil Science Society of America, Inc. Madison, Wisconsin, 1986: 404-410.

[42]Visschers R, Finke P A, De Gruijter J J. A soil sampling program for the Netherlands[J]. Geoderma, 2007, 139(1-2): 60-72.

[43]阎波杰,潘瑜春,赵春江. 区域土壤重金属空间变异及合理采样数确定[J]. 农业工程学报,2008 (增刊2):260-264. Yan Bojie, Pan Yuchun, Zhao Chunjiang. Spatial variability and reasonable sampling number of regional soil heavy metals[J]. Transactions of the Chinese Society of Agricultural Engineering, 2008 (Supp 2): 260-264. (in Chinese with English abstract)

[44]王圣伟,冯娟,刘刚,等. 多嵌套空间尺度农田土壤重金属空间变异研究[J]. 农业机械学报,2013,44(6):128-135. Wang Shengwei, Feng Juan, Liu Gang, et al. Multi-nesting spatial scales of soil heavy metals in farmland[J]. Transations of the Chinese Society for Agricultural Machinery, 2013, 44(6): 128-135. (in Chinese with English abstract)

[45]Garten Jr C T, Kang S, Brice D J, et al. Variability in soil properties at different spatial scales (1 m-1 km) in a deciduous forest ecosystem[J]. Soil Biology and Biochemistry, 2007, 39(10): 2621-2627.

[46]Yan X Y, Cai Z C. Number of soil profiles needed to give a reliable overall estimate of soil organic carbon storage using profile carbon density data[J]. Soil Science and Plant Nutrition, 2008, 54(5): 819-825.

[47]谢宝妮,常庆瑞,秦占飞. 县域土壤养分离群样点检测及其合理采样数研究[J]. 干旱地区农业研究,2012,30(2):56-61. Xie Baoni, Chang Qingrui, Qin Zhanfei. Outlier identification and reasonable sampling number of soil nutrient at county level[J]. Agricultural Research in the Arid Areas, 2012, 30(2): 56-61. (in Chinese with English abstract)

[48]Cerri C E P, Bernoux M, Chaplot V, et al. Assessment of soil property spatial variation in an Amazon pasture: Basis for selecting an agronomic experimental area[J]. Geoderma, 2004, 123(1-2): 51-68.

[49]Webster R, Oliver M A. Geostatistics for Environmental Scientists (Statistics in Practice)[M]. UK, John Wiley & Sons, 2007.

[50]郭燕. 农田多源信息获取与空间变异表征研究[D]. 杭州:浙江大学,2013. Guo Yan. Study on Multi-source Data Acquisition[D]. Hangzhou: Zhejiang University, 2013. (in Chinese with English abstract)

[51]李凯,赵华甫,吴克宁,等. 土壤重金属Cd污染指数的适宜插值方法和合理采样数量研究[J]. 土壤通报,2016,47(5):1056-1064. Li Kai, Zhao Huafu, Wu Kening, et al. Suitable interpolation method and reasonable sampling quantity of Cd pollution index in soil[J]. Chinese Journal of Soil Science, 2016, 47(5): 1056-1064. (in Chinese with English abstract)

[52]Mcbratney A B, Webster R. How many observations are needed for regional estimation of soil properties?[J]. Soil Science, 1983, 135 (3) : 177-183.

[53]Kerry R, Oliver M A. Average variograms to guide soil sampling[J]. International Journal of Applied Earth Observation and Geoinformation, 2004, 5(4): 307-325.

[54]Szatmári G, László P, Takács K, et al. Optimization of second-phase sampling for multivariate soil mapping purposes: Case study from a wine region, Hungary[J]. Geoderma, 2019, 352: 373-384.

[55] Hengl T, de Jesus J M, MacMillan R A, et al. SoilGrids1km—global soil information based on automated mapping[J]. PloS one, 2014, 9(8): e105992.

[56]李润林,姚艳敏,唐鹏钦,等. 县域耕地土壤锌含量的协同克里格插值及采样数量优化[J].土壤通报,2013,44 (4):830-838. Li Runlin, Yao Yanmin, Tang Pengqin, et al. Optimization of spatial interpolation and sampling size for soil zinc content in cultivated land at county scale using cokriging method[J]. Chinese Journal of Soil Science, 2013, 44 (4): 830-838. (in Chinese with English abstract)

[57]庞夙,李廷轩,王永东,等. 县域农田土壤铜含量的协同克里格插值及采样数量优化[J]. 中国农业科学,2009,42(8):2828-2836. Pang Su, Li Tingxuan, Wang Yongdong, et al. Spatial interpolation and sampling numbers of the concentration of copper in cropland soil on county scale using cokriging[J]. Scientia Agricultura Sinica, 2009, 42 (8): 2828-2836. (in Chinese with English abstract)

[58]李艳,史舟,王人潮,等. 海涂土壤剖面电导率的协同克里格法估值及不同取样数目的比较研究[J]. 土壤学报,2004,41 (3):434-443. Li Yan, Shi Zhou, Wang Renchao, et al. Estimates of electrical conductivity for coastal saline soil profile using cokriging under different sampling density[J]. Acta Pedologica Sinica, 2004, 41 (3): 434-443. (in Chinese with English abstract)

[59]Chang Y H, Scrimshaw M D, Emmerson R H C, et al. Geostatistical analysis of sampling uncertainty at the Tollesbury Managed Retreat site in Blackwater Estuary, Essex, UK: Kriging and cokriging approach to minimise sampling density[J]. Science of the Total Environment, 1998, 221(1): 43-57.

[60]Curran P J. The semivariogram in remote sensing: An introduction[J]. Remote Sensing of Environment, 1988, 24(3): 493-507.

[61]Honda K, Yamamoto Y, Kato H, et al. Heavy metal accumulations and their recent changes in southern minke whalesBalaenoptera acutorostrata[J]. Archives of Environmental Contamination and Toxicology, 1987, 16(2): 209-216.

[62]Van Groenigen J W, Stein A. Constrained optimization of spatial sampling using continuous simulated annealing[J]. Journal of Environmental Quality, 1998, 27(5): 1078-1086.

[63]Vašát R, Heuvelink G B M, Borůvka L. Sampling design optimization for multivariate soil mapping[J]. Geoderma, 2010, 155(3-4): 147-153.

[64]韩宗伟,黄魏,罗云,等. 基于路网的土壤采样布局优化:模拟退火神经网络算法[J]. 应用生态学报,2015,26(3):891-900. Han Zongwei, Huang Wei, Luo Yun, et al. Application of simulated annealing method and neural network on optimizing soil sampling schemes based on road distribution[J]. Chinese Journal of Applied Ecology, 2015, 26(3): 891-900. (in Chinese with English abstract)

[65]Lin Y P, Chang T K, Teng T P. Characterization of soil lead by comparing sequential Gaussian simulation, simulated annealing simulation and kriging methods[J]. Environmental Geology, 2001, 41(1-2): 189-199.

[66]林清火,郭澎涛,罗微,等. 基于空间模拟退火算法的橡胶园土壤取样布局优化[J]. 热带作物学报,2018,39(10):1920-1927. Lin Qinghuo, Guo Pengtao, Luo Wei, et al. Optimization of spatial soil sampling using continuous simulated annealing in rubber plantation[J]. Chinese Journal of Tropical Crops, 2018, 39(10): 1920-1927. (in Chinese with English abstract)

[67]王学松,秦勇. 利用对数正态分布图解析徐州城市土壤中重金属元素来源和确定地球化学背景值[J]. 地球化学,2007(1):98-102. Wang Xuesong, Qin Yong. Application of lognormal distribution plot to interpreting sources and determining geochemical background levels of heavy metals in Xuzhou urban soils, Jiangsu Province[J]. Geochimica, 2007(1): 98-102. (in Chinese with English abstract)

[68]张学礼,徐乐昌,张辉. 某铀尾矿库周围农田土壤重金属污染与评价[J]. 环境科学与技术,2015,38(6):221-226. Zhang Xueli, Xu Lechang, Zhang Hui. Contamination and assessment of heavy metals in farmland soils near an uranium tailings pond[J]. Environmental Science &Technology, 2015, 38(6): 221-226. (in Chinese with English abstract)

[69] Liao Y L, Li D Y, Zhang N X. Comparison of interpolation models for estimating heavy metals in soils under various spatial characteristics and sampling methods[J]. Transactions in GIS, 2018, 22(2): 409-434.

[70] Xie Y F, Chen T B, Lei M, et al. Spatial distribution of soil heavy metal pollution estimated by different interpolation methods: Accuracy and uncertainty analysis[J]. Chemosphere, 2011, 82(3): 468-476.

[71]Greenland S. On sample-size and power calculations for studies using confidence intervals[J]. American Journal of Epidemiology, 1988, 128(1): 231-237.

[72]Kupper L L, Hafner K B. How appropriate are popular sample size formulas?[J]. The American Statistician, 1989, 43(2): 101-105.

[73]Land C E. Confidence intervals for linear functions of the normal mean and variance[J]. The Annals of Mathematical Statistics, 1971, 42(4): 1187-1205.

[74]Land C E. An evaluation of approximate confidence interval estimation methods for lognormal means[J]. Technometrics, 1972, 14(1): 145-158.

[75]Land C E. Standard confidence limits for linear functions of the normal mean and variance[J]. Journal of the American Statistical Association, 1973, 68(344): 960-963.

[76]Land C E. Confidence interval estimation for means after data transformations to normality[J]. Journal of the American Statistical Association, 1974, 69(347): 795-802.

[77]Armstrong B G. Confidence intervals for arithmetic means of lognormally distributed exposures[J]. American Industrial Hygiene Association Journal, 1992, 53(8): 481-485.

[78]Hale W E. Sample size determination for the log-normal distribution[J]. Atmospheric Environment, 1972, 6(6): 419-422.

[79]Zhou X H, Gao S J. Confidence intervals for the log-normal mean[J]. Statistics in Medicine, 1997, 16(7): 783-790

[80]Box G E P, Cox D R. An analysis of transformations[J]. Journal of the Royal Statistical Society. Series B (Methodological), 1964, 26(2): 211-252.

[81]Singh A K, Singh A, Engelhardt M. The lognormal distribution in environmental applications[C]. Technology Support Center Issue Paper, 1997.

[82]Augus J E. Bootstrap one-sided confidence intervals for the lognormal mean[J]. Statistician, 1994, 43: 395-401.

[83]Krishnamoorthy K, Mathew T. Inferences on the means of lognormal distributions using generalized p-values and generalized confidence intervals[J]. Journal of Statistical Planning and Inference, 2003, 115(1): 103-121.

[84]Wu J R, A C M Wong, Jiang G Y. Likelihood-based confidence intervals for a log-normal mean[J]. Statistics in Medicine, 2003, 22(11): 1849-1860.

[85]张志国. 小样本条件下对数正态分布均值置信区间[J]. 齐齐哈尔大学学报,2008,24(4):75-78. Zhang Zhiguo. Confidence intervals of the lognormal mean in the condition of small sample[J]. Journal of Qiqihar University, 2008, 24(4): 75-78. (in Chinese with English abstract)

[86]Flatman G T, Yfantis A A. Geostatistical strategy for soil sampling: The survey and the census[J]. Environmental Monitoring and Assessment, 1984, 4(4): 335-349.

[87]Su P, Li T X, Wang Y D, et al. Spatial interpolation and sample size optimization for soil copper (Cu) investigation in cropland soil at county scale using cokriging[J]. Agricultural Sciences in China, 2009, 8(11): 1369-1377.

[88]樊燕,刘洪斌,武伟. 土壤重金属污染现状评价及其合理采样数的研究[J]. 土壤通报,2008,39(2):369-374. Fan Yan, Liu Hongbin, Wu Wei. Evaluation to soil heavy metals’ pollution and the study of reasonable sampling number[J]. Chinese Journal of Soil Science, 2008, 39(2): 369-374. (in Chinese with English abstract)

[89]Tenenbein A. A double sampling scheme for estimating from misclassified multinomial data with applications to sampling inspection[J]. Technometrics, 2017, 14(1): 187-202.

[90]Domburg P, de Gruijter J J, van Beek P. Designing efficient soil survey schemes with aknowledge-based system using dynamic programming[J]. Geoderma, 1997, 75(3-4): 183-201.

[91]Verstraete S, Van Meirvenne M. A multi-stage sampling strategy for the delineation of soil pollution in a contaminated brownfield[J]. Environmental Pollution, 2008, 154(2): 184-191.

[92]Van Groenigen J W, Stein A, Zuurbier R. Optimization of environmental sampling using interactive GIS[J]. Soil Technology, 1997, 10(2): 83-97.

[93]谢云峰,曹云者,杜晓明,等. 土壤污染调查加密布点优化方法构建及验证[J]. 环境科学学报,2016,36(3):981-989. Xie Yunfeng, Cao Yunzhe, Du Xiaoming, et al. Development and validation of a sampling design optimization procedure for detailed soil pollution investigation[J]. Acta Scientiae Circumstantiae, 2016, 36(3): 981-989. (in Chinese with English abstract)

[94]Malherbe L. Designing a contaminated soil sampling strategy for human health risk assessment[J]. Accreditation and Quality Assurance, 2002, 7(5): 189-194.

[95]Bosman R, Lamé F. In: Bosman R, Arendt F (eds) Altlastensanierung ‘90. WJ van den Brink[C]. Karlsruhe, Bundesrepublik Deutschland, 1990.

[96]Hortensius D, Bosman R, Harmsen J, et al. In: Bosman R, ArendtF (eds). Altlastensanierung ‘90. WJ van den Brink[C]. Karlsruhe, Bundesrepublik Deutschland, 1990.

[97]Hsiao C K, Juang K W, Lee D Y. Estimating the second-stage sample size and the most probable number of hot spots from a first-stage sample of heavy-metal contaminated soil[J]. Geoderma, 2000, 95(1-2): 73-88.

[98]Tenenbein A. A double sampling scheme for estimating from binomial data with misclassifications: Sample size determination[J]. Biometrics, 1971, 27(4): 935-944.

[99]Gilbert R O. Statistical Methods for Environmental Pollution Monitoring[M]. UK, John Wiley & Sons, 1987.

[100]Norberg T, Rosén L. Calculating the optimal number of contaminant samples by means of data worth analysis[J]. Environmetrics, 2006, 17(7): 705-719.

[101]Back P E. A model for estimating the value of sampling programs and the optimal number of samples for contaminated soil[J]. Environmental Geology, 2007, 52(3): 573-585.

[102]AS 4482. 2-1999, Guide to the investigation and sampling of sites with potentially contaminated soil, part 1: volatile substances[S].

[103]SAA-AS-4482. 1, Guide to the investigation and sampling of sites with potentially contaminated soil, part 1: non-volatile and semi-volatile compounds[S].

[104]New Zealand Government. Contaminated Land Management Guidelines No. 5: Site Investigation and Analysis of Soils[M]. New Zealand Government-Ministry for the Environment, 2003.

Research progress of methods for determining sampling numbers of soil heavy metals survey

Huang Yajie1, Li Jumei1, Ma Yibing2※

(1.,,100081,; 2,,999078,)

The soil contamination by heavy metals is one of the increasingly serious environmental issues worldwide, and it is believed to pose a high risk to natural environments and human health when their accumulation exceeds certain levels.Optimum sampling numbers in a sampling unit can be an effective tool to achieve credible results when surveying heavy metals in topsoil and undertaking risk assessment for sustainable land uses or remediation decisions. Based on a large amount of literatures and available data in the recent years, the current situations of sampling numbers, methods ondetermining optimum sampling numbers for survey of soil heavy metals were reviewed in this paper and future research issues in this area were discussed. Also, based on empirical methods (e.g. purposive sampling), statistics (including different methods under the normal distribution and lognormal distribution) and empirical methods combined with statistics (e.g. multi-stage sampling), the merits and demerits of these methods on determining optimum sampling numbers for survey of heavy metals in topsoil were then systematically analyzed and compared. The results showed that there were some challenges or issues. First, the consideration of sampling scales or sampling units was lacked when determining optimum sampling numbers for survey of soil heavy metals. Second, researches for determining optimum sampling numbers were more focused on the empirical methods, but there were few by statistics or empirical methods combined with statistics. When determining optimum sampling numbers by statistics, they were more focused upon the methods under the normal distribution, such as classical statistics, geostatistics and simulated annealing algorithm. However, their usefulness was often limited because there was adequate empirical evidence and a theoretical proof to illustrate that the distribution of soil heavy metal content often approximately followed a lognormal distribution. The application in determining optimum sampling numbers for survey of soil heavy metals under the lognormal distribution, which has little been reported to date. Third, although some scientists proposed the methods to determine optimum sampling numbers under the lognormal distribution, including the Land’s accurate method and other correction equations of this accurate method (such as Hale’s method, Armstrong’s method, classical lognormal equation, quadratic term approximate equation and Chebyshev inequality), the Land’s accurate method under the lognormal distribution was too complex because of the need for computing by an iterative algorithm and requiring extensive tables. The different correction equations had been limited because they not only were not enough to cover the different coefficient of variation of soil heavy metals, but also overestimated or underestimated the optimum sampling numbers. Moreover, these mentioned different methods under the lognormal distribution had not been applied to estimate the optimum sampling numbers for survey of soil heavy metals. Therefore, sampling scales or sampling units of soil heavy metals were defined when determining optimum sampling numbers. The researches on determining optimum sampling numbers by statistics and empirical methods combined with statistics were strengthened. The accurate methods on determining optimum sampling numbers under the lognormal distribution were explored. The methods suited for determining optimum sampling numbers for survey of soil heavy metals in a sampling unit were sought. These ../../../hyj/AppData/Local/youdao/dict/Application/8.5.3.0/resultui/html/index.html - /javascript:;were important guarantees to achieve scientific risk assessment, effective environmental decision-making and pollution control of soil heavy metals.

soils; heavy metals; sampling; statistics; normal distribution; lognormal distribution

黄亚捷,李菊梅,马义兵. 土壤重金属调查采样数目的确定方法研究进展[J]. 农业工程学报,2019,35(24):235-245. doi:10.11975/j.issn.1002-6819.2019.24.028 http: //www.tcsae.org

Huang Yajie, Li Jumei,Ma Yibing. Research progress of methods for determining sampling numbers of soil heavy metals survey[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(24): 235-245. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2019.24.028 http: //www.tcsae.org

2019-05-02

2019-07-30

国家重点研发计划《农田系统重金属迁移转化和安全阈值研究》项目(2016YFD0800400)资助

黄亚捷,博士,主要从事土壤重金属空间变异及在风险管控中的应用研究。Email:huangyajie@caas.cn

马义兵,研究员,博士生导师,主要从事土壤污染物形态及毒害效应、环境风险评价和治理、固体废弃物利用与管理等方面的研究。 Email:ybma@must.edu.mo; mayibing@caas.cn

10.11975/j.issn.1002-6819.2019.24.028

S159-3

A

1002-6819(2019)-24-0235-11

猜你喜欢
正态分布数目对数
关于n维正态分布线性函数服从正态分布的证明*
指数与对数
移火柴
指数与对数
比较底数不同的两个对数式大小的方法
生活常态模式
神奇的对数换底公式
正态分布及其应用
牧场里的马
高考正态分布问题例析