吴亚楠,董士伟,潘瑜春,任先鹏,魏相峰,李西灿,牛 冲
(1北京市农林科学院信息技术研究中心,北京 100097;2国家农业信息化工程技术研究中心,北京 100097;3山东农业大学信息科学与工程学院,山东 泰安 271018;4肇东市农业技术推广中心,黑龙江 绥化 151100;5山东省地质测绘院,济南 250014)
土壤重金属污染直接影响国民经济发展和耕地农产品质量安全。耕地土壤一旦受到重金属污染,便会通过粮食、蔬菜等农产品给食品安全带来风险,影响居民生活健康,因此,布设监测点位了解耕地土壤污染现状及变化趋势具有重要意义,但若监测点位缺乏代表性、不合理,则对监测结果的准确性产生不利影响。
基础数据是确立点位布设方案的关键环节。耕地土壤重金属来源因素众多,基础数据数量大且复杂多样,在点位布设的前期准备工作中,如何更高效、更深层次的利用基础数据指导空间采样是研究的热点与难点[1]。耕地土壤重金属污染监测点位布设方法大多采用网格法进行随机布点或系统布点,此法存在低效数据、样本点代表性差、污染区被低估和清洁区被高估等问题,使得污染区域污染风险难以控制及产生不必要的修复投入[2]。利用基础数据科学合理选择点位布设方法,可提高污染区的监测评估精度。如Xu等[3]利用工业园区的坡度、土壤类型、地形特征、道路分布等数据,采用随机采样布局对宁夏沙漠草原的土壤重金属污染来源及空间分布进行探索,研究表明工业园区和交通运输对草原土壤环境有显著影响;Laura等[4]利用当地岩性、土地利用现状、交通道路、海拔、风向气候数据等进行点位布设,研究了不同深度和土地利用方式的水泥厂附近土壤重金属Hg、Pb、Cr的含量及分布;谢云峰等[2]基于历史样点数据和辅助数据对土壤重金属Cd污染开展调查,收集了污染地块周边相关信息,辅助采样点布局设计,对污染地块进行初步调查,结合污染概率和局部变异系数确定加密样点区域,对土壤污染分布不确定的较大区域补充加密样点,提高土壤污染调查精度;任旭红等[5]对北京顺义区2007—2009年的土壤历史样点数据进行筛选,删除重复和不合格数据后,基于辅助数据采用无偏采样布局对北京顺义区农田土壤进行采样,结果显示无偏采样布局兼顾了样本点在地理空间和特征空间的均匀性,平衡了总体估计和空间制图要求。因此,充分利用土壤重金属污染相关基础数据指导空间采样[6-7],选择合适的点位布设方法,是土壤重金属监测点布设的发展趋势[1,5]。
笔者以北京顺义区重金属Cd污染监测为例,验证不同数据情境下的耕地土壤重金属污染监测点位布设方法。首先划分基础数据情境类别,其次探讨不同点位布设方法的特点及其适用数据情境,最后给出评价点位布设方法结果的评价指标,旨在为不同数据情境下的耕地土壤重金属污染监测点位布设方法的选择提供理论基础和技术支撑。
北京顺义区位于北京市东北部,北纬40°00′—40°18′,东经116°28′—116°59′,地势北高南低,气候属于暖温带半湿润大陆性季风性气候,年均降雨量约625 mm,境内含有煤炭、大理石、砂石料等矿产资源,含有溶洞、湿地等旅游景观。土壤类型主要为褐土、潮土、沼泽土、水稻土和风沙土等,主要的土地利用类型为耕地,耕地面积404.05 km2,耕地主要包含菜地、水浇地、灌溉水田等。
土壤重金属污染相关基础数据主要来源于北京顺义区统计年鉴、普查数据、北京市农林科学院农产品质量安全管理平台等,主要分为2类:一是历史样点数据;二是辅助数据,如土地利用类型数据、土壤母质数据、土壤质地数据、土壤污染源信息数据、人文经济信息数据、基础地理信息数据等。
1.2.1 基础数据情境类别划分 由《土壤环境质量农用地土壤污染风险管控标准(试行)》(GB 15618—2018)、《耕地质量监测技术规程》(NY/T 1119—2019)、《农用地土壤污染状况调查技术规范》(DB41/T 1948—2020)及各省市耕地土壤环境质量相关技术规范及相关文献[8-10]等资料可知,现行标准主要规定了8项重金属指标,分别是镉(Cd)、汞(Hg)、砷(As)、铅(Pb)、铬(Cr)、铜(Cu)、锌(Zn)和镍(Ni);耕地土壤重金属污染影响因素包含自然因素和人为因素,其中自然因素主要包含土壤母质、土壤结构等,人为因素主要包含农药、化肥、地膜、污水灌溉等农业源数据以及与工业污染源相关的工矿废水、废气、废渣、固废等,因此土壤重金属污染相关辅助数据主要包含自然源数据、农业源数据及工业源数据等。
土壤重金属污染物在土壤中的空间分布具有空间变异性,人类活动对空间变异性影响大[2],对于空间变异性大的区域收集土壤重金属污染相关基础数据,如监测区历史样点数据及辅助数据,并判断现有历史样点数据和辅助数据是否符合实际地块监测要求,如监测研究区范围、监测内容、监测时间、土地利用类型或土壤类型等是否一致等监测要求,进而根据基础数据可用性状况选择合适的点位布设方法,提高耕地土壤重金属污染监测评估精度。根据历史样点数据及辅助数据的有无将基础数据情境分为无历史样点/辅助数据、有历史样点/辅助数据2类,细分为5小类,5类基础数据情境如下。
(1)“无历史,无辅助”数据情境。研究区无历史样点数据或收集的历史样点数据与实际监测研究区范围不符、监测内容缺失、土地利用类型或土壤类型不一致等,历史样点数据不可用。收集的实际监测地块的辅助数据与研究区范围不符、监测内容缺失、监测时间不符等,无符合要求的实际监测地块的历史污染及周边污染属性信息等辅助数据,土壤污染可能分布均匀或分布差异大,土壤污染分布特征不明确,辅助数据不可用。
(2)“无历史,有辅助”数据情境。研究区无历史样点数据或收集的历史样点数据与实际监测研究区范围不符或监测内容缺失或土地利用类型或土壤类型不一致等,历史样点数据不可用。收集的实际监测地块的辅助数据与研究区范围相符、监测内容相符、监测时间相符等,存在可用的监测地块周边污染属性信息,辅助数据可用。
(3)“有历史,无辅助”数据情境。研究区有历史样点数据且收集的历史样点数据与实际监测研究区范围相符、监测内容相符及土地利用类型或土壤类型一致等,历史样点数据可用,但合格的历史样点数目低于实际监测区域合理的采样数目,历史样点数据不充足。收集的实际监测地块的辅助数据与监测研究区范围不符、监测内容缺失、监测时间不符等,不存在可用的监测地块周边污染属性信息,辅助数据不可用。
(4)“有历史,有辅助”数据情境。研究区有历史样点数据且收集的历史样点数据和辅助数据与实际监测研究区范围相符、监测内容相符、土地利用类型或土壤类型一致等,历史样点数据与辅助数据可用,可获取实际监测地块历史污染及周边污染属性信息,土壤污染分布特征明确,但合格的历史样点数目低于实际监测区域合理的采样数目,历史样点数据不充足。
(5)“历史充足”数据情境。收集的历史样点数据与实际监测研究区范围相符、监测内容相符及监测时间相符等,历史样点数据可用且合格的历史样点数目大于实际监测区域合理的采样数目,可用的历史样点数据充足。
1.2.2 点位布设方法 由《陆地定量遥感产品真实性检验通用方法》(GB/T 39468—2020)、《地理信息空间抽样与统计推断》(GB/Z 33451—2016)等相关国家标准与技术文件资料可知,点位布设需遵循代表性、准确性、可比性、完整性等原则,兼顾到历史监测点位,使监测结果具有可比性和延续性,并同时兼顾到不同的土壤类型或污染类型等,以较少的点位及更好的时空代表性来反映土壤重金属污染状况及其变化趋势。目前常见的点位布设方法有传统的随机布点法、系统布点法[11-12]等,以及在传统点位布设方法基础上发展的加密采样布局和无偏采样布局等。
土壤重金属污染监测点位布设方法主要是利用网格方法进行系统布点或随机布点,在同一网格内,最近的且符合监测要求的(如土地利用类型、土壤类型等一致)历史监测点可考虑继续沿用,即首选历史点位[13],用历史监测点代替网格点。考虑到样本点监测成本,当可沿用的历史样点数目较多时,可进行去冗精化处理[14-18],为确保点位代表性,可调整点位密度及优化点位数量,在点位密度大的区域适量删除样本点,点位密度小的区域适当增加样本点,使得样本点分布均匀。为详细调查土壤环境污染状况,在土壤污染空间变异性大的区域、重点污染区域以及污染状况未知等区域进行增设点位,增设的点位可从可用的历史样点数据中进行选择或根据辅助数据进行补测等[13],因此发展了加密采样布局。加密采样布局方法可分为随机采样和目的性采样[19],随机采样基于历史数据或辅助数据进行分层样点布设,目的性采样通过设定优化目标函数使用优化求解方法进行地理空间或特征空间的优化采样布设,如平均最短距离最小化准则(minimization of the mean of the shortest distances,MMSD)[20]、WM 准则(Warrick-Myers-criterion)[21]、空间模拟退火优化算法等,无偏采样布局可看作利用辅助数据进行地理空间和特征空间优化布设的目的性采样方法[19],根据污染物信息数据选择合适的监测点位,提高土壤环境污染监测的准确度,如MMSD准则结合空间模拟退火算法等[22],其考虑到样本点的均匀性及在空间位置的代表性,优化了样本点在特征空间及地理空间的布局[5]。随机布点法及系统布点法不受任何主观条件及历史样点数据和辅助数据存在与否的限制,当研究区域缺乏历史样点数据和辅助数据时亦可使用,是最常用的耕地土壤环境质量监测点位布设方法[23]。综合以上研究,笔者基于不同的基础数据情境推荐了相应的点位布设方法(图1)。
图1 不同数据情境下的点位布设建议策略
1.2.3 点位布设方法结果评价指标 衡量点位布设方法结果的好坏通常是从点位布设方法结果的均匀性和代表性角度考虑,而现阶段寻找一个指标去衡量样本点在地理空间的均匀性及在特征空间的代表性存在一定困难,因此本研究采用地理空间的样本点均匀性表征方法指标——均匀变异指数、特征空间评价指标——偏离指数来评估样本点分布的均匀性及代表性[24]。
(1)均匀变异指数。均匀变异指数是基于均匀因子计算的,均匀因子表示样本点所在研究区域生成的泰森多边形面积与平均采样面积之比。利用均匀因子评估样本点的属性是聚集样本点、稀疏样本点还是均匀样本点,均匀因子越小表示样本点所在区域的冗余样本点数据越少。均匀变异指数表征样本集中全部样本点的整体均匀程度。均匀变异指数越小,表示样本点在地理空间的分布越均匀,反之,所在区域样本点分布存在稀疏或者聚集状况。其计算如式(1)所示。
式中,Ev为所有样本点的均匀变异指数,N为采样区域中的样本点的个数,Vi为第i个样本点的均匀因子。
(2)偏离指数。P-P图(probability-probability plot)和Q-Q图(quantile-quantile plot)通过绘制样本点及相应总体的概率/分位数散点图来比较样本点及其总体的特征分布。定义特征空间偏离指数(deviation index,DI)为以P-P图或Q-Q图中y=x线为基准的标准残差,用偏离指数反映样本点在特征空间的代表性。其计算如式(2)所示。
式中,DI是偏离指数,qi是第i个样本点属性值的分位数/概率,Qi是相应的总体分位数/概率,N是样本点个数。偏离指数越小,样本点在特征空间中的分布代表性越好。
以北京顺义区2020年重金属Cd土壤污染监测点位布设为例,验证前述基于不同数据情境的耕地土壤重金属污染监测点位布设方法的流程及其可操作性。收集顺义研究区现有的2000—2020年重金属Cd历史样点数据和辅助数据,根据基础数据情境选择相应布点策略。
顺义区西部乡镇(北石槽镇、牛栏山地区、赵全营镇、马坡地区、高丽营镇、南法信地区、后沙峪地区、仁和地区、天竺地区及李桥镇)无历史样点数据和辅助数据,属于“无历史,无辅助”的基础数据情境。监测地块历史污染及周边污染属性信息不可用,污染分布特征不明确。为提高监测效率和监测精度,采样点只能均匀布设或者随机布设,因此可采用系统或随机采样布局。
顺义区东部乡镇(南彩镇、张镇、北小营镇、北务镇、李遂镇、大孙各庄镇、杨镇地区、木林镇、龙湾屯镇)具有2007、2008—2009、2012—2013年土壤重金属历史样点监测数据(含有重金属镉Cd),2009、2018—2020年1:50000的土壤信息数据及2018—2020年的1:2000的土地利用现状数据和行政区划数据等辅助数据。辅助数据是对研究区污染信息的辅助说明,所选数据需与历史样点数据统计记录时间相近,保证研究区数据时间属性的一致性,顺义区东部乡镇仅有2009年历史样点数据和辅助数据符合时间一致性及研究内容相关性要求,因此以2009年历史样点数据为主进行点位布设,按相关监测要求筛选得到156个可用历史样点,而同一变异系数不同研究者在农业土壤采样数目的确定上有很大差异,经统计多达140个左右[25],因此顺义区东部乡镇可用的历史样点数目充足,属于“历史充足”的数据情境。顺义区东部乡镇存在可用的历史污染及周边污染属性信息,污染分布特征明确,历史样点充足,为提高样本点均匀性和代表性,采用去冗精化处理。
顺义区东部乡镇属于“历史充足”的数据情境,采取去冗精化处理。首先利用2020年行政区划数据划分顺义研究区,对2020、2009年土地利用现状数据进行耕地类型(水浇地,灌溉水田,菜地)提取,剔除耕地类型变化区域,确立顺义区耕地研究区。顺义区东部耕地研究区含有156个2009年历史样点,利用地理空间和特征空间评价指标评估点位布设结果的均匀性及代表性,最终删除了4个聚集样本点,考虑到样本点属性特征值不发生太大变化,及现场补测样本点需与研究采集的样本点保持更短时间间隔等因素,因此对于样本点的添加主要是考虑在一定时间间隔内的相近的历史样点数据,根据2007—2008年历史样点数据增设了4个加密样本点,利用均匀变异指数和偏离指数评价指标评估顺义区东部研究区样本点去冗精化效果,去冗精化后均匀变异指数由0.546下降为0.468,偏离指数也小于原始样本点布局,去冗精化使得样本点均匀性和代表性提高,满足本案例2020年重金属Cd土壤污染监测点位布设要求。
顺义区西部乡镇(北石槽镇、牛栏山地区、赵全营镇、马坡地区、高丽营镇、南法信地区、后沙峪地区、仁和地区、天竺地区、李桥镇)缺乏历史样点数据与辅助数据,属于“无历史,无辅助”的基础数据情境,采用系统采样布局,布设了144个系统采样点,整个顺义研究区点位布设如图2所示。
图2 顺义区点位布设
基于顺义区东部去冗精化后156个样本点和顺义区西部144个系统采样布局样本点,利用式(1)计算整个顺义研究区的均匀变异指数,经计算,整个顺义区均匀变异指数为0.490。比较均匀变异指数理应是研究区范围一致、样点数一致等,但由于数据受限,现实很难满足该条件,因此不做物理意义上的阐述。仅从均匀变异指数数值表现上来看,顺义区均匀变异指数由原始0.546下降到0.490,尤其是顺义区东部均匀变异指数下降到0.468,且偏离指数小于原始样本点布局,可见本研究所推荐的点位布设方法提高了样本点布局的均匀性,具有一定的科学性和可行性。综上,本研究基于不同数据情境的耕地土壤重金属污染监测点位布设方法具有一定的理论基础和应用价值。
(1)基础数据情境的类别划分及相应的布点策略推荐。针对“无历史,无辅助”、“无历史,有辅助”、“有历史,无辅助”、“有历史,有辅助”、“历史充足”5种基础数据情境,分别推荐了系统/随机采样布局、无偏采样布局、加密采样布局、加密/无偏采样布局、去冗精化布点策略。
(2)以北京顺义区重金属Cd污染监测为例,分析不同数据情境下的点位布设方法的可操作性。顺义区西部属于“无历史,无辅助”数据情境,采用系统采样布局,顺义区东部属于“历史充足”数据情境,采取去冗精化处理。顺义区的均匀变异指数由原始0.546下降到0.490,尤其是顺义区东部均匀变异指数下降到0.468,且偏离指数小于原始样本点布局,验证了不同数据情境的耕地土壤重金属污染监测点位布设方法的可操作性和可行性,具有一定的理论基础和应用价值。
(3)本研究可为不同数据情境的耕地土壤重金属污染监测点位布设方法提供理论基础和技术支撑,并为耕地土壤重金属污染监测点位布设方法的选择提供参考建议。但仍存在一些不足,如布点策略并不一定是最佳布点方案,可能存在其他更好的布点方案;基础数据的数据内容可能因采样目标不同而改变等。