李富富,陈东湘,王院民,颜道浩,吴绍华
基于随机森林与地统计预测城市土壤PAHs分布
李富富1,陈东湘3,王院民1,颜道浩1,吴绍华2,4*
(1.南京大学地理与海洋科学学院,江苏 南京 210046;2.浙江财经大学土地与城乡发展研究院,浙江 杭州 310018;3.浙江财经大学东方学院,浙江 杭州 314408;4.国土资源部城市土地资源监测与仿真重点实验室,广东 深圳 518034)
收集南京城区采样点位置信息和环境变量等数据,应用地统计和随机森林方法,以及两种方法相结合分别预测土壤多环芳烃(polycyclic aromatic hydrocarbons, PAHs)含量,并比较不同方法预测精度.结果表明:随机森林与地统计方法结合能大幅度提高城市土壤污染物制图精度,整合克里金与随机森林预测残差模型拟合优度²相比克里金插值法提高74.8%.PAHs空间制图结果能够较好拟合污染物的变化范围,识别污染高值区与低值区的空间分布.随机森林输出特征重要性发现影响南京城区土壤PAHs分布的主控因子为土壤碳和土壤粒度以及工厂密度.本研究可为城市污染物高分辨率和高精度制图以及污染防控治理提供参考.
城市土壤;多环芳烃;空间分布;地统计;随机森林
城市土壤作为污染物的源与汇,对城市生态环境质量和人类健康具有重要影响[1].多环芳烃(PAHs)是一种土壤中常见的持久性有机污染物,具有三致毒性,在城镇化进程中城市土壤PAHs污染愈加严重[2].为了有效防控PAHs对人体和生态环境的危害,需要对PAHs含量和空间分布进行研究.由于城市土壤的空间高度异质性和污染来源的复杂多样性[3-4],开展土壤污染物空间分布高精度制图有利于研究污染物排放、迁移以及累积特性,为制定污染物防控政策提供支持.
当前对PAHs污染空间分布研究主要采用地统计方法和数理统计法.应用地统计方法能直观地观察污染热点区域.郑一等[5]利用克里金插值法评价了天津表土多环芳烃含量,克里金法计算半变异函数,描述了污染物在空间分布上的结构性.由于城市中人类活动强烈,污染物分布在局部变异也会很大,导致克里金插值结果精度并不高.而数理统计方法更多是用来提取PAHs主要成分谱信息,结合源指纹特征推断PAHs来源,只能粗略对污染物高低值样点进行分类[6].传统的空间制图方法难以精细化表征城市土壤污染空间分布,因此需要在前人基础上提出新的方法研究土壤PAHs空间分布.
研究表明土壤PAHs累积受到众多源汇因子的影响.例如工厂废弃物排放[7]、生物质燃烧[8]、冶炼、煤炭加工[9]、城市交通排放[10]等源因子,以及大气干湿沉降速率[11-12]、土壤有机碳和黑碳含量[13-14]、土壤粒度[15-16]等汇因子.同时有研究报道土壤pH值会影响土壤微生物活性和有机物吸附PAHs亲和力进而间接影响土壤PAHs累积[17],城市植被也会对PAHs累积过程产生直接或间接影响[18-21].利用这些环境因子或可更精确地预测土壤PAHs空间分布.随机森林模型可以很好地处理非线性问题[22],已经应用在地学领域,如土地利用分类[23]、土壤有机质含量预测[24-25]、土壤氮元素预测[26].可利用随机森林模型揭示环境因子与PAHs累积的非线性信息,而克里金法可以描述PAHs含量与空间位置关系,因此机器学习方法与地统计方法组合或可对PAHs空间分布做出高精度的预测[27].
本研究选择南京市作为研究区,采集土壤污染数据与环境变量数据,验证随机森林模型与地统计方法结合对土壤PAHs制图精度,提出高空间变异的城市土壤PAHs制图方法,识别环境因子对PAHs累积影响的重要性,为制定污染防控措施和进一步研究PAHs累积过程提供理论参考.
图1 研究区位置以及采样点分布
本研究选取南京主城区作为研究区(31°56'~ 32°10'N,118°40'~118°58'E)(图1).南京属丘陵地区,气候类型为北亚热带湿润气候,年均气温15.4℃,年均降水量为1106mm.全市森林覆盖率为27.3%,绿化覆盖率为44.2%.南京地区的土壤在北、中部广大地区为黄棕壤,南部有小面积的红壤.南京市重工业产值比重较大,电子设备制造业、化工制造业、汽车制造业、石油加工、炼焦业实现的工业总产值均超过亿元.南京市主城区人为活动剧烈,人口密度大,交通密集,是PAHs重要排放源.
采用网格布点法采集样品,在研究区用五点法采集表层(0~5cm)土壤样品 111个,样点分布如图1.样品在常温条件下干燥,过20,60,100目筛保存于棕色玻璃瓶中,置于-4℃环境中待检测.
提取与净化:将5g土样与5g无水硫酸钠混合均匀,用滤筒包裹后置于索式抽取器的抽滤筒中,在平底烧瓶中依次加入100mL的二氯甲烷和正己烷混合液(=1:1),2g活化的铜片,连续索式提取24个小时;提取液在旋转蒸发仪上浓缩至约2mL后,加入10ml正己烷,继续浓缩至1~2mL.将浓缩后的提取液加入硅胶层析柱进行分离净化.采用正己烷湿法装柱,依次装入棉花,5g硅胶以及2cm的无水硫酸钠;浓缩液上柱后,分别用15mL正己烷和50mL的二氯甲烷和正己烷混合液(=2:3)进行淋洗,正己烷淋洗正构烷烃后不收集,混合溶剂淋洗多环芳烃后收集处理.收集后的溶液用正己烷转换溶剂后,用高纯氮吹至1mL,装入GC瓶,上机待测.
仪器分析:用气相色谱-质谱联用仪(Shimadzu QP2010Ultra)对浓缩液中的多环芳烃进行定量分析.色谱柱为Rtx-5MS(长度30m,内径0.5mm,涂层0.25mm),载气为氦气.采用不分流进样,进样量设定为1mL.接口和离子源的温度分别设置成280,230℃.离子源采用EI模式,数据采集则选择SIM模式.
质量控制:样品处理过程中,每6个样品增加一个空白和基质空白实验;每12个样品做一次重复实验,如果偏差超过15%则重新测试.16种多环芳烃采用外标法测定,标准曲线的溶液浓度依次为4,10, 50,100,400,800mg/L.通过添加标样的方法做回收率实验,萘的平均回收率为73.8%,其他15种化合物平均回收率为84.5%~104.2%,符合环境样品分析要求.
1.2.2 土壤其他指标分析 土壤总碳采用重铬酸钾-硫酸消化法测定;酸处理去除碳酸钙、硅酸盐,氧化处理去除有机碳,干燥后用元素分析仪(CHN- O-Rapid)测定黑碳含量.土壤粒度(SOT)和pH值:土壤粒度采用英国马尔文土壤颗粒激光粒度仪测定;土壤pH值采用电位法测定.
土壤PAHs排放、迁移、降解和累积受到多种因素的共同影响.本文将土壤总碳(TOC)、土壤黑炭(BC)、土壤粒度(SOT)、土壤pH值、非渗透系数(IMP)、叶面积指数(LAI)、工厂密度(PLA)作为环境变量,通过建立模型来预测土壤PAHs最终累积含量的空间分布.由百度地图上抓取的南京市工厂点位数据进行密度计算得到工厂密度.非渗透系数、叶面积指数通过遥感解译获得[28].所有环境变量进行500m×500m空间参数化,为建模提供基础数据.
1.4.1 克里金法 空间制图克里金法是基于区域化变量理论进行空间插值的方法.克里金法基于采样数据计算半方差函数来反映区域化变量结构信息,根据待估计点有限邻域内采样数据,考虑待估计点与采样点的空间关系,满足二阶平稳假设条件下对待估计点进行无偏最优估计.本研究利用普通克里金法绘制土壤PAHs空间分布图.
1.4.2 随机森林空间制图 随机森林是一种以bagging方法集成CART决策树进行分类或回归的机器学习集成算法.本研究应用Python中scikit- learn库建立随机森林模型,参数n_estimators=500, max_features=0.33.本研究PAHs含量变异较大,不符合正态分布,因此采用分层随机抽样将数据集分为训练数据集与验证数据集.模型建立后将参数化环境变量数据输入模型绘制土壤PAHs空间分布图.
1.4.3 整合随机森林与克里金法 克里金法考虑了PAHs含量空间位置的关系.随机森林模型考虑了PAHs在环境中累积与环境因子的关系.整合克里金法与随机森林法或可更好地预测城市土壤中多环芳烃含量.本研究采用模型平均与残差补偿来整合两种模型.模型平均即将两种方法预测的结果进行简单平均作为最终结果.残差补偿即先应用克里金插值预测,然后将预测结果的残差作为因变量,环境变量为自变量建立随机森林模型,最后将随机森林预测结果与克里金插值结果进行相加得到最终预测结果.将参数化环境变量数据分别输入整合模型绘制土壤PAHs空间分布图.
1.4.4 精度评价 将验证集数据应用于4种模型来评估模型精度,即克里金插值模型(K),随机森林模型(RF),两种模型的均值模型(K-RFaverage),残差补偿模型(RFerr+K).计算每种模型预测的平均误差(ME)、平均绝对误差(MAE)、均方根误差(RMSE)和决定系数(),ME越接近0表明估计越无偏.MAE和RMSE越小表明预测误差越小;越接近于1表明模型拟合优度越高.
随机森林模型特征重要性函数可以用来识别影响区域内PAHs累积的主控因子.特征重要性函数通过计算环境变量对样本集进行分割后降低预测目标的不确定性大小,用Gini index减小值表示,Gini index减少值越大,则因子重要性越大[29].因子重要性实质上是对PAHs分布预测结果贡献大小的统计.比如土壤碳、粒度和工厂密度等因子对预测结果贡献大,说明PAHs的累积与这些因子有关,通过前人研究结果可知工厂排放是PAHs累积的源因子[30],土壤碳、粒度是汇因子[16,31].
表1 研究区采样点土壤PAHs含量描述性统计
研究区内采样点总计111个,分层随机抽样86个为训练样本,25个为测试样本(图1).利用SPSS进行数据描述性统计分析.由表1可以看出,训练集与验证集极大值、极小值、平均值较为统一.训练集和验证集的变异系数分别为131%和155%,说明土壤多环芳烃含量变异很大.根据偏度值和峰度值可以判断,训练集和验证集均为非正态分布.克里金插值虽然不严格要求数据呈正态分布,但当数据偏离正态分布太远可能插值效果不理想.随机森林则对数据分布特征没有要求.分层随机抽样保证了训练集和验证集数据分布的基本一致,因此模型建立与评价可靠性高.
2.2.1 克里金模型插值分析 使用ArcMap地统计模块选择普通克里金法插值分析.计算得半方差函数几乎为一条水平直线,块金值为0.19,基台值为0.20,块金值与基台值的比值大于0.95,表明其空间自相关性较弱,插值的准确性较低.
2.2.2 随机森林训练集结果分析 使用Python3.6中scikit-learn库建立随机森林模型.第一个随机森林模型为完全随机森林模型(RF),以城市土壤PAHs为因变量.第二个模型为残差随机森林模型(RFerr),克里金插值预测值与实测值的残差为因变量.在训练集上随机森林显示出很好的拟合优度,决定系数为0.949,对于克里金插值残差的训练集,决定系数达到了0.957(图2).
2.2.3 模型精度评价 观察模型评价的4个指标(表2),从ME和2数值上看随机森林模型显示出最好的预测精度;而MAE和RMSE在数值上显示RFerr+K模型是最好的预测模型.ME表示预测结果随机误差的平均值,由于随机森林模型在预测低值区和高值区时存在系统性偏差,即存在低值区被高估和高值区被低估的现象.对于南京地区来说当土壤多环芳烃均值为750mg/kg[32],环境变量对其无法进一步精确区分;当高值大于4800mg/kg时,受样点数影响,机器学习效果较差(图4b).因此ME不能说明随机森林模型比RFerr+K模型精度更高.2是预测值回归平方和与总离差平方和之比,反映了自变量对因变量的解释程度,2接近于1,观察点在回归直线附近越密集.由于随机森林模型在PAHs含量中值区预测效果很好,因此2较高.但是随机森林在低值区和高值区预测存在偏向相反的系统性误差,虽然整体上2显示回归拟合较好,但是不能认定其精度更高,还需要结合样点总体空间分布预测精度进行判断.
a为随机森林模型在PAHs含量训练集上预测结果;b为随机森林模型在克里金残差训练集上预测结果
RFerr+K模型评估结果显示其绝对误差(MAE)和均方根误差(RMSE)最小,模型精度最高.2较高也表明了其整体上可以较好地解释因变量的变异,但是仅依靠这些统计指标无法反映模型在污染高值区与低值区空间分布预测精度.因此结合图3、图4对样点总体空间分布的模型精度进行比较.由图3可以看出随机森林模型在中值区2.8~3.5拟合很好,而高值区低值区有较大偏差;RFerr+K模型在1.7~4.0高低值区整体上有较好的预测精度.图4中随机森林模型最低值预测结果为750mg/kg,而最高值仅为4800mg/kg,与实测值24,17043mg/kg有较大差距;而RFerr+K模型最低值预测结果为0mg/kg,而最高值为8325mg/kg,在空间分布预测上准确度和精细度都有很大提升.
因此RFerr+K模型可以整合环境变量以及空间结构信息,为0.687相比克里金插值法提高74.8%,同时对PAHs高值区和低值区有较好的识别以及提升整体上预测精度.机器学习算法可以处理土壤PAHs含量与影响因子之间的非线性关系,结合地统计方法可提高制图精度.
表2 模型精度评价
图3 各模型验证集拟合优度
a为克里金插值模型验证集拟合优度;b为随机森林模型验证集拟合优度;c为RFerr+K模型验证集拟合优度;d为K-RF average模型验证集拟合优度,阴影部分表示预测精度置信水平为95%的置信区间
各模型建立完成后输入相关参数进行模型制图,结果如下(图4).从整体上看4种模型制图具有一定一致性,土壤PAHs含量高值区均位于研究区西南部.克里金模型和随机森林模型由于考虑的影响因素不同,最终在预测图中体现出差异.克里金模型通过半变异函数定量化PAHs分布的空间结构,预测高低值分布范围较广.随机森林模型通过环境变量与PAHs含量的非线性关系预测中值区精细度较高.对PAHs高值区和低值区空间分布识别以及整体精度上RFerr+K模型显示了良好的预测效果.如图5所示,随机森林输出因子重要性前5位分别为土壤总碳(TOC)、土壤黑碳(BC)、土壤粒度(SOT)、工厂密度(PLA)、土壤pH值,说明随机森林模型综合了这些环境变量信息比较精细地预测PAHs含量.而叶面积指数(LAI)和非渗透系数(IMP)难以精细表征出植被和降雨径流、入渗对PAHs积累的关系.需要更合适的指标.
图4 不同模型土壤PAHs空间分布预测
a为克里金插值模型预测图;b为随机森林模型预测图;c为K-RF average模型预测图;d为RFerr+K模型预测图
图5 因子重要性评价
随机森林特征重要性函数表示该环境变量对预测结果的相对贡献值,随机森林对因子重要性评价可以识别PAHs分布主控因子.结合前人研究确定PAHs源与汇,以便于更深入地研究该种因素影响过程、机理.输出因子重要性结果如图5,土壤总碳(TOC)、黑碳(BC)、土壤粒度(SOT)、工厂密度(PLA)排在前列,说明这些因子是PAHs累积的主控因子.
研究表明土壤碳对PAHs的物理化学行为、生物过程有显著的影响,如有机质吸附限制了土壤中PAHs的降解是其富集的主要影响因子[14,31];黑碳具有高度芳香化结构,生物化学和热稳定性好,具有较大的表面积,能使极性或非极性有机化合物线性吸附发生偏离[33].土壤粉粒对PAHs吸附有很大影响;粗粉砂中有机质对PAHs富集能力很强[34].工业企业点位与PAHs排放量密切相关,一些焦化企业是土壤PAHs主要排放源[35].本研究区企业密度高值区与污染高值区分布趋于一致.土壤pH值对PAHs预测也有相当影响,土壤pH值可能影响腐殖质的极性,从而影响腐殖质对PAHs亲和力.叶面积指数和非渗透系数2个指标对PAHs分布预测贡献较小,可能由于其难以表征植被与降雨径流、入渗对PAHs累积过程的影响.随机森林因子重要性排序结果与前人研究揭示影响PAHs排放源、吸附、迁移、降解等过程的环境变量基本相符,表明利用随机森林特征重要性函数可以识别环境因子对土壤多环芳烃富集影响的重要程度.
3.1 以南京市作为研究区,建立各预测模型.通过精度验证发现RFerr+K模型能够有效整合环境变量以及空间结构信息,对PAHs污染高值区和低值区有较好的识别以及提升整体预测精度.
3.2 因子重要性评价结果表明土壤总碳、黑碳和土壤粒度是影响PAHs累积的汇因子,工厂排放是PAHs累积的源因子.
[1] Paterson E, Sanka M, Clark L. Urban soils as pollutant sinks — a case study from aberdeen, Scotland [J]. Applied Geochemistry, 1996,11(1): 129-131.
[2] 姚 宏,张士超,刘明丽,等.基于城镇化进程表层土壤多环芳烃来源解析及风险评价[J]. 环境科学, 2018,39(2):889-898. Yao H, Zhang S C, Liu M L, et al. Sources and risk assessment of polycyclic aromatic hydrocarbons from the urbanization process of topsoil [J]. Environmental Science, 2018,39(2):889-898.
[3] Yunker, Mark B, Macdonald, et al. PAHs in the fraser river basin: A critical appraisal of pah ratios as indicators of pah source and composition [J]. Organic Geochemistry, 2002,33(4):489-515.
[4] 倪进治,骆永明,魏 然,等.长江三角洲地区土壤环境质量与修复研究V.典型地区农业土壤中多环芳烃的污染状况及其源解析[J]. 土壤学报, 2008,45(2):234-239. Ni J Z, Luo Y M, Wei R, et al. Soil environmental quality and remediation in yangtze river delta region V. pollution status and sources of polycyclic aromatic hydrocarbons in agricultural soils of typical districts [J]. Acta Pedologica Sinica, 2008,45(2):234-239.
[5] 郑 一,王学军,刘瑞民,等.天津地区土壤多环芳烃的克里格插值与污染评价[J]. 中国环境科学, 2003,23(2):113-116. Zheng Y, Wang X J, Liu R M, et al. Kriging interpolation and pollution assessment of pahs in soil in tianjin area [J]. China Environmental Science, 2003,23(2):113-116.
[6] 刘 庚,毕如田,王世杰,等.某焦化场地土壤多环芳烃污染数据的统计特征[J]. 应用生态学报, 2013,24(6):1722-1728. Liu G, Bi R T, Wang S J, et al. Statistical characteristic analysis of soil PAHs in a coking contaminated site of China [J]. Chinese Journal of Applied Ecology, 2013,24(6):1722-1728.
[7] 朱岗辉,孙 璐,廖晓勇,等.郴州工业场地重金属和PAHs复合污染特征及风险评价[J]. 地理研究, 2012,31(5):831-839. Zhu G H, Sun L, Liao X Y, et al. Combined pollution of heavy metals and PAHs and its risk assessment in industrial sites of Chenzhou city [J]. Geographical Research, 2012,31(5):831-839.
[8] Cao H, Chao S, Qiao L, et al. Urbanization-related changes in soil pahs and potential health risks of emission sources in a township in southern jiangsu, China [J]. Science of the Total Environment, 2016, 575:692.
[9] 薛荔栋,郎印海,刘爱霞,等.黄海近岸表层沉积物中多环芳烃来源解析[J]. 生态环境学报, 2008,17(4):1369-1375. Xue L D, Lang Y H, Liu A X, et al. Source analysis of polycyclic aromatic hydrocarbons in coastal surface sediments of the yellow sea [J]. Acta ecologica sinica, 2008,17(4):1369-1375.
[10] Reis A P M, Shepherd T, Nowell G, et al. Source and pathway analysis of lead and polycyclic aromatic hydrocarbons in lisbon urban soils [J]. Science of the Total Environment, 2016,573:324-336.
[11] Maisto G, Nicola D E, Lovien Pet al. Pahs and trace elements in volcanic urban and natural soils [J]. Geoderma, 2006,136(1):20-27.
[12] Wilcke W. Global patterns of polycyclic aromatic hydrocarbons (pahs) in soil [J]. Geoderma, 2007,141(3/4):0-166.
[13] Liu S D, Xia X H, Zhai Y W, et al. Black carbon (bc) in urban and surrounding rural soils of Beijing, china: Spatial distribution and relationship with polycyclic aromatic hydrocarbons (pahs) [J]. Chemosphere, 2011,82(2):223-228.
[14] Yang Y, Tao S, Zhang N, et al. The effect of soil organic matter on fate of polycyclic aromatic hydrocarbons in soil: A microcosm study [J]. Environmental Pollution, 2010,158(5):1768-1774.
[15] Li H, Chen J, Wei W, et al. Distribution of polycyclic aromatic hydrocarbons in different size fractions of soil from a coke oven plant and its relationship to organic carbon content [J]. Journal of Hazardous Materials, 2010,176(1):729-734.
[16] Liao X, Ma D, Yan X, et al. Distribution pattern of polycyclic aromatic hydrocarbons in particle-size fractions of coking plant soils from different depth [J]. Environmental Geochemistry & Health, 2013, 35(3):271-282.
[17] Pietri J C A, Brookes P C. Relationships between soil ph and microbial properties in a uk arable soil [J]. Soil Biology & Biochemistry, 2008, 40(7):1856-1861.
[18] Kiss M, Takács Á, Pogácsás R, et al. The role of ecosystem services in climate and air quality in urban areas: Evaluating carbon sequestration and air pollution removal by street and park trees in szeged (hungary) [J]. Moravian Geographical Reports, 2015,23(3):36.
[19] Komprdová K, Komprda J, Menšík L, et al. The influence of tree species composition on the storage and mobility of semivolatile organic compounds in forest soils [J]. Science of the Total Environment, 2016,553:532-540.
[20] Selmi W, Weber C, Rivière E, et al. Air pollution removal by trees in public green spaces in strasbourg city, france [J]. Urban Forestry & Urban Greening, 2016,17:192-201.
[21] Simonich S L, Hites R A. Vegetation-atmosphere partitioning of polycyclic aromatic hydrocarbons [J]. Environmental Science & Technology, 1994,28(5):939.
[22] 方匡南,吴见彬,朱建平,等.随机森林方法研究综述[J]. 统计与信息论坛, 2011,26(3):32-38. Fang Q N, Wu J B, Zhu J P, et al. Review of random forest methods [J]. Statistics and information BBS, 2011,26(3):32-38.
[23] 郭玉宝,池天河,彭 玲,等.利用随机森林的高分一号遥感数据进行城市用地分类[J]. 测绘通报, 2016,(5):73-76. Guo Y B, ChiT H, PengL, et al. Classification of urban land using gaofen remote sensing data from random forest [J]. Bulletin of surveying and mapping, 2016,(5):73-76.
[24] 任 丽,杨联安,王 辉,等.基于随机森林的苹果区土壤有机质空间预测[J]. 干旱区资源与环境, 2018,32(8):144-149. Ren L, Yang L A, Wang H, et al. Spatial prediction of soil organic matter in apple region based on random forest [J]. Resources and environment in arid region, 2018,32(8):144-149.
[25] 王茵茵,齐雁冰,陈 洋,等.基于多分辨率遥感数据与随机森林算法的土壤有机质预测研究[J]. 土壤学报, 2016,53(2):342-354. Wang Y Y, Qi Y B, Chen Y, et al. Prediction of soil organic matter based on multi-resolution remote sensing data and random forest algorithm [J]. Acta agronomica sinica, 2016,53(2):342-354.
[26] 郭澎涛,李茂芬,罗 微,等.基于多源环境变量和随机森林的橡胶园土壤全氮含量预测[J]. 农业工程学报, 2015,31(5):194-202. Guo P T, Li M F, Luo W, et al. Prediction of soil total nitrogen content in rubber plantations based on multi-source environmental variables and random forests [J]. Acta agriculturae sinica, 2015,31(5):194-202.
[27] Li J, Heap A D, Potter A, et al. Application of machine learning methods to spatial interpolation of environmental variables [J]. Environmental Modelling & Software, 2011,26(12):1647-1659.
[28] 李 静,柳钦火,尹高飞,等.中国-东盟1km分辨率叶面积指数数据集(2013) [DB/OL]. 全球变化科学研究数据出版系统, 2015. Li J, Liu Q H, Yin G F, et al. China - asean leaf area index data set with 1km resolution (2013) [DB/OL]. Global change science research data publishing system, 2015.
[29] 李 航.统计学习方法[M]. 北京:清华大学出版社, 2012:69-72. Li H. Methods of statistical learning [M]. Beijing: TsinghuaUniversity Press, 2012:69-72.
[30] Li B, Zhou S, Wang T, et al. An improved gridded polycyclic aromatic hydrocarbon emission inventory for the lower reaches of the yangtze river delta region from 2001 to 2015 using satellite data. Journal of Hazardous Materials, 2018,360:329-339.
[31] Nam J J, Thomas G O, Jaward F M, et al. Pahs in background soils from western europe: Influence of atmospheric deposition and soil organic matter[J]. Chemosphere, 2008,9(70):1596-1602.
[32] 张俊叶,俞 菲,俞元春.中国主要地区表层土壤多环芳烃含量及来源解析[J]. 生态环境学报, 2017,26(6):1059-1067. Zhang J Y, Yu F, Yu Y C. analysis of polycyclic aromatic hydrocarbons (pahs) content and source in surface soil of major regions in China [J]. Acta ecologica sinica, 2017,26(6):1059-1067.
[33] Yang Y, Zhang N, Xue M, et al. Impact of soil organic matter on the distribution of polycyclic aromatic hydrocarbons (pahs) in soils [J]. Environmental Pollution, 2010,158(6):2170-2174.
[34] Ni J Z, Luo Y M, Wei R, et al. Distribution of polycyclic aromatic hydrocarbons in particle-size separates and density fractions of typical agricultural soils in the yangtze river delta, east china [J]. European Journal of Soil Science, 2008,59(6):1020-1026.
[35] Li B, Wang J, Wu S, et al. New method for improving spatial allocation accuracy of industrial energy consumption and implications for polycyclic aromatic hydrocarbon emissions in china [J]. Environmental Science & Technology, 2019,53(8):4326-4334.
Distribution prediction of soil PAHs based on random forest and geostatistics methods in urban area.
LI Fu-fu1, CHEN Dong-xiang3, WANG Yuan-min1, YAN Dao-hao1, WU Shao-hua2,4*
(1.School of Geography and Ocean science, Nanjing university, Nanjing 210046, China;2.Institute of land and urban-rural development, Zhejiang university of Finance & Economics;Hangzhou 310018, China;3.School of Dongfang, Zhejiang university of Finance & Economics, Hangzhou 314408;4.The Key Laboratory of Urban Land Resources Monitoring and Simulation, Ministry of Land and Resources, Shenzhen 518034, China)., 2019,39(12):5240~5247
Based on the locational and environmental vairables collected at sampling points in Nanjing city, the Geostatistics and Random forest models were combined to predict the distribution of soil PAHs. Results showed that combination of these two could improve the prediction accuracy of PAHs in the research area. The model fitness achieved by the combined model was 74.8% higher than that from the traditional Kriging method. The generated map also characterized the spatial variation pattern better, and identified the high and low polluted areas. The importance of environmental variables in the output from the random forest model showed that soil carbon, soil texture and plant density were the main controlling factors for PAHS distribution. This study could provide a methodology framework for high-resolution and high-precision mapping of urban pollutants, such as PAHs.(部分单词间缺少空格)
urban soil;PAHs;spatial distribution;geostatistics;random forest
X53
A
1000-6923(2019)12-5240-08
李富富(1996-),男,河南信阳人,南京大学硕士研究生,主要从事城市土壤与环境研究.
2019-05-07
国家自然科学基金资助项目(41671085);国土资源部城市土地资源监测与仿真重点实验室开放基金资助课题(KF201803064)
* 责任作者, 教授, shaohua@zufe.edu.cn