基于高光谱的邯郸市土壤重金属统计估算模型研究

2020-07-16 14:02赵玉玲杨楠楠张海霞王小剑孙秀云王炜
生态环境学报 2020年4期
关键词:微分波段光谱

赵玉玲,杨楠楠*,张海霞,王小剑,孙秀云,王炜

1.河北工程大学矿业与测绘工程学院,河北 邯郸 056038;2.邯郸市自然资源空间信息重点实验室,河北 邯郸 056038;3.河北工程大学能源与环境工程学院,河北 邯郸 056038

土壤是人类赖以生存、发展的基础,工矿产业的发展不断危及周边城市土壤环境,城市重金属问题越发显著(葛晓颖等,2019),定量监测重金属对居民健康意义重大(肖捷颖等,2013)。传统实验室法土壤重金属监测较为精准,但在实验设备、经济、实用性等方面有待考究(龚海明等,2013),高光谱遥感基于高空成像技术和地物高光谱(Liu et al.,2015;Lausch et al.,2015),具有多波段、光谱分辨率高、光谱区分力强等特点,可用于更精细的土壤重金属分布制图(罗甫林,2017)。因而目前趋向于由地面光谱仪数据或星载高光谱数据(Liu et al.,2015;杨灵玉等,2016)进行土壤重金属高光谱监测,实现由点到面、由定性到定量分析的大范围立体监测(周斌等,2016)。研究证实,电子跃迁是土壤光谱形成特征波段的主要成因,重金属含量与其光谱响应特征波段的相关性是进行土壤重金属光谱反演的基础(Stazi et al.,2014;付萍杰等,2018)。土壤重金属研究目前多集中于矿区、煤田区与农田污灌区(Tan et al.,2014;荣媛等,2017;周烽松等,2019),而鲜有对城市土壤重金属高光谱反演的研究,且大多探索城市不同功能区土壤重金属反演模型,如李琼琼等(2019)和刘晓清等(2019)基于土壤Zn、Pb高光谱特征,分别构建了上海闵行居民区和城市交通绿地的SMLR和PLSR模型,验证了运用土壤光谱估算城市土壤重金属的可行性,且PLSR模型取得了较佳预测效果;王荣华(2017)则通过对上海城市样带土壤光谱特征进行分析,建立了不同土地利用类型下的高光谱反演模型,研究表明SMLR和PLSR模型在不同功能区的预测效果明显不同,并认为该点与人类干预相关。城市重金属污染因素繁杂,规律难寻,且严重威胁居民生命安全,因而对城市重金属含量及其分布特征进行定量监测具有重大意义。

模型方法中,遥感技术、统计学建模等方法的综合应用,拓宽了重金属动态监测的分析维度,从而达到从宏观定性到微观定量的本质飞跃(谭林等,2017)。预测模型相对常规检测能便捷、精准的分析判断土壤重金属污染现状和趋势,是监测土壤重金属的重要手段之一(赵忠明等,2012)。基于土壤重金属光谱的多响应带及其波段间的强相关性,目前多采用基于光谱变换指标的神经网络、SMLR、PLSR等非线性预测模型,模型预测精度得到提高。然而,任红艳等(2009)在构建矿区农田土壤As、Fe预测模型时发现,主成分分析比PLSR模型反演精度更高,因此,需要根据具体的重金属研究对象确定适合的反演模型。城市土壤重金属污染问题关乎国计民生,引发社会各界重视,依靠传统手段进行土壤重金属研究相对落后,目前高光谱遥感以其波段多、数据量大、图谱合一等优势应用广泛。因此本文基于重金属含量实测数据和ASD采集的高光谱数据,研究并建立邯郸市重金属SMLR、PLSR定量反演模型,旨在定量估算邯郸市土壤重金属含量,提高土壤重金属监测时效性,对城市居民健康具有重要意义,同时也可在波段设置方面为后续邯郸市土壤重金属监测和土壤环境保护工作提供借鉴和支持。

1 材料与方法

1.1 研究区概况

本文研究区是河北省第三大城市——邯郸市,该区域四季分明,温带大陆性季风气候显著,气候宜人。邯郸市地势自西向东倾斜,地貌类型复杂多样,土地利用地域分异明显(吴旭等,2010)。自西向东依次为山地、丘陵、平原,中西部山地丘陵区地形破碎、植被稀疏,水土流失严重,矿井塌陷面积大,灰尘污染随处可见。全市人口众多,近年来邯郸市耕地剧减,人地矛盾突出(陈风云,2014),另外人类活动如化工生产、农药化肥施用、畜禽养殖等,导致外源重金属进入土壤富集,土壤退化严重,造成该区域土壤重金属高污染现状。基于上述研究,在研究区内随机选取31个样本,在采样的同时用手持GPS定位,挖取0—20 cm深的浅表土样约1 kg,用标号的保鲜袋密封运回实验室,经自然风干去除草根石砾后研磨,过100目筛子后分成两份,以备重金属含量分析和光谱测定(王小剑等,2019)。图1为研究区土壤样本分布图。

1.2 研究方法

1.2.1 土壤重金属含量检测与分析

土壤样品经三酸消解后采用 ICP-OES法获得Fe、Cd、Co、Cr、Cu、Mn、Ni、Pb、Zn、As、Hg共11种土壤重金属含量数据,检测出限均小于0.05 mg·kg-1,测定均由空白样和加标回收样控制质量(王小剑等,2019),得到表1所示重金属元素含量统计特征。由表1可知,除As外,其余重金属元素均呈现中等变异性(>20%),元素含量呈近似正态分布,进一步由K-S正态检验的P值均大于0.05,接受样区土壤样本呈正态分布,即土壤样本具有随机代表性。内梅罗综合污染指数P综表明,研究区Cd、Hg、Pb污染最为严重,Cr、Cu、Ni、Zn污染较轻。

1.2.2 光谱测定与预处理

图1 研究区土壤采样点分布图Fig.1 Distribution map of soil samples in the study area

表1 土壤重金属元素含量统计特征Table 1 Statistical characteristics of heavy metal elements content in soil

采用美国ASD Field 4地物波谱仪自带的高密度反射探头进行光谱数据采集,实验于暗箱中进行,土壤样本分别放置于直径10 cm,深1 cm的盛样器皿中,垂直照射刮平的样本表面。采样前进行仪器预热并使用参考白板进行标定,每个土样采集8条光谱曲线,用光谱处理软件ViewSpecPro查看并剔除明显错误光谱,求平均值作为光谱反射率初始数据(易兴松等,2018)。光谱预处理能凸显光谱的特征波段,消减光谱信息的随机误差,提高模型的预测能力,因而在光谱分析中十分必要(Galvez-sola et al.,2010),主要处理方法包括光谱平滑、光谱变换、连续统去除等。因此,本文使用光谱仪软件自带的断点修正工具消除不同探测元件造成的误差,于ENVI中采用9点加权移动平均法对光谱平滑降噪,图2为经断点修正和平滑处理前后的土样反射光谱,光谱较为稳定,且经修正后的曲线在1000 nm和1700 nm处变的更平滑。目标光谱测定受仪器、背景环境等影响,光谱信息被削弱,因而变换光谱数据指标,以消除或减弱背景噪声误差,增强目标光谱信息,提高信噪比(汪大明,2018)。本文将经修正和平滑降噪处理后的反射率光谱称为反射光谱R,分别提取R,R的一阶微分(R′)、二阶微分(R″),R的倒数对数,R的倒数对数的一阶微分、二阶微分,R的平方根,R的连续统去除(CR)等共8种指标的光谱值,以备后续土壤重金属反演。

1.2.3 土壤重金属高光谱建模

目前研究多从统计学角度入手,利用实测高光谱数据与土壤重金属含量数据之间的相关性,通过特征波段选取建立经验统计模型,实现重金属高光谱定量估算(张秋霞等,2017)。在SPSS 24.0中,计算重金属元素含量与 8种指标光谱值的相关系数,结果表明微分指标与土壤重金属的相关性较原始反射光谱得到大幅度提高,尤其是二阶微分。剔除噪声明显的 350—400 nm和2480—2500 nm两个边缘波段,其余波段按照微分指标值与重金属元素含量相关性大小排序,并筛选出在0.05或0.01水平显著相关且相关性最大的前15个波段作为光谱特征候选波段(徐夕博等,2018),若光谱指标值与某一重金属含量最大相关性绝对值低于0.5,则该重金属不再建立相应指标模型。将提取特征波段的不同指标值作为自变量,元素含量值作为因变量,在SPSS中建立SMLR模型,在SIMCA-P 11.0中建立偏最小二乘PLSR模型。研究中将各重金属含量从小到大对样本排序,每隔2个样本抽取一个样本,共抽取10个样本作为模型预测集,剩余21个样本作为建模集,分别用于模型建立与验证。

图2 土壤光谱反射率R曲线处理前后对比Fig.2 Comparison of soil spectral reflectance R before and after treatment

1.2.4 模型验证与评价

土壤重金属光谱反演受空间非连续性、光谱预处理、样本数量等因素影响,模型选择和反演精度不同(叶明亮等,2018;Wei et al.,2011)。决定系数R2常用来评价回归模型的优劣,但随着模型引入自变量个数的增加,R2将不断增大,因而对自变量个数不同的回归模型进行比较时,不能简单地用R2作为评价回归方程的标准,还必须考虑方程所包含的自变量个数的影响。因此本文通过校正决定系数AdjustedR2评估回归模型的拟和优度,通过建模均方根误差RMSEC和预测均方根误差RMSEP对模型的预测能力进行评价,计算公式如下:

其中,xi为土样重金属元素含量实测值,模型样本重金属含量平均值,为模型预测值,P为模型入选特征波段数,n为模型样本数,Nc、Np分别为建模和预测模型样本个数。AdjustedR2可抵消样本数量对模型决定系数R2的影响,是衡量所建模型好坏的重要指标之一,其值越大代表模型拟合效果越好,而RMSE表征模型误差,其值越小模型精度越高。表2、3所示,统计了R′、R′′以及这4种主要指标的相关模型信息,而其他4种指标因与重金属相关性差、建模效果普遍较差而不再探讨。

表2 重金属含量与各微分指标值最大相关波段统计Table 2 Statistical analysis of the maximum correlation band between heavy metal content and each differential index value

2 结果与分析

2.1 相关特征波段统计分析

通过相关分析发现,光谱指标变换可以增强光谱信号,提高重金属与波谱相关性r,突出光谱特征波段,对模型的精度影响较大。图3所示为反射光谱R及其相关微分指标与重金属含量的相关性图,研究发现,二阶微分指标与重金属的相关性大于一阶微分指标与重金属的相关性,反射率倒数对数的一阶导数与重金属的相关性大于反射率的一阶导数的相关性。表2所示为微分指标与土壤重金属含量最大相关波段统计,表中可以看出Co、Cu、As、Hg的反射率倒数对数的一阶导数、Cr的反射率倒数对数的二阶倒数、Pb的反射率的一阶导数等与重金属的最大相关性低于 0.5,这些重金属将不再建立光谱指标波段不能用于相应重金属的光谱指标模型的建立。

2.2 模型监测结果与评价

基于4种微分光谱指标,分别建立各重金属元素的PLSR与SMLR预测模型,统计并分析不同微分指标预测模型的均方根误差 RMSE和修正决定系数AdjustedR2,根据AdjustedR2越大、RMSE越小模型效果越好的原则,统计得到表3、表4基于4种微分指标的最优SMLR、PLSR模型信息。

对比各重金属4种相应指标的所有模型信息,研究表明,(1)土壤重金属元素基于各微分指标的PLSR模型的建模和预测精度整体上大于SMLR模型,且二阶微分模型建模精度优于一阶微分模型;各土壤元素基于微分指标的SMLR和PLSR模型验证精度均低于建模精度,模型预测均方根误差RMSEP均大于建模均方根误差RMSEC。(2)所有微分模型中,反射率倒数对数的二阶微分PLSR模型建模精度高达99.8%,反射率的二阶导数、反射率倒数对数的二阶导数的PLSR模型建模精度区间分别为 0.768—0.903、0.752—0.998,且二阶微分SMLR建模AdjustR2均大于0.6,表明光谱微分处理可以有效提高建模精度;(3)除Hg、Zn元素外,其余元素的最优反演模型都为二阶微分模型;几种金属的最优 PLSR预测模型精度范围为 0.216—0.854,按预测 AdjustR2从高到低排序依次为:Hg>Ni>Cu>As>Co>Cd>Zn>Mn>Pb>Fe>Cr,其中以反射率导数对数的二阶导微分模型为主,说明光谱倒数对数的微分处理可以有效提高建模预测精度。(4)几种金属的最优 SMLR模型建模精度区间为0.719—0.936,按建模AdjustR2从高到低排序依次为:Cu>Hg>Fe>Cd>Mn>Zn>Cr>Co>Ni>As>Pb,预测模型精度而SMLR预测模型中仅Hg元素预测模型AdjustR2大于0.5,其余元素预测效果欠佳。(5)综合考虑土壤元素基于微分指标的SMLR和PLSR模型建模和预测的AdjustedR2、RMSE,从而得出Hg、Fe、Cd、Co、As元素可以得到较好的预测结论。采用 PLSR与 SMLR方法建模和预测相比,PLSR建模和预测的均方根误差总体较小,模型拟合较优,预测能力较好,且基于二阶导指标的两种模型均取得了较好的预测结果。

表3 基于4种微分指标的重金属最优SMLR模型预测分析Table 3 Prediction analysis of the optimal SMLR model for heavy metals based on four differential indexes

表4 基于4种微分指标的重金属最优PLSR模型预测分析Table 4 Prediction analysis of the optimal PLSR model for heavy metals based on four differential indexes

图3 反射光谱R及其相关微分指标与重金属含量的相关性rFig.3 Correlation r of reflection spectrum R and its related differential indexes with heavy metal content

3 讨论

本研究 SMLR模型中基于倒数对数的微分预测模型取得了较好的预测效果,但相对于PLSR效果稍差,验证了基于不同光谱变换指标的PLSR模型比SMLR模型预测效果更好。研究使用风干筛选研磨后的土样,模型精度受土壤水分、颗粒大小等客观条件影响较小,但土壤组成混杂,光谱信息微弱难以被清晰提取,因此选取合适的特征波段建模十分重要。此外,受外界环境因素影响,以及土壤数据采集、处理存在偏差,某些指标下金属建模和预测精度欠佳。本研究在一定程度上实现了对几种重金属元素含量的预测,但不同重金属应尝试采用不同光谱指标建模,以期达到最佳预测效果,且后续研究应充分考虑土壤空间异质性,以及不同尺度效应与反演模型的耦合关系,对模型的适用性展开研究。此外,基于高光谱数据量大的特点,开发专用的智能处理系统,从而促进高光谱遥感技术的应用和发展也是未来的研究趋势。

4 结论

本文基于样本实测高光谱数据,结合地学统计理论和相关分析方法研究并建立不同重金属基于不同光谱指标的遥感估算模型,研究表明:重金属含量与土壤光谱之间的相关性,是建立重金属含量预测模型的必须考虑因素;特征波段的选取以及光谱指标的选择对预测模型的优劣起着重要作用;模型统计结果显示,光谱变换可以提高特征波段选取的精准性,从而提高模型效果;基于不同光谱变换指标的 PLSR模型比 SMLR模型总体预测效果较好。本研究中基于光谱倒数对数的微分模型,其预测精度最高可达到 0.854,一定程度上能满足对邯郸市土壤重金属预测要求。随着遥感以及计算机技术的发展,土壤重金属预测模型不断丰富和完善,对土壤重金属的监测将更加高效简捷,从而为土壤环境保护和城市居民健康提供保障。

猜你喜欢
微分波段光谱
基于三维Saab变换的高光谱图像压缩方法
最佳波段组合的典型地物信息提取
Ap(φ)权,拟微分算子及其交换子
拟微分算子在Hp(ω)上的有界性
高光谱遥感成像技术的发展与展望
一类非线性复微分差分方程解的不存在性
多复变整函数与其关于全导数的微分多项式
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
L波段kw级固态功放测试技术