张双印 王云将 欧阳炜 费腾
摘要 [目的] 通过温室水稻叶片高光谱影像数据,从Cd和Pb不同梯度的交叉胁迫中诊断具体的胁迫类别和胁迫梯度。 [方法] 经过双因素方差分析筛选出特征波段,比较SVM和BP神经网络在诊断能力上的强弱。 [结果] 在几种预处理方法中,对光谱二阶微分预处理可以对Cd和Pb胁迫达到很好的诊断效果,预处理后挑选出6个对Cd胁迫敏感的特征波段以及10个对Pb胁迫敏感的特征波段。基于SVM的诊断Cd胁迫的精度达86%,对3个具体梯度的诊断精度达75%、90%、96%,对Pb胁迫的诊断精度达85%,3个梯度分别为83%、85%、88%;基于BP神经网络的Cd胁迫诊断精度达88%,3个梯度为69%、75%、75%;对Pb胁迫的诊断精度达88%,3个梯度为81%、69%、69%。 [结论] 从植被高光谱影像数据诊断重金属Cd和Pb胁迫是可行的,且SVM的诊断精度整体优于BP神经网络。
关键词 高光谱;重金属诊断;SVM;BP神经网络
中图分类号 S-3;TP79文献标识码 A文章编号 0517-6611(2018)01-0005-05
Abstract [Objective] This study aimed to diagnose specific stress categories and stress gradients from the cross-stress of Cd and Pb with high spectral imagery data of greenhouse rice leaves. [Method] After double factor variance analysis, the characteristic bands for diagnosis were selected, and two models of SVM and BP neural network were compared in terms of diagnostic ability. [Result] The results showed that with the pretreatment of 2nd spectral derivative, SVM could achieve very good diagnostic effect for Cd and Pb stress. 6 characteristic bands were identified sensitive to Cd stress, and 10 characteristic bands were identified sensitive to Pb stress. The accuracy of diagnostic Cd stress based on SVM was 86%, and the diagnostic accuracy of three gradients were 75%, 90% and 96%, while the accuracy of diagnostic Pb stress based on SVM was 85%, and the diagnostic accuracy of three gradients were 83%, 85% and 88%. The diagnostic accuracy of Pb stress based BP neutral network was 88%, and the diagnostic accuracy of three gradients were 69%, 75% and 75%, while the diagnostic accuracy of Pb stress was 88%, and the diagnostic accuracy of three gradients were 81%, 69% and 69%. [Conclusion] It is feasible to diagnose heavy metal Cd and Pb stress from hyperspectral spectral imaging data of vegetation, and the accuracy of SVM is satisfied.
Key words Hyperspectral;Heavy metal diagnosis;SVM;BP neural network
水稻是世界上重要的糧食作物之一,产量比重大、种植范围广。据国家统计局关于2016年粮食产量的公告显示,2016年我国稻谷产量达20 693.4万t,占全年粮食产量的33.58%。一系列人类活动,如采矿、施肥、农药应用等正日益加剧严重的土壤重金属污染[1]。在我国1.2亿hm2的农业用地中,有8.3%的农业用地受到重金属污染威胁[2]。2002年,农业部稻米及制品质量监督检验测试中心曾对全国市场稻米进行安全性抽检,结果显示,稻米中超标最严重的重金属是铅,超标率为28.4%,其次是镉,超标率为10.3%[3]。重金属在植物组织中累积,一方面妨碍作物生长,另一方面通过食物链进入人体,危害人类健康[4]。进入人体内的镉容易累积,会使肾脏细胞内溶酶增加,线粒体肿胀变形,形成蛋白尿、糖尿及氨基酸尿,进而导致肾小管功能紊乱,特别会使骨骼代谢受阻,引起负钙平衡,从而导致骨质疏松[5-6]。铅进入人体后,分布于肝、肾、脑、胰及主要动脉中,会引起末梢神经炎,造成运动和感觉障碍,损害人体的免疫系统,使机体免疫力明显下降,常见症状有失眠、头痛、便秘、贫血等,严重者会发生休克和死亡[5,7-8]。在粮食作物中,从多种复杂的重金属污染中及早诊断出具体的污染类别,可以及时发现和制止污染行为[9]。针对具体污染采取有效措施,为农田的污染治理现代化提供辅助决策,保证粮食安全。
传统的方法以采样为主,一是基于研究区域的土壤和植被采样,利用化学分析检测重金属含量,依此判断土壤重金属污染的程度;二是研究土壤受重金属污染后,植物污染的生理反应和理化参数变化[10-15]。两类研究都需要大量的样本数据采集、化学分析、地理信息解译,时间消耗长,植被破坏强,研究成本高[16-20]。更重要的是,采样点的空间代表性和污染的类型和方式、水稻的品种、耕种灌溉的方法等多因素相关,很难进行大面积的实践推广。高光谱遥感可以高效快速地获取大面积实时影像,为重金属污染诊断提供了可能性。是否可能以及如何从高光谱影像上有效地诊断出具体的污染类别,实现大面积监测,近年来成为研究热点。
目前的研究主要集中在利用土壤的某些代理变量来预测土壤重金属含量方面[17,21-30],但都需要大量的土壤样本数据的采集与处理,周期长、效率低,对植被破坏性强。一方面,它们仅是探究了在污染造成后植被机理变化和土地中重金属含量的关系,都未能从重金属污染中诊断出特定的污染类别;另一方面,这些研究大都是地面作业的基础研究,无法有效地实现大面积水稻实时检测,也就很难应用到实际的重金属污染检测中。
笔者主要针对镉和铅2种重金属胁迫,从高光谱影像数据入手,探究了植被高光谱数据在诊断水稻叶片重金属污染方面的可行性,旨在为从植被叶片高光谱数据诊断重金属污染提供理论依据。
1 材料与方法
1.1 材料
为了有效地控制温度、湿度等环境变量,试验全程在温室内完成。为了精确控制重金属浓度,水稻采用水培方式进行种植,水培种植箱外部使用黑漆完全覆盖;为了后期光谱采集的准确性,水培漂浮板也使用黑色材质。
1.2 方法
1.2.1 重金属胁迫处理设置。试验研究对象是在我国对水稻污染最严重的2种重金属镉(Cd)和铅(Pb),对其各设立3个梯度,具体胁迫浓度见表1。将2种重金属胁迫的任意浓度进行交叉组合,加上空白对照组,共16组样本(表2)。
1.2.2 数据采集。
数据采集仪器使用德国Cubert公司生产的UHD185,它的采集光谱为450~950 nm,采样间隔4 nm,光谱分辨率为8 nm,通道数为125。在水稻的分蘗期到抽穗期,选择无云或者少云的晴朗天气,10:00—14:00进行光谱采集[29]。共进行8次数据采集,采集设备和场地见图1,采集时间分别为2月23日、3月20日、4月12日、4月19日、4月28日、5月9日、5月13日和5月17日,从8次数据采集中选择6次(3月20日、4月12日、4月19日、4月28日、5月9日和5月17日)质量较好的数据作为后续研究的最终数据。数据采集过程贯穿水稻的分蘖期和抽穗期。
1.2.3 数据预处理。
数据预处理可以消除采集时环境变量的影响,目前使用比较普遍的方法有平滑去噪、基线校正、多元散射校正等[31]。SG平滑可以消除随机噪声[16],多元散射校正和标准正态变换可以消除散射的干扰,微分处理(一、二阶微分)能够很好地消除背景信息的影响;均值归一化和标准化能够增加光谱数据的差异性,同时减少信息冗余量[32]。首先使用鲁棒主成分分析(ROBPCA)剔除受噪声干扰严重的异常值,然后对数据进行平滑去噪、均值归一化、标准化、微分(包括一阶微分和二阶微分)以及其他处理和微分的组合处理共11组处理。
1.2.4 特征波段选取。
双因素方差分析法检验Cd和Pb 2个因素的不同水平是否对水稻生长有显著影响,以及这2个因素间是否存在交互效应。对于存在交互效应的波段,因为无法判断是哪一种重金属造成了相应的影响,所以要排除这些波段;在排除交互效应的波段后,分别筛选出仅对Cd、Pb中1种因子敏感的潜在特征波段。
1.2.5 分类诊断。
基于上述得到的潜在敏感的特征波段,通过多次二分类处理,可以验证挑选出来的特征波段在诊断具体(Cd/Pb)重金属胁迫以及各个梯度胁迫时的诊断效果。有无Cd胁迫的二分类,得到特征波段诊断水稻受Cd胁迫的诊断效果;无Cd分别和第一、二、三梯度Cd胁迫做二分类,得到特征波段区分正常水稻在受到第一(二、三)梯度Cd胁迫时的诊断效果。Pb亦然。
1.2.5.1 支持向量机(SVM)分类。
SVM在分类问题上,主要针对二分类的监督分类,旨在解决以下2种问题:对于线性可分的问题,找到一个最优超平面使得样本完全分开;对于线性不可分的情况,通过使用非线性映射算法的核函数,将低维线性不可分的样本转化为高维特征空间使其线性可分。为了避免随机因素影响到试验数据,该研究采用留一交叉验证,每一回合仅预留1个作为验证集,其余都做训练集,最终精度取多次训练精度的平均值,确保训练过程的可靠性。
当诊断Cd胁迫时,首先诊断出有无受Cd的胁迫,然后对于受Cd胁迫的3个梯度分别进行诊断,其中随梯度数(第一梯度、第二梯度、第三梯度)递增受胁迫程度加剧。对于全部96个数据集,将未受Cd胁迫的4组共24个数据训练标签标记为0,其余数据集训练标签标记为1,运行训练模型;对于其余处理梯度,采取和诊断第一梯度Cd胁迫相同的方法,改变数据集,添加训练标签,获得诊断精度。
同样,在诊断Pb胁迫以及3个梯度的胁迫时,采用诊断Cd及Cd 3个梯度时相同的方法即可。
1.2.5.2 BP-神经网络。
BP网络是目前应用广泛的神经网络模型之一,是一种按误差逆传播算法训练的多层前馈网络,它的学习规则使用梯度下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
该研究采用随机2/3数据作为训练样本,剩余1/3作为测试样本。通过预训练,得出隐含层节点数13是一个较合适的参数,输入层与隐含层采用Tan-sigmoid传输函数,输出层采用Purelin线性传输函数。设定最小训练速率为0.1,训练标准差为0.001,训练迭代次数为30,训练函数使用trainlm,学习函数和性能函数采用默认值learndm和mse。
2 结果与分析
当仅考虑水稻有无受到其中1种重金属胁迫时,SVM诊断结果显示,在对光谱二阶微分预处理下,对Cd和Pb胁迫的诊断效果最好,分别达86%和85%;BP神经网络诊断结果显示,在对光谱一阶微分预处理情况下对Cd的诊断效果最好,达87%,平滑和一阶微分组合处理情况下,对Pb胁迫诊断效果最好,达91%。
当综合考虑特征波段个数和整体诊断精度2个因素时,二阶微分预处理的情况下,Cd胁迫诊断效果最好,共挑选出6个特征波段,第一、二、三梯度的Cd胁迫的诊断精度分别为75%、90%、96%(图2);不区分梯度,仅诊断Cd胁迫的有无时,诊断精度达86%,4个诊断参数整体精度都超过了83%,诊断效果较好;与Cd不同,Pb胁迫诊断最好的情况是二阶微分预处理,该预处理情况下挑出对Pb胁迫敏感的10个特征波段,受Pb胁迫的诊断精度达85%,3个梯度的诊断效果分别为83%、85%、88%。具体诊断精度参照表3。
整体诊断水平上,SVM的诊断效果要优于BP神经网络,以二阶微分处理诊断Cd胁迫为例,BP神经网络对Cd胁迫的诊断精度为88%,对第一、二、三梯度胁迫的诊断精度分别为69%、75%、75%(圖3),而同等处理情况下SVM诊断精度分别达86%、75%、90%和96%,整体诊断效果明显优于BP神经网络。
单一的均值归一化和标准化处理,没有筛选出可以区分Cd和Pb胁迫的特征波段,说明单一的均值归一化和标准化处理不能很好地提取不同胁迫的光谱信息,达不到有效诊断的效果。平滑处理以及平滑和微分的组合处理很难在诊断Cd和Pb 2种重金属胁迫上达到很好的平衡,一种胁迫诊断效果很好时,往往另一种胁迫的诊断效果不是非常理想。当其他预处理与微分处理组合时,可以很好地提取特征波段,说明微分处理可以很好地提取不同胁迫的光谱信息,有效地表征光谱差异。
当使用BP神经网络对1种重金属胁迫1次训练进行多级胁迫诊断时,不同处理或者处理组合的情况下,仅Cd的诊断效果超过了60%,分别是标准化和一阶微分组合处理下的65.63%、二阶微分处理下的69%以及平滑和一阶微分组合处理下的63%,Pb仅在二阶微分处理下达到了59%。如表4为二阶微分处理下对Cd各梯度胁迫多级诊断的结果,表5详细给出了各处理情况下的诊断精度。
当进行各个梯度的重金属胁迫诊断时,基于SVM的诊断效果显示,重金属胁迫越严重,试验数据的诊断精度越高,这可能是因为随着胁迫程度的提高,重金属在叶片中富集越严重,进而叶片的生理状态变化越明显。这种生理状态的变化通过叶片的光谱信息反映出来。但是基于BP神经网络的结果恰恰相反,这可能和BP神经网络自身的局限性有关。
3 结论与讨论
以UHD185获取水稻叶片高光谱数据,通过在温室水培环境中的系统性试验,探究了植被高光谱数据在诊断重金属污染上的可行性,探究了不同预处理方法对诊断重金属污染的诊断水平,同时比较了SVM和BP神经网络的诊断性能。通过试验得出以下结论:
①利用植被高光谱数据诊断土壤中的重金属Cd和Pb胁迫是可行的。
②二阶微分处理挑选出来的特征波段数量合适、诊断效果好。
③以SVM为模型诊断精度整体优于BP神经网络。
④该研究中,光谱数据的采集高度应固定在1.5 m。若要实际应用,必须增大数据采集的尺度,提高效率。
后续研究可以借助无人机,以实际大田数据为基础,采集多个尺度下的光谱数据,验证植被高光谱数据在各个尺度上诊断重金属污染的精度变化。另一方面,该研究仅探究了水稻叶片对重金属Cd和Pb胁迫的光谱响应,而在实际中,Cu、Zn、Ni等都会影响水稻的生长状态和叶片的反射特征。后续研究也可以尝试设置多种重金属的交叉污染,进一步验证叶片高光谱数据在叶片存在其他重金属胁迫的噪音下,诊断Cd和Pb重金属污染的能力。
参考文献
[1] WEI B G,YANG L S.A review of heavy metal contaminations in urban soils,urban road dusts and agricultural soils from China[J].Microchemical journal,2010,94(2):99-107.
[2] LIU Y L,WEN C,LIU X J.Chinas food security soiled by contamination[J].Science,2013,339(6126):1382-1383.
[3] 金铭.水稻镉污染胁迫高光谱分析模型研究[D].北京:中国地质大学,2011.
[4] ZHUANG P,MCBRIDE M B,XIA H P,et al.Health risk from heavy metals via consumption of food crops in the vicinity of Dabaoshan mine,South China[J].Science of the total environment,2009,407(5):1551-1561.
[5] 路子显.粮食重金属污染对粮食安全、人体健康的影响[J].粮食科技与经济,2011,36(4):14-17.
[6] 阮玉龙,李向东,黎廷宇,等.喀斯特地区农田土壤重金属污染及其对人体健康的危害[J].地球与环境,2015,43(1):92-97.
[7] 李向宏,郑国璋.土壤重金属污染与人体健康[J].环境与发展,2016,28(1):122-124.
[8] 常学秀,施晓东.土壤重金属污染与食品安全[J].环境科学导刊,2001,20(S1):21-24.
[9] SCHWARTZ G,ESHEL G,BEN-DOR E.Reflectance spectroscopy as a tool for monitoring contaminated soils[M].//PASSCUCCI S.Soil contamination.Rijeka,Croatia:InTech,2011:67-90.
[10] ALEXANDER P D,ALLOWAY B J,DOURADO A M.Genotypic variations in the accumulation of Cd,Cu,Pb and Zn exhibited by six commonly grown vegetables[J].Environmental pollution,2006,144(3):736-745.
[11] BANG J,HESTERBERG D.Dissolution of trace element contaminants from two coastal plain soils as affected by pH[J].Journal of environmental quality,2004,33(3):891-901.
[12] BURGOS P,MADEJN E,PREZ-DE-MORA A,et al.Horizontal and vertical variability of soil properties in a trace element contaminated area[J].International journal of applied earth observations & geoinformation,2008,10(1):11-25.
[13] 黃益宗,朱永官,黄凤堂,等.镉和铁及其交互作用对植物生长的影响[J].生态环境,2004,13(3):406-409.
[14] 姜虎生.镉胁迫对玉米生理特性的影响[J].辽宁石油化工大学学报,2004,24(2):35-37.
[15] 李博文,郝晋珉.土壤镉、铅、锌污染的植物效应研究进展[J].河北农业大学学报,2002,25(S1):74-76.
[16] KEMPER T,SOMMER S.Estimate of heavy metal contamination in soils after a mining accident using reflectance spectroscopy[J].Environmental science & technology,2002,36(12):2742-2747.
[17] KOOISTRA L,WANDERS J,EPEMA G F,et al.The potential of field spectroscopy for the assessment of sediment properties in river floodplains[J].Analytica chimica acta,2003,484(2):189-200.
[18] MOUAZEN A M,MALEKI M R,DE BAERDEMAEKER J,et al.On-line measurement of some selected soil properties using a VIS-NIR sensor[J].Soil & tillage research,2007,93(1):13-27.
[19] JARMER T,VOHLAND M,LILIENTHAL H,et al.Estimation of some chemical properties of an agricultural soil by spectroradiometric measurements[J].Pedospher,2008,18(2):163-170.
[20] REN H Y,ZHANG D F,SINGH A N,et al.Estimation of As and Cu contamination in agricultural soils around a mining area by reflectance spectroscopy:A case study[J].Pedosphere,2009,19(6):719-726.
[21] WU Y Z,CHEN J,JI J F,et al.A mechanism study of reflectance spectroscopy for investigating heavy metals in soils[J].Soil science society of America journal,2007,71(3):918-926.
[22] WU Y Z,CHEN J,WU X M,et al.Possibilities of reflectance spectroscopy for the assessment of contaminant elements in suburban soils[J].Applied geochemistry,2005,20(6):1051-1059.
[23] KOOISTRA L,WEHRENS R,LEUVEN R S E W,et al.Possibilities of visible-near-infrared spectroscopy for the assessment of soil contamination in river floodplains[J].Analytica chimica acta,2001,446(1/2):97-105.
[24] KOOISTRA L,SALAS E A L,CLEVERS J G P W,et al.Exploring field vegetation reflectance as an indicator of soil contamination in river floodplains[J].Environmental pollution,2004,127(2):281-290.
[25] GOMEZ C,ROSSEL R A V,MCBRATNEY A B.Soil organic carbon prediction by hyperspectral remote sensing and field vis-NIR spectroscopy:An Australian case study[J].Geoderma2008,146(3/4):403-411.
[26] LIU M L,LIU X N,DING W C,et al.Monitoring stress levels on rice with heavy metal pollution from hyperspectral reflectance data using wavelet-fractal analysis[J].International journal of applied earth observation & geoinformation,2011,13(2):246-255.
[27] 關丽,刘湘南.水稻镉污染胁迫遥感诊断方法与试验[J].农业工程学报,2009,25(6):168-173.
[28] CHEN T,CHANG Q R,CLEVERS J G P W,et al.Rapid identification of soil cadmium pollution risk at regional scale based on visible and near-infrared spectroscopy[J].Environmental pollution,2015,206:217-226.
[29] SHI T Z,LIU H Z,WANG J J,et al.Monitoring arsenic contamination in agricultural soils with reflectance spectroscopy of rice plants[J].Environmental science & technology,2014,48(11):6264-6272.
[30] WANG J J,CUI L J,GAO W X,et al.Prediction of low heavy metal concentrations in agricultural soils using visible and near-infrared reflectance spectroscopy[J].Geoderma,2014,216(4):1-9.
[31] SHI T Z,CHEN Y Y,LIU Y L,et al.Visible and near-infrared reflectance spectroscopy:An alternative for monitoring soil contamination by heavy metals[J].Journal of hazardous materials,2014,265(2):166-176.
[32] CHU X L,YUAN H F,LU W Z.Progress and application of spectral data pretreatment and wavelength selection methods in NIR analytical technique[J].Progress in chemistry,2004,16(4):528-542.