基于高光谱成像技术的菜心铜胁迫快速检测

2022-03-11 00:56黄富荣周泳欣郑海平陈嘉泽刘霓红
现代农业装备 2022年1期
关键词:菜心预处理光谱

黄富荣,周泳欣,郑海平,陈嘉泽,熊 征,刘霓红

(1.暨南大学理工学院光电工程系,广东 广州 510632;2.广东省现代农业装备研究所,广东 广州 510630)

0 引言

在农作物的生长环境中,一切对于作物生长不利的环境因素都可以被称作胁迫。一般而言,根据胁迫的来源,可以将作物胁迫分为生物胁迫与非生物胁迫2 类;而随着日益严峻的气候问题与人类工业的不断发展,非生物胁迫的来源正逐渐增加,非生物胁迫对于农作物生长的不利影响也在日益扩大,被认为比生物胁迫更具有威胁性[1]。

在所有类型的农作物非生物胁迫中,重金属胁迫已然成为全世界都值得关注的问题。自从人类社会进入工业时代以来,工业水平不断发展,人们开矿冶金,金属加工等活动日益频繁,外加各类农业化肥的过度使用,大量未经处理的重金属污染物被排放到自然环境中。据统计,全球每年排放到自然环境中的污染物主要有:汞(Hg)、铜(Cu)、铬(Cd)、铅(Pb)等,其中重金属铜排放量约为3.5×106t/年,为三大重金属污染物之一[2]。

铜元素污染自然环境的方式主要分为3 类:水体污染、大气污染与土壤污染[3],而这3 类污染方式都能够导向并污染农作物的生长环境,从而对农作物产生铜胁迫。受到铜胁迫的农作物,其生理性质与结构都会受到影响:过量的铜元素会阻碍农作物根系生长,影响叶片叶绿素含量,抑制叶片的光合作用,从而对农作物的质量与产量产生极大的负面影响;其次,由于重金属的富集特性与难降解特性,大量铜元素会在农作物中进行累积,并且能够通过食物链对其他生物造成伤害,倘若这类农作物进入到人们的饮食生活中,将会对人类的饮食安全带来极大的威胁[4]。因此,在铜污染日益严重的今天,需要建立快速且有效的农作物铜胁迫检测方法。

早期的重金属检测方法主要以实验室化学检测法为主,通过对农作物生长环境的土壤或者对农作物本身进行化学检测,这类方法由于外界干扰因素多,检测准确率并不高。而目前实验室中高灵敏度的检测方法有:原子吸收光谱法、原子荧光光谱法等。虽然原子吸收光谱法等实验室测量方法能够准确且灵敏地检测农作物是否受到铜胁迫,但其检测周期较长,检测流程繁琐,对样品有损且无法进行实时检测,无法满足人们快速且无损的检测需求。因此,人们开始将目光转向能够实现无损且实时检测的光谱技术。目前运用于快速检测重金属胁迫的光谱技术主要有:近红外光谱技术[13]、激光诱导击穿光谱技术[14]、高光谱成像技术[15]等。其中高光谱成像技术由于能够将光谱信息与图像信息结合提取,在得到图像的同时,能够获取图像上每个像素点的光谱信息,为之后的光谱特征响应分析提供了较为完整且充分的信息。目前,高光谱成像技术已经开始运用到农作物重金属快速检测研究中,ANNEM RUFFING 等[6]使用高光谱成像技术,结合多元曲线分辨技术(MCR),实现了对拟南芥在2 种重金属胁迫(铜与铯)下的鉴定。张双印等[7]利用高光谱成像技术,结合SG 平滑等预处理,分别基于支持向量机(SVM)和BP 神经网络进行诊断,实现了对水稻2种重金属胁迫(铅与隔)的分类诊断,其中SVM 有较好的诊断结果。孙君等[8]利用高光谱成像技术,结合WT-LSSVR 算法选取特征波段,并建立相应的检测模型,用于检测番茄叶片中的重金属镉的含量,其模型决定系数为0.943 7,均方根误差为0.098 8 mg/kg,拥有较好的检测性能。

因此运用高光谱成像技术实现对农作物重金属胁迫的快速检测是可行的,并且能够达到较高的检测准确率,有极大的研究意义。目前基于高光谱成像技术的菜心铜胁迫检测研究较少,本文的研究对于精准农业的发展有一定的应用价值。

菜心是我国南方常见的农作物,一年四季都可播种,生长周期较短,是我国南方地区重要的蔬菜来源。菜心本身易受重金属污染,重金属富集作用显著,且在铜胁迫早期,叶片表面没有明显特征,无法通过肉眼进行分辨[5];因此,利用高光谱技术实现对菜心铜胁迫的早期快速检测对我国食品安全与农业安全有着重要的意义。

1 材料与方法

1.1 实验样品制备

本实验以菜心幼苗作为研究对象,选用的菜心幼苗健康状态与生长态势基本一致,且叶片展开状况良好,采用水培的方式对菜心幼苗进行培养与胁迫,为了作物得到足够的生长所需营养,采用霍格兰营养液进行培养[9],产生铜胁迫的铜离子由CuSO4溶液提供。其中标准霍格兰营养液的成分如表1 所示。

表1 标准霍格兰营养液组成成分

根据标准霍格兰营养液的成分组成,分别配置浓度为标准值200 倍的营养液A 液与B 液,即母液;将配置好的营养液A、B 母液分别与不同浓度的CuSO4母液按一定比例混合,并加入一定量的水进行稀释,最终获得CuSO4浓度分别为0.08(CK)、8、16、24、32 mg/L 的霍格兰营养液。根据我国《农业灌溉水质标准》,含铜量在1 mg/L 以上的水质,便会对农作物产生铜胁迫,因此可使用上述后4 种营养液对菜心进行铜胁迫处理。

选取40 株健康且生长状况相似的菜心幼苗,将40 株菜心平均分为5 组,每组8 株菜心。将5 组幼苗分别放置在40 cm×28 cm×6 cm 的塑料浅盒中进行培育,其中1 组使用标准的霍格兰营养液进行正常水培,作为实验的空白组;另外4 组分别用CuSO4浓度为8、16、24、32 mg/L 的霍格兰营养液进行胁迫水培。

1.2 高光谱数据图像采集和数据提取

1.2.1 图像采集

本次实验采用芬兰SPECIM 公司所生产的SPECIM IQ 便携式高光谱成像系统,如图1 所示,系统包括高光谱相机、卤素灯光源、三脚架以及校正白板。该相机便于携带且操作简单,影像分辨率为512×512,所采集的图像光谱范围为400~1 000 nm,光谱分辨率为3 nm,可提供204个光谱波段信息,能够提供有效的光谱数据进行分析。

图1 高光谱成像系统

将5 组菜心幼苗进行培育与胁迫处理后的第1、3、5、7 d 进行样品的高光谱图像拍摄工作。在高光谱图像采集之前,应使周边环境处于一个较暗的状态,防止拍摄过程中,除卤素灯光源外的其他无关光源的干扰。拍摄过程中应使三脚架两侧对称的卤素灯光源对准样品,保证光线充足,模拟自然环境下的太阳光。样品的拍摄背景应为黑色,便于之后的样品光谱数据提取工作。拍摄时,将菜心幼苗放置于黑色的塑料杯中,并使上层叶片展开,上层叶片与高光谱相机之间保持20 cm 的垂直距离,高光谱相机选用默认的拍摄模式,曝光时间设置为25 ms。拍摄时可将99%反射率的校正白板置于镜头下,高光谱相机会根据校正白板对图像进行自动校正,从而获得校正后的高光谱图像。

通过高光谱图像采集系统,能够获得1 个样品204 个波段下的高光谱图像。经过4 d 的图像采样工作,共获得160 个菜心高光谱图像。

1.2.2 数据提取

获得样品的高光谱图像后,需要对高光谱图像进行处理,并从中获取样品的高光谱信息。通过ENVI5.3 软件,将高光谱图像文件格式转换为TIF格式,并将其导入Matlab 软件。针对高光谱单波段图像,根据样品反射率与背景反射率的差异,基本能够将菜心幼苗样品从图片背景中提取出来,并通过二值化,建立掩膜图像,通过选取感兴趣区域,得到该区域中所需样品的高光谱数据。在实验过程中,通常选取1 片完整的叶片作为感兴趣区域进行数据提取。本实验通过对160 个样品高光谱图像进行数据提取,剔除部分无法获得正常叶片的异常图片,最终能够获取140 个总样品的原始光谱数据。

1.3 光谱数据预处理

在光谱数据采集的过程中,由于采集环境、仪器性能、样品状态等干扰因素,容易在光谱数据中引入噪声,从而影响后续的光谱特性分析。因此,在进行光谱分析之前,需要对原始光谱进行一定的预处理,从而减少原始光谱中的干扰信息。本实验采取一阶微分(First Derivative,FD)、多元散射校正(Multiplicative Scatter Correction,MSC)、标准正态变换(Standard Normal Variate,SNV)3 种预处理方法,同时结合建模分析方法,对比建模后模型的准确率,从而确定最佳预处理方法。

1.4 建模分析方法

1.4.1 偏最小二乘判别分析

偏最小二乘判别分析(Partial least squares Discriminant Analysis,PLS-DA)是一种线性判别算法,通过PLS技术得到样本的分类信息,并建立自变量与分类信息间的回归模型,从而获取与分类信息相关性强的特征变量,实现对样品的分类工作[11]。

1.4.2 支持向量机

支持向量机(Support Vector Machine,SVM)是一种根据监督学习,对样品进行二元分类的算法。其主要思想是寻找能够正确划分样本数据、几何间隔最大的分离超平面,对于难以划分的样本数据可映射到高维空间上,从而实现对样本的分类[12]。对于高维空间的数据运算需要引入核函数,常用的核函数为径向基核函数(REF),并且在建模过程中需要寻找支持向量机的惩罚系数c与径向基核函数中正则化系数g的最优解,提高模型性能。

2 结果与讨论

2.1 光谱数据预处理

分别对原始光谱采用一阶微分(FD)、标准正态分布(SNV)、多元散射校正(MSC)进行预处理工作,原始光谱曲线图与进行预处理后的光谱曲线图如图2 所示。

图2 原始光谱与预处理后的光谱

通过对比原始光谱曲线与预处理后的光谱曲线图,可以发现经过预处理后的光谱曲线相比于原始光谱曲线,噪声信息与冗余信息都得到了一定程度的消除。其中,经过一阶微分处理的光谱曲线能够反映原始光谱的变化率,能够展现出更为深层的信息,但在900~1 000 nm波段存在一定的噪声,在后续分析处理时可进行剔除;经过标准正态分布与多元散射校正处理后的光谱曲线,在保留原始光谱趋势的同时,使光谱曲线更为平滑,并且较好地消除了基线平移与非线性偏移的影响,使光谱信息更为紧密,但1 000 nm波段附近依旧存在一定量的噪声,可在后续分析时进行剔除。

后续建模过程将分别对不同预处理的光谱进行分析,从而选择较好的光谱预处理方法。

2.2 基于不同胁迫程度与不同胁迫时间有无铜胁迫的判别模型

在高光谱数据采集过程中,对于总样品一共采集了140 组高光谱数据。在这140 个总样品中,受到胁迫的样品存在不同胁迫程度与不同胁迫时间的双变量,未受胁迫的样本也存在培养时间的差异,比较贴近自然环境中农作物受到铜胁迫时自身状态的差异性与复杂性。针对总样品光谱数据建立铜胁迫检测模型,对比不同预处理时模型的准确率,选出效果较好的预处理方法。

在建立模型之前,需要对样品进行训练集与测试集的划分。其中训练集为104 个样品,测试集为36 个样品。

2.2.1 PLS-DA 模型

分别将经过预处理的光谱,对训练集进行K 折交互验证,从而选择出适合建模的最优主成分数,根据所选的最优主成分数、训练集与训练标签,建立判断菜心是否受到铜胁迫的检测模型,并使用测试集对建立好的检测模型进行模型准确率评估。表2 为不同预处理光谱数据所建立的PLS-DA 模型测试结果。

表2 PLS-DA模型分类结果

通过表2 可知,在上述3 种预处理方法中,使用SNV 预处理后的数据建模的效果较好,其最优主成分数为10,训练集准确率为84.62%,预测集准确率为80.56%,但对比原始数据所建立的模型,整体的提升幅度较小。

2.2.2 SVM 模型

本次研究所使用的SVM 模型以径向基核函数作为核函数,根据训练集与训练标签建立铜胁迫检测模型,并使用网格搜索算法GS 寻找最优的惩罚系数c与核函数参数g,通过测试集对所建立的SVM 模型进行准确率评估,如表3 所示。

表3 不同预处理下的SVM模型分类结果

通过表3 可知,经FD 预处理后的光谱数据建立的SVM 模型性能较好,相比于原始数据所建立的模型,准确率有较大的提升。

针对4 d 总样品光谱数据进行建模分析,对比PLS-DA 模型与SVM 模型的测试准确率,可以看出,SVM 模型的检测性能较好,能够有效地检测出菜心幼苗是否受到铜胁迫。因此,在自然环境下,由于农作物受到铜胁迫时自身状态的差异性与复杂性,面对胁迫天数与培育天数不同的农作物时,使用非线性的SVM 算法建立的检测模型效果更好。

2.3 基于同一胁迫程度不同胁迫时间有无铜胁迫的判别模型

分别于菜心培育与胁迫处理后的第1、3、5、7 d对菜心进行图像采集,可以分别对每天采集的样本光谱数据进行分析,得出在不同培养天数下对于菜心是否受到铜胁迫的检测准确率,研究菜心受到铜胁迫后多长时间内可被准确检测。

在对同一天的样品进行数据分析之前,可以在高光谱图像处理环节,每个样品选择多个感兴趣区域用于获取高光谱数据,增加样本容量,使每天的光谱数据约为60 个。

2.3.1 PLS-DA 模型

通过分别对光谱做MSC、SNV、FD 预处理,将同一天的样品数据划分训练集与测试集,使用PLS-DA算法分别对每一天的样品数据进行建模分析。表4 为经不同预处理的光谱数据的PLS-DA 模型的检测结果。

表4 PLS-DA模型对不同培养天数的菜心分类结果

由表4 所显示的分析结果可以得知,使用原始光谱数据进行PLS-DA 建模,检测培育时间相同的样品是否受到铜胁迫时,已经达到了较好的效果,测试集的平均准确率为90%。对比不同预处理后的建模结果,可知经MSC 与SNV 预处理后建立的检测模型的稳定性不高,而经过FD 预处理后建立的检测模型稳定性较高,且相比于原始数据建立的模型,其准确性有一定的提高,能够实现对菜心是否受到铜胁迫的早期快速检测。

2.3.2 SVM 模型

按照PLS-DA 模型划分的训练集与测试集结果,首先利用原始NIR 光谱数据及3 种不同预处理(FD、SD、MSC)后的数据建立SVM 判别模型,比较不同预处理方法建立的SVM 模型对预测数据集的预测准确率的高低来选取最佳的预处理方式,其中通过网格搜索算法GS 寻找最优的惩罚系数c与核函数参数g,得到表5。

由表5 可以看出,相比与原始光谱数据所建立的SVM 模型,经过预处理后的SVM 模型在准确率上有明显的提升,其中经FD 预处理后的SVM 模型准确率最佳。但在菜心受到铜胁迫后的第1 d,SVM模型的检测准确率并不理想。

通过对比PLS-DA 模型与SVM 模型的检测结果,可以发现在菜心受到铜胁迫后的第1 d,使用PLSDA 模型进行检测的准确率更高,而在后3 d,经FD预处理的SVM 模型的检测准确率略高于PLS-DA 模型。在实际的农作物种植活动中,由于重金属胁迫在早期无法从农作物的表面所观测到,可以同时使用SVM 模型与PLS-DA 模型对农作物进行检测,通过两者的优势互补,能够实现对农作物铜胁迫的早期快速检测,从而及时进行干预,对农业的生产有着极大的意义。

3 结论

1)利用CuSO4浓度不同的霍格兰营养液培育菜心样品。分4 d 完成样品高光谱图像的采集工作,建立掩膜图像,分割样品与图像背景,选取感兴趣区域提取样品的高光谱数据。

2)针对不同胁迫程度不同胁迫时间进行建模分析,分别使用一阶微分、标准正态变换、多元散射校正对原始光谱进行预处理。分别使用PLS-DA 算法与SVM 算法进行建模分析,比较2 种模型的性能。经过FD 预处理后的SVM 模型检测准确率较高,可达到86.11%。

3)针对同一胁迫程度不同胁迫时间进行建模分析,使用不同的光谱预处理方法,分别使用PLS-DA算法与SVM 算法进行建模分析。经过FD 预处理的PLS-DA 模型稳定性较高,平均准确率可达95%;经过FD 预处理的SVM 模型在胁迫早期的检测准确率不如PLS-DA 模型,但随着胁迫时间推移,该模型检测准确率略优于PLS-DA 模型。

猜你喜欢
菜心预处理光谱
基于三维Saab变换的高光谱图像压缩方法
KR预处理工艺参数对脱硫剂分散行为的影响
预处理对医用外科口罩用熔喷布颗粒过滤性能的影响
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
手术器械预处理在手术室的应用
基于3D-CNN的高光谱遥感图像分类算法
我与菜心的故事
污泥预处理及其在硅酸盐制品中的运用
一把菜心
最好的老年人食谱——牛肝菌扒菜心