基于高光谱成像技术的西瓜种子活力等级分类方法研究

2022-11-25 08:23段明磊
河南农业科学 2022年9期
关键词:种子活力光谱活力

杨 波,段明磊,杨 童

(1. 重庆对外经贸学院,重庆 401520;2. 南方农业机械与装备关键技术教育部重点实验室,广东 广州 510642;3. 华南农业大学 工程学院,广东 广州 510642)

种子是最小的胚胎植物,结构上种仁被种皮包裹。种仁活力是确保作物高产的重要因素,部分种子因存放时间久导致种子休眠不萌芽,种子休眠使种子内部化学成分发生了变化,但外观上并未发生任何改变,即使是经验丰富的作物培育者也难以判断种子是否能萌芽[1⁃2]。在种子播种前必须知道种子的发芽能力,以确保幼苗数量[3⁃4]。当前西瓜种子种植缺乏有效的精选技术,种子品质不一,依靠传统经验选种无法满足生产需要,大量的不法商贩以次充好出售种子,获取高额利润,同时也浪费了种植成本,降低了优质西瓜的生产率[5⁃6]。

目前国内外学者对种子质量检测做了相关研究,并取得较好的研究结果。LYDIA 等[7]采用X 射线评价沿海植物种子盐浓度对种子发芽率的影响,实现盐浓度分布下种子耐盐性的可视化。JANNAT等[8]利用傅里叶近红外光谱筛选不同活力西瓜种子,有效区分出不同老化程度的西瓜种子。YU 等[9]研究了近红外光谱特性与水稻种子淀粉、蛋白质含量的关系,建立了基于近红外光谱的水稻种子成分快速检测模型。WANG等[10]研究了单粒玉米种子含水率和成熟度的识别方法。孙俊等[11]采用人工加速老化的方式得到水稻种子样本,利用深度学习对不同活力等级的水稻种子进行分类。相比以上技术,高光谱成像技术具有指纹图谱特性,可以多维度地分析种子内部质量[12⁃14]。针对西瓜种子外壳硬度高、种仁被包裹、内部信息分析难等问题,利用高光谱图谱信息的优势对西瓜种子活力等级进行判别,为选购水果种子提供有效参考。

1 材料和方法

1.1 样本的制备

西瓜种子品种为景路7 号,将在常温下贮存1、2、3 a的种子设为3组,每组取100颗进行发芽试验。试验在智能恒温恒湿箱中进行,西瓜种子被铺上3层浸湿的滤纸,喷洒少量清水,并保证每天8 h 的光照时间。另外,利用高光谱成像装置采集完整西瓜种子的图像信息,供试西瓜种子样品信息如表1所示。发芽试验结果显示,种子的贮存时间越短,发芽率越高。贮存期超过3 a 的种子发芽率非常低。因此,将贮存1、2、3 a 的西瓜种子分别设置为高活力、中等活力和低活力种子。

表1 供试西瓜种子样品信息Tab.1 Information on watermelon seed samples for testing

1.2 试验设备及数据采集

高光谱成像装置如图1 所示,将样品放置在电动移动平台,通过白板校正后,电脑点击图像采集按钮,将高光谱相机采集的图像保存至电脑。因CCD 相机采用动态线扫描方式,为保证相机准确稳定的线扫描,需选择相机波段范围的稳定光源,故选择2 盏独立的12 V、20 W 卤素灯,光谱范围400~1 100 nm,分辨率为3.5 nm,相机像素为320×256。

图1 高光谱成像装置Fig.1 Hyperspectral imaging device

高光谱成像装置在采集样品信息前先预热0.5 h,可以消除基线漂移对数据的影响。卤素灯照亮后,西瓜种子的图像被相机捕获,得到三维立方体数据,三维立方体数据中包含了特定像素的光谱信息和特定波长下的图像信息。图像分割与光谱提取流程如图2 所示,利用ENVI 软件打开图像,手动选择感兴区域(Region of interest,ROI),提取代表性光谱,同时借助软件,获取西瓜种子在685、790、826、855 nm 4 个通道下的图像,发现这些通道下的图像最接近原始图片。为了消除光源强度分布不均匀和相机暗电流的影响,需要对高光谱原始图像进行黑白校正,校正公式为公式(1)。

图2 图像分割与光谱提取流程Fig.2 Image segmentation and spectral extraction process

式中,Rλ为标定后的数据,Hλ为全黑数据,Bλ为全白数据,Iλ为原始数据[15]。

1.3 数据处理

数据分析利用化学计量学方法在MATLAB 中实现,其中多元分析模型偏最小二乘判别(PLSDA)在不同类别数据判别中处理效果较好,适合不同活力等级的西瓜种子分类。PLS-DA 模型表达式为Y=X×b+E,式中X是每个类别的光谱矩阵,b是回归系数[16]。Y=1、4、7 时,分别表示贮存1、2、3 a 的西瓜种子。

极限学习机(ELM)模型同样适用于不同类别物质的定性分析,计算如公式(2)[17⁃18]所示,输入变量为x,激励函数为G(x),连接隐含节点和输入节点权值变量为w,b为隐含节点的偏置,β为连接隐含节点和输出节点的权值变量。

2 结果与分析

2.1 西瓜种子光谱分析结果

随着贮存时间的增加,西瓜种子内部结构发生变化,在光谱的照射下,西瓜种子特定的物质信息会发生光谱响应,利用光谱特征可以判断西瓜种子的活力。从西瓜种子高光谱图像中选取感兴区域,然后提取平均光谱。图3是不同活力西瓜种子的平均光谱,在750~900 nm 处西瓜种子谱峰信息丰富,出现波峰和波谷,可能是由于C-H 的伸缩振动、C=H 吸收振动、O-H 伸缩振动以及OH-O 的弯曲振动造成。西瓜种子活力高低主要由亚油酸、软脂酸、油酸、硬脂酸等内部成分决定[19⁃20]。高活力西瓜种子光谱反射率明显高于低活力西瓜种子,高活力种子与低活力种子光谱上存在差异,可能是因为低活力种子贮藏时间久,体内的酸挥发,留在种子内部的酸含量降低。784 nm和865 nm出现波峰和波谷,可能是因为此波段的光透过种壳,穿透到西瓜种子内部的果肉,检测到果肉中的含酸量,这一特征可以作为判别西瓜种子不同活力的依据[21⁃22]。

图3 不同活力等级西瓜种子代表性光谱Fig.3 Representative spectra of watermelon seeds of different vigor levels

图4 是不同活力等级的西瓜种子分类散点图,图中的黑色、红色和蓝色圆点分别表示存放1、2、3 a的西瓜种子,可以明显看出,存放3 a 的西瓜种子与2 a 的西瓜种子出现聚类现象,这表明,西瓜种子的活力等级可以通过光谱或者图像检测出。此外,不同颜色的点有交叉现象,1 a 和2 a 的种子很难区分等级,需要做进一步的数据分析。

图4 不同活力等级西瓜种子分类散点图Fig.4 Scatter diagram of watermelon seeds of different vigor levels

2.2 基于光谱信息的西瓜种子活力等级定性分类

2.2.1 特征变量筛选 由于高光谱数据包含的信息量巨大,光谱变量中包含着许多无用信息,在建模过程中容易降低模型的预测精度。为了提取光谱变量的有效信息,采用连续投影算法(Successive projections algorithm,SPA)、遗 传 算 法(Genetic algorithm,GA)、无 信 息 变 量 消 除(Uniformative variable elimination,UVE)等方法进行特征变量筛选,提高种子活力等级鉴别精度与建模效率。

图5 为利用特征变量筛选方法SPA 和GA 筛选的波长变量图,全光谱波长变量数为255 个,经过SPA筛选出14个特征变量,GA挑选31个特征变量,GA 在400~600 nm 波段挑选变量较多,而SPA 算法所选变量的波长大部分分布在800~1 000 nm。采用UVE对原始光谱数据进行波段筛选,UVE筛选出148个特征变量(图6)。

图5 SPA与GA算法筛选的变量Fig.5 Variables screened by SPA and GA algorithms

图6 UVE算法筛选的变量Fig.6 Variables screened by UVE algorithm

2.2.2 西瓜种子活力等级定性判别 表2是采用不同特征变量筛选方法结合ELM 算法建立的活力判别模型结果,利用Sin、Sig、Hardlim 等3 种激励函数分别对120 条光谱数据进行建模,其中预测集30个,建模集90个,经过程序多次运行,统计最佳结果,Hardlim 函数分类正确率偏低,UVE 特征变量筛选结合ELM 模型的Sig函数,分类正确率最高,相关系数达到0.83,仅有1 个发生了误判,误判率为3.33%。

表2 特征变量筛选方法结合ELM预测结果Tab.2 Prediction results of method of screening characteristic variables combined with ELM

用相同的建模数据和预测数据输入PLS-DA 模型中,对西瓜种子活力等级进行判别,设2.5 和5.5为阈值,判别结果如表3 所示,特征变量筛选方法UVE 结合建模方法PLS-DA 模型效果最佳,预测集均方根误差(RMSEP)为0.88,预测集相关系数(Rp)为0.86,分类正确率为100.00%。

表3 特征变量筛选方法结合PLS-DA预测结果Tab.3 Prediction results of method of screening characteristic variables combined with PLS-DA

图7 是在UVE 结合PLS-DA 情况下得到的最佳建模效果图。图8是活力等级定性判别主成分因子数决定图,随着主成分因子数的增加预测集均方根误差先降低后上升,当主成分因子数为6时,有最小的均方根误差。

图7 UVE结合PLS-DA模型判别结果Fig.7 Discriminant results of UVE combined with PLSDA model

图8 活力等级定性判别主成分因子数决定图Fig.8 Decision chart of vitality level qualitative discriminant principal component factor number

2.3 基于图像特征的西瓜种子活力等级定性分类

2.3.1 特征图像的获取 高光谱采集的每幅原始图像都包含了288 个波长对应的子图像,288 个图像中有的不具备完整的样品信息,甚至有可能找不到样品信息。3 种活力等级的西瓜种子共120 个,逐个样品处理时间长、效率低,因此,采用主成分分析法对西瓜种子图像数据进行降维,使得不同类别数据达到差异最大化。首先将西瓜种子每1幅图像压缩成5 幅主成分图像,主成分图像是按照信息量的大小进行排序,既PC1>PC2>PC3>PC4>PC5,所以5 个主成分图像能够清晰反映西瓜种子的基本信息[17⁃18]。从图9可以看出,从PC1、PC2图像能清晰看出西瓜种子信息,PC1图像最清晰,适合本次样品的信息提取。PC2 图像边沿出现模糊痕迹,从PC3—PC5 图像则只能看出样品轮廓,所以不适合图像信息的提取。图10 是对应的RGB 图像,其中R(红)、G(绿)、B(蓝)的取值分别为662、554、450 nm,该真彩图像为校正后的原始高光谱图像,最接近种子实际图像。

图9 西瓜种子不同PC图像Fig.9 Different PC images of watermelon seeds

图10 西瓜种子RGB图像Fig.10 RGB image of watermelon seeds

从PC1 图像中提取权重系数,寻找权重系数曲线包含波峰、波谷对应的波长点,从而找到图像的特征波长。从图11 可以看出,贮存1、2、3 a 种子的权重系数曲线变化规律基本一致,通常认为权重系数曲线中的峰和谷所对应的波长点就是特征波长[14],其中在波长685、790、826、836、855 nm 处出现波峰和波谷,权重系数曲线的峰和谷为敏感波长,用来衡量变量的重要程度,图中箭头标记是挑选的敏感波长。图12 是不同活力等级的西瓜种子5 个特征波长点下对应的5幅特征图像。

图11 不同活力等级西瓜种子各波长权重系数Fig.11 Weight coefficients of watermelon seeds of different vigor levels

图12 不同活力等级西瓜种子特征图像Fig.12 Feature images of watermelon seeds of different vigor levels

2.3.2 西瓜种子活力等级定性判别 利用ELM 模型和PLS-DA 模型分别对西瓜种子图像特征进行判别分析,试验数据一共120 个,90 个数据用于建模,30 个数据用于预测,表4 是基于图像特征的西瓜种子不同活力等级ELM 定性判别结果,ELM 模型判别时,Sin 函数和Hardlim 函数的误判率均为13.30%,建模相关系数分别为0.76和0.68,而Sig函数的建模效果优于以上2 种函数,误判率为10.00%,建模相关系数为0.83。

表4 基于图像特征的不同活力等级西瓜种子ELM定性判别结果Tab.4 ELM qualitative discrimination results of different vigor levels of watermelon seeds based on image features

将相同的90 个样品作为建模集、30 个样品作为预测集建立PLS-DA 判别模型,模型建立时,以每个样品图像平均灰度值为自变量,贮存年限为因变量,图13 是该模型定性判别结果,活力等级为1、2 a的阈值为2.5,活力等级为2、3 a的阈值设为5.5。当预测值小于2.5 判定为1 a,当预测值在2.5~5.5,判定为2 a,当预测值在5.5 以上,判定为3 a。结果表明,有2 个预测样品发生了误判,误判率为6.67%,建模集均方根误差为0.78,相关系数为0.89,预测集均方根误差为0.95,相关系数为0.85。

3 结论与讨论

本试验利用高光谱成像技术提取西瓜种子感兴区域的平均光谱,建立基于光谱和图像信息的西瓜种子活力判别模型,并对比ELM 和PLS-DA 2 种判别结果。基于光谱信息建立的检测模型结果表明,特征变量筛选方法UVE 结合PLS-DA 检测模型表现出较好的预测能力,分类正确率为100.00%,相关系数高达0.86。基于图像信息判别西瓜种子活力等级过程中主成分分析法生成的PC1 图像可以准确地反映西瓜种子大部分信息,活力判别模型PLS-DA 的误判率为6.67%,相关系数为0.85,优于ELM 检测模型的误判率(10.00%)和预测集相关系数(0.83)。西瓜种子的光谱和图像信息都能够较好地区分活力等级,但是基于光谱信息所建立的检测模型优于图像信息建立的检测模型,原因可能是在贮存过程中西瓜种子种仁发生生理变化,导致内部差异较大,这种变化仅仅通过图像处理技术很难观察。另外,特征波长点选择的个数以及选择区域也会影响建模结果。以上研究可为实际的水果种子在线检测提供有力依据。

猜你喜欢
种子活力光谱活力
基于三维Saab变换的高光谱图像压缩方法
我国破译控制水稻种子活力的“遗传密码”
基于3D-CNN的高光谱遥感图像分类算法
活力
薄膜光伏组件在不同光谱分布下的测试差异
特定基因调控水稻种子活力机理揭示
杉木种子活力试验研究
全公开激发新活力
苦味酸与牛血清蛋白相互作用的光谱研究
活力青春