光谱及成像技术实现种子品种快速无损鉴别的研究进展

2021-03-25 04:38陈婉钧陈赞鸿林晖竣张胜祥
科技资讯 2021年3期
关键词:无损检测

陈婉钧 陈赞鸿 林晖竣 张胜祥

摘  要:实现农作物种子品种快速、无损鉴别是农业生产和选育育种重要的一个环节。传统的种子品种鉴别方法存在成本高、耗时长、对检验人员的技术要求较高以及有可能对种子产生损伤等缺点,难以构建自动化和智能化的在线检测系统。光谱及成像技术可以实现高效、无损、快速的农作物种子品种鉴定,是目前农作物品种鉴定领域的研究热点。该文总结了基于深度学习的近红外光谱技术、高光谱成像技术在农作物品种鉴别领域的研究进展,并对该技术的发展前景进行了展望。

关键词:光谱分析  高光谱图像  品种鉴别  空谱联合  无损检测

中图分类号:TP391.4                       文献标识码:A文章编号:1672-3791(2021)01(c)-0005-05

Abstract: Realize rapid and non-destructive identification of crop seed varieties is an important link in agricultural production and breeding. It is difficult to develop an automatic and intelligent on-line detection system due to the disadvantages oftraditional variety identification, such as high cost, long time, high technical requirements for inspectors and possible damage to seeds. Spectroscopy and imaging technology can realize efficient, nondestructive and rapid identification of crop seed varieties, which is a research hot spot in the field of crop variety identification at present. In this paper, the research progress of near infrared spectroscopy and hyperspectral imaging based on deep learning in the field of crop variety identification was summarized. And development prospect of these technologies was also prospected.

Key Words: Spectral analysis; Hyperspectral images; Species identification; Spatial-spectral; Non-destructive testing

种子是特殊的具有生命力的生产资料,其纯度的高低直接影响农作物产量的高低和优良种子的选育。由于我国种子市场交易的作物种子品种日益繁多,且相似品种的种子具有相似的外观及纹理特征,难以区分和判断种子的真伪性。因此不少不法商家掺杂其他品种种子造假、以次充好的现象屡见不鲜。目前,国内外传统的品种鉴别方法主要有基于遗传标记的方法(如简单序列重复标记,建立随机扩增多态DNA指纹图谱检测)、蛋白质电泳分析、電子鼻、田间鉴别分析、形态学分析等方法。这些方法已经被证实具有较高识别准确率。但遗传标记、化学检测方法等仪器设备成本较高,同时要求检验人员具有相关的仪器操作经验和专业背景知识,此外,这些生物检测技术对种子具有一定的破坏性且耗时费力,不适合对大批量的作物种子的品种进行同步在线的无损检测。而田间鉴别分析技术易受品种、环境等因素的影响,检测周期长且效率低。种子形态特征(如颜色、纹理、形状、大小等)差异程度会直接影响形态分析方法检测准确率。因此研究实现种子品种快速无损鉴别的方法是必要的。

近年来,光谱及成像技术以快速、无损、经济、简单等特点而被广泛关注,是未来实现在线农作物种子品种快速、无损鉴别的主要发展趋势。特别是近年来数据挖掘和机器学习等新兴的信息技术的蓬勃发展,为光谱及成像技术在作物种子品种无损鉴别研究提供新的方法与思路。目前我国在种子品种快速鉴别、无损检测等领域的研究水平与国外研究水平相比,仍然有较大差距。国外结合机器学习、数据科学、光谱及成像技术应用于作物种子品种无损检测已有相关的研究工作积累和研究成果,并逐步推动商业化应用,开发在线批量化种子智能检测系统。该文总结了光谱及成像技术应用于农作物种子品种快速、无损鉴别的研究进展,并对该技术的发展前景进行了展望。

1  近红外光谱技术

1.1 检测原理

近红外光谱区在780~2 526 nm之间,携带了有机分子中能量较高的含氢基团化学键振动的合频和各级倍频的信息,能够更明显地反映不同物质结构的差异。种子内部含有大量的含氢基团,因此具有近红外吸收能力,能够利用近红外光谱鉴别种子品种。实现的技术路线如图1所示。

1.2 光谱采集装置

常见光谱采集系统如图2所示。该装置主要包括了检测器(光谱仪为主)、光源、计算机。图中“样品放置处”可以通过控制传送带或采用电控位移台运送待测种子[1]以缩短采集多粒种子光谱耗费的时间。

1.3 光谱采集与处理

近红外光具有较强的穿透能力和散射效应,根据待测物的透光能力的强弱选择透射方式还是漫反射方式,从而获得待测样品对应的光谱。目前应用研究主要是分析近红外漫反射光谱,因为漫反射光谱更能反映种子的表层信息。常见的光谱预处理方法主要有平滑处理、光散射校正(多元散射校正和标准正态变量变换等、傅里叶变换、小波变换等。这些方法能够减少噪声、杂散光对数据的干扰。通常为增强数据间的差异性,采用均值中心化、标准中心化或者归一化对数据进一步处理。

1.4 特征选择和提取

基于全波段光谱输入训练分类器,可能会增加模型计算的复杂度,因为全波段光谱会存在一些高度相关的特征造成特征冗余。因此,在建立多变量判别模型之前,尽可能选择特征不相关或是差异性特征明显的波长。光谱求导、连续投影和主成分分析是常见的特征波长选择的方法。对采集的光谱进行一阶或者二阶求导获得更清晰的不同品种种子的差异信息。选取差异较大的峰谷作为特征输入,可以减少计算资源。因为它反映了不同品种间种子含氢基团振动的差异,可以作为区分的主要依据。采用连续投影算法筛选的特征波段是最低冗余度、最小共线性且能反映光谱有效的关键信息。主成分分析是将数据进行投影,投影后的特征是正交的,选择前k个重要的特征实现特征选择,因此不同算法选择的特征光谱不同。除此之外,林萍等人[2]提出一种遗传算法提取特征光谱。

1.5 判别模型

建立判别模型可以分为线性建模和非线性建模。其中最小二乘判别分析(PLS-DA)、线性判别分析(LDA)是常用的线性建模方法,加入核函数的支持向量机(SVM)、BP人工神经网络及其变体等经典的机器学习算法,是建立非线性多变量判别模型常见的选择。刘小丹等人[3]建立PLS-DA和SVM模型实现杂交稻品系识别,准确率达到90%以上。蔡月芹等人[4]结合人工神经网络实现玉米品种无损快速鉴别,鉴别准确率达到100%。林萍等人[5]采用ISOMAP流形降维法,建立PLS-SVM模型实现了94.67%准确率的转基因水稻种子及其亲本的快速鉴别。可见,近红外光谱技术结合机器学习算法可以应用于品种纯度分析,是一种快速无损、有发展前景的分析技术。

2  高光谱成像技术

2.1 检测原理

高光谱成像技术在光谱技术基础上结合了成像技术,使得光谱具有空间分布的特征。采集的数据是连续、窄波段的图像数据(波长从λ0至λn),每一像素块对应连续波段的光谱信号。像素值与光谱对应,具有“图谱合一”的特点。与非成像光谱相比,高光谱成像技术只需采集一次数据即可得到多个样品的光谱空间分布。

目前,该应用研究方向主要有两种:(1)提取高光谱图像中种子的光谱信息,基于光谱构建多变量的判别模型;(2)融合图像和光谱信息,构建判别模型。见图4,虚线路径为(2)方向增加的图像输入。与图1对比,提取单粒种子光谱后的光谱处理的常用方法基本一致。

2.2 高光谱成像系统

试验常用的系统主要由CCD相机、光谱仪、镜头、光源、计算机、受控制移动的样本台、暗箱构成[6],检测装置与近红外光谱检测装置类似。

2.3 图像校正

采集反射率接近100%和接近0的高光譜图像并根据式(1)校正原始拍摄的图像,以减少采集过程中暗电流噪声对数据的影响:

式中,R是校正图像;Iraw是待测样品的原始高光谱图像;Iblack是反射率接近0的高光谱图像(采集镜盖覆盖住镜头的高光谱图像);Iwhite是反射率接近100%的高光谱图像(采集白色标准校正板的高光谱图像)。

2.4 提取单粒种子及平均光谱获取

提取图像中的种子区域并计算区域内各点的反射率,取均值得到该像素点的光谱值,进而获得种子的平均光谱。因此需要从背景中分割出种子,剔除背景的光谱信息。由于背景简单且是黑色,常用阈值分割或边缘分割方法处理。

2.5 判别模型

除1.5节描述基于光谱构建分类器方法外,其他经典的机器学习算法也被尝试结合高光谱成像技术应用于种子品种鉴别。Yin等人[7]基于SVM、径向基函数神经网络和极值学习机(ELM),结合近红外高光谱成像技术鉴别4种不同品种的枸杞,其中ELM识别准确率达到91.25%。Zhou等人[8]对比SVM、朴素贝叶斯、k近邻(KNN)、人工神经网络、决策树、LDA和logistic回归算法鉴别甜玉米种子品种结果,精度达到94.07%。

与传统的机器学习算法比较,深度学习更能深度挖掘大量数据背后的规律,任务表现更佳。Qiu等人[9]构建适合一维光谱输入的卷积神经网络(CNN)实现种子品种鉴别,与SVM、KNN相比,CNN模型表现更佳。且随着训练样本的增加,CNN的性能提升。崔研改进SENet卷积神经网络,提取高光谱图像差异特征鉴别6种高相似度的稻种,准确率达到94.77%[10]。这表明了CNN模型应用于作物种子品种鉴别的有效性。杭盈盈等人[11]构建堆叠自动编码器,萝卜种子品种鉴别准确率达96.22%。因此,高光谱成像技术结合深度学习算法具有很大应用潜力。

然而仅提取光谱信息训练分类器,则高光谱图像的空间信息没有被利用。近年来,为应对噪声等影响下获得更佳的识别结果,融合图像的空间信息和光谱信息的方法被研究。基于马尔可夫随机场及其改进方法被广泛应用[12]。结合稀疏表示[13]、基于像元邻域串接光谱信息[14]的方法也被研究应用。李治鑫提出了异构神经网络空-谱特征级融合的方法[15]。这些基于图谱融合的方法为未来应用于种子品种无损快速识别提供了新的思路。邓小琴等人[16]将形态特征与光谱能量、均值、熵信息融合,实现检测精度96%,满足种子纯度不低于95%的国家标准要求。Xia等人[17]基于PLS-SVM建立融合光谱和图像信息的多元分析判别模型,准确率达到97.5%。

传统的分类任务通常构建单个分类器实现分类。目前,也有研究融合多分类器以提高分类精度的方法。任守纲等人[18]对高光谱图像进行多尺度提取空谱特征,并构建了多个并行结构的SVM分类器,采用“决策级融合”策略进行分类,准确率达到96%以上。采用并行结构是常见的多分类器融合的方法,此外还有串行结构和混合结构[19]。

高光谱成像技术结合人工智能算法能够实现种子品种智能、快速无损识别,降低人工成本、提高检测效率。但其算法需要大量的训练样本和稳定的模型才能达到理想的分类效果。基于光谱信息构建分类器、基于空-谱信息构建判别模型、融合多类特征[20]、采用多分类器融合策略是目前高光谱图像分类工作的研究热点。这些方法通常是基于先验样本的有监督学习。考虑到构建先验知识的成本,半监督学习和无监督学习的方法也逐渐受到各研究人员的青睐。半监督学习是只构建部分先验知识用于训练分类器,即大量未标记的数据和少部分标记数据构成训练集,用于训练分类器。无监督学习算法常用于解决难以进行人工标注或标注数据(构建先验知识)的成本较高的问题。兰雨阳提出基于遗传算法和标记样本位置的高光谱图像半监督分类算法、基于融合区域的半监督高光谱图像分类算法,它们具有更佳的分类精度[21]。常见的无监督学习算法有K均值聚类算法、谱聚类等。因此如何设计智能分类器模型、适合小样本训练的方法仍然是考虑的问题。

3  结语

种子的纯度影响播种后的收成和优良种子的选育。传统品种检测方法因耗时长、操作复杂且对检验人员有技术门槛等缺点,难以实现自动化的大规模检测。光谱及成像技术具有快速、无损、经济、简单等特點,是实现种子品种无损鉴别的主要研究方向。该文总结了基于深度学习的近红外光谱技术、高光谱成像技术在农作物品种鉴别领域的研究进展。随着计算机技术和数学理论的发展,高光谱成像技术结合人工智能算法实现批量化、智能化和自动化的种子品种快速无损鉴别应用具有极大的发展潜力。基于光谱信息构建分类器、基于空-谱信息构建判别模型、融合多类特征是目前关注研究的热点。如何深入挖掘信息特征、降低构建先验知识的成本及计算成本,实现可行性向实用性转变,这仍然是未来需要解决的难题。

参考文献

[1] 邢川平.基于近红外光谱的玉米品种鉴别系统研建[D].北京林业大学,2018.

[2] 林萍,陈永明.利用可见近红外光谱技术快速鉴别大米品种[J].江苏农业科学,2015(12):320-323.

[3] 刘小丹,冯旭萍,刘飞,等.基于近红外高光谱成像技术鉴别杂交稻品系[J].农业工程学报,2017,33(22):189-194.

[4] 蔡月芹,赵文杰,王雪.基于近红外光谱技术的玉米品种鉴别方法研究[J].江苏科技信息,2019(21):36-39.

[5] 林萍,高明清,陈永明.基于近红外光谱分析技术的转Bt基因水稻种子及其亲本快速鉴别方法[J].江苏农业科学,2019,47(13):72-75.

[6] 王新忠,卢青,张晓东,等.基于高光谱图像的黄瓜种子活力无损检测[J].江苏农业学报,2019,35(5):1197-1202.

[7] YIN Wenxin,zhang chu,zhu hongyan, et al. Application of near-infrared hyperspectral imaging to discriminate different geographical origins of Chinese wolfberries.[J].PLOS ONE,2017,12(7):e0180534.

[8] zhou quan,huang wenqian,fan shuxiang,et al.Non-destructive discrimination of the variety of sweet maize seeds based on hyperspectral image coupled with wavelength selection algorithm[J].infrared physics & techndogy,2020,109:103418.

[9] qiu zhengjun,chen jian,zhao yiying, et al. Variety Identification of Single Rice Seed Using Hyperspectral Imaging Combined with Convolutional Neural Network[J].Applied Sciences,2018,8(2):212.

[10] 崔研.基于深度学习的稻种图像分类算法研究[D].吉林大学,2020.

[11] 杭盈盈,李亚婷,孙妙君.基于高光谱图像技术结合深度学习算法的萝卜种子品种鉴别[J].农业工程,2020,10(5):29-33.

[12] zhang xiaorong,pan zhibin,lU xiaoqiang,et al.Hyperspectral image classification based on joint spectrum of spatial space and spectral space[J].Multimedia Tools and Applicati-ons,2018,77(22):29759-29777.

[13] zhao wenzhi,dU shihong.Spectral–Spatial Feature Extraction for Hyperspectral Image Classification: A Dimension Reduction and Deep Learning Approach[J].IEEE Transactions on Geoscience and Remote Sensing,2016,54(8):4544-4554.

[14] yue jun,mao shanjun,li mei.A deep learning framework for hyperspectral image classification using spatial pyramid pooling[J].Remote Sensing Letters, 2016,7(9):876-884.

[15] 李治鑫.基于深度学习的空谱联合高光谱图像分类算法及系统实现[D].南京理工大学,2018.

[16] 邓小琴,朱启兵,黄敏.融合光谱、纹理及形态特征的水稻种子品种高光谱图像单粒鉴别[J].激光与光电子学进展,2015(2):128-134.

[17] xia chao,yang sai,hUang min,et al. Maize seed classification using hyperspectral image coupled with multi-linear discriminant analysis[J]. Infrared Physics & Technology, 2019,103:103077.

[18] 任守纲,万升,顾兴健,等.基于多尺度空谱鉴别特征的高光谱图像分类[J].计算机科学,2018,45(12):243-250.

[19] 李秉璇,周冰,贺宣,等.针对高光谱图像的目标分类方法现状与展望[J].激光与红外,2020,50(3):259-265.

[20] 魏利峰.玉米种子高光谱图像品种检测方法研究Z

[21] 兰雨阳.基于波段选Z择和半监督学习的高光谱图像分类[D].西安电子科技大学,2018.Z

猜你喜欢
无损检测
石油管道无损检测中的漏磁在线检验方法
浅析机械设备无损检测与安全
应力波反射法测锚索长度的数据处理软件设计与实现
中子照相技术及其在考古中的应用
核电设备检测中的网络无损检测集成技术探讨
不锈钢覆面焊缝脉冲涡流热成像检测技术研究
浅谈压力容器无损检测
浅谈无损检测的质量管理