玉米单粒种子发芽潜力无损检测方法研究

2021-12-20 05:38董宏图栗彬彬吴旭东
种子 2021年11期
关键词:玉米种子个数神经元

张 晗,董宏图,栗彬彬,闫 宁,4,吴旭东,4,罗 斌

(1.北京农业信息技术研究中心,北京 100094;2.农芯(南京)智慧农业研究院,南京 211800;3.北京农业智能装备技术研究中心,北京 100094;4.中北大学机械工程学院,山西 太原 030051)

种子是农业生产中重要的生产资料,人多地少是我国农业面临的一大难题[1]。而种子的质量对农作物的发展至关重要,良好的种子是作物的产量保证。因此,在有限的土地传播高质量的种子是我国农业生产活动中的一大难点。种子发芽率是种子质量检验中非常重要的一个指标。每年我国因作物种子不适造成的农业减产达10%~20%。

种子检测是为了在播种前对种子质量进行评定[2],挑选生命力强的种子,提高田间成苗率,从而实现产量增加和播种量减少的目的。目前有很多种子活力的检测方法,传统的方法包括发芽速率测定、电导率测定、四唑染色法和人工加速老化测定[2-4]等,但这些方法均会对种子本身造成伤害,并且试验周期长、受自然条件限制等[5]。因此,随着对种子活力的重视程度越来越高,这些传统的检测方法已经不能满足需求,迫切需要研究出一套快速且不会对种子造成破坏的检测方法。

近年来,随着机器视觉技术在农业领域的不断应用[6-10],国内外学者尝试通过机器视觉技术研究种子大小、颜色等物理性状与种子活力之间的相关关系。与传统的检测方法相比,该技术更加精细化。Pearson T等[11]研制了一种高速、低成本、基于图像的颗粒检测分离分选装置。该系统在去除损伤玉米时达74%的精度,对无损伤的玉米时达到了91%的精度。B.P.Dubey等[12]基于计算机图像进行视觉识别,通过谷物的形状、大小和颜色来鉴别小麦的品种,再结合人工神经网络(ANN)进行分类,准确率达到88%左右,表明图像分析结合人工神经网络对小麦的品种有很好的鉴别能力。刘敏洁等[13]以甜玉米种子为研究对象,利用扫描仪获取种子图像并提取13个图像特征参数,并通过发芽试验得到每粒种子的活力参数,结合人工神经网络和二元逻辑回归进行建模,其中人工神经网络模型预测种子发芽的准确率为74.2%,二元逻辑回归模型准确率为74.5%。

通过对图像特征的预处理分析以及特征提取,获取与单粒玉米种子发芽相关的特征参数,结合传统单粒种子标准发芽试验方法测得玉米种子实际发芽情况,利用数据分析建模建立图像特征与单粒种子发芽之间的定性关系,构建单粒种子发芽潜力检测及评价模型。

1 材料及方法

1.1 材 料

试验种子为2017年购自甘肃张掖的郑单958玉米种子,发芽率为78%左右。随机选择500粒无损伤种子作为实验的样本。

1.2 图像采集

采集环境如图1所示,采集环境主要由采集箱、背景板、相机、光源组成。采集箱尺寸35 cm×35 cm×60 cm;背景板为哑光黑橡胶材质;相机使用大恒图像自主研发的MER-502-79 U 3M/C相机,配备computar 8 mm镜头,相机与背景板距离为42 cm;光源使用4个18 W条形光源,均匀布置在采集箱顶部。将500粒玉米种子依次编号,放置在背景板上,每组25粒,种子之间互不接触,种子胚面朝上,进行采集,获取图像。

注:1为光源;2为玉米籽粒;3为采集箱;4为相机;5为背景板。图1 图像采集环境Fig.1 Image acquisition environment

1.3 发芽试验

将种子放入浓度为1%的次氯酸钠溶液消毒10 min,然后使用蒸馏水冲洗3次。使用发芽纸进行发芽,将灭菌后的发芽纸平铺在已消毒的试验台上,每张发芽纸放置25粒玉米种子,发芽纸卷成筒状放在盛有蒸馏水的试验盒中保持水分,并在将发芽纸上方套上透明袋以防止水分流失,如图2所示,将盛有发芽纸的试验盒放在25 ℃的光照培养箱中。每天定时查看培养箱内的情况,以确保培养箱正常运转,期间适当补充少量蒸馏水,使卷纸始终处于湿润状态,保证种子的正常发育。

图2 玉米种子发芽实验Fig.2 Germination experiment of maize seed

1.4 试验结果

以样本发芽且生根为发芽标准,第7天记录种子的发芽情况[14]。结果显示,发芽率为78%,与大样本的结果基本一致。因此本试验的500粒样本具有一定代表意义。

2 数据分析处理

2.1 图像预处理

通过图像采集设备获取到的图片含有一些噪声,这主要是摄像机等图像采集设备的感光元件受到干扰产生的,主要表现为黑白杂点等。为了消除这些噪声对图像数据的影响,选用3×3模板下的中值滤波进行处理。

2.2 颜色及形状特征提取

通过图像分割把图像中具有不同灰度的区域分离,从而将玉米种子区域识别出来,须进一步将特征提取出来。使用HALCON图像处理软件对种子图像进行特征信息的提取,分别统计RGB、HSV、HSI、Lab各分量的均值、标准差等共计24个颜色特征,提取玉米种子的长度、宽度、投影面积、周长、圆形度(种子区域接近圆形的程度)、紧实度(区域形状的紧致程度)、凹凸性(种子区域面积与最小外接凸形之间的比值)、矩形度(种子区域接近最小外包矩形的程度)、最小外接圆半径、最大内切圆半径、圆周到中心的平均距离、圆周到中心的距离偏差、轮廓区域点之间的最大距离等13个形状特征。

2.3 主成分特征提取

主成分分析(PCA)通过降维的思路,在原始变量损失最小化的前提下,用几个毫不相关的综合指标代替原始指标,即原始变量通过线性组合的方式组合出新的主成分,而且新生成的各个主成分之间互不相关,消除原始变量中相互关联的信息,从而抓住问题实质达到简化的目的,提高分析效率,是一种压缩数据的常用方法[15]。为进一步分析利用种子图像特征对种子发芽潜力预测的可行性,对玉米种子的图像特征进行主成分分析。

2.4 ELM模型建立

极限学习机(ELM)在近些年受到了很多学者的关注,在分类问题上应用广泛;相比于其他神经网络学习算法,它不仅有极快的学习速度,还能避免模型过拟合,具有良好的泛化性能[16]。该算法随机产生输入层与隐含层的链接权值与隐含层神经元的阈值,并且在训练过程中无需调整,只要设置隐含层的神经元个数就可以得到最优解。

算法的步骤可以分为:

1) 确定隐含层的神经元个数,随机设定输入层与隐含层的链接权值和隐含层的神经元的偏置值;

2) 选择一个激活函数,利用激活函数计算隐含层的输出矩阵;

3) 计算输出层权值,建立模型。

2.5 评价指标

建立的玉米种子发芽潜力预测模型为分类模型,发芽的种子对应高发芽潜力的种子,不发芽的种子对应低发芽潜力种子,因此采用预测的准确率、查准率、查全率参数来评价模型的效果。准确率代表所有预测正确的样本数量占样本总数的比例,即整体预测准确率;查准率代表所有预测发芽的样本数量中实际发芽的比例,即分类后高活性样本的发芽率;查全率代表实际发芽种子预测为高活性的比例,即高活性种子的检出率。

TP表示发芽样本预测正确的数量;FN表示发芽样本预测错误的数量;FP表示不发芽样本预测错误的数量;TN表示不发芽样本预测正确的数量。

3 结果与分析

3.1 主成分分析

对种子图像特征进行主成分分析后,前3个主成分的贡献率分别为43.92%、14.84%、11.08%。前8个主成分贡献率为93.20%,而其余的主成分不足7%。按照累计贡献率大于90%的原则选择前8个主成分[18],代表37个原始的特征,输入ELM极限学习机中进行训练,建立模型。

3.2 隐含层的神经元个数选取

在ELM中,隐含层的神经元个数的确定尚无理论依据。通常,隐含层的神经元个数过少,则无法在输入层和输出层之间获得足够的连接权值,这样将导致网络模型的学习能力较差,对于复杂问题的处理可能出现较多的错误;隐含层的神经元个数过多,则网络容易出现过拟合现象,而且泛化能力得不到保证。

将玉米图像数据按照3∶1比例随机分配,将500个样本数据划分为建模集和预测集,即建模集375个样本,预测集125个样本。建立不同隐含层的神经元个数的ELM预测模型,建模集识别准确率随着隐含层的神经元数的增大不断提高,隐含层的神经元数目越大识别准确率越高,当使用sigmod函数时,节点数量大于375时,识别准确率达到100%,如图3-A所示。预测集的准确率先随着隐含层的神经元个数的增多不断提高,当数量大于140时,识别准确率随着隐含层的神经元个数增多而降低,如图3-B所示。通过建立隐含层的神经元个数与预测集的准确率的关系,确定ELM预测最优神经元个数。

图3 隐含层神经元个数对ELM性能的影响Fig.3 Effects of the number of hidden layer neurons on ELM performance

3.3 激活函数

在ELM中,激活函数有sigmoid函数[17]、hardlim函数[18]、gaussian函数[19]、agaussian[20]函数等。当数据的分布满足上述4种激活函数的分布时,ELM运用对应的激活函数才能得到较好的识别效果,反之,当数据的分布不满足上述4种激活函数的分布时,将导致ELM算法隐层节点输出矩阵含有较多的零元素,造成求解的输出权值出现过拟合的现象。种子发芽力潜力建模是对种子是否发芽分类判别,使用gaussian函数、agaussian函数将影响ELM算法的泛化性能[21],因此选择sigmoid函数、hardlim函数分别展开建模。

hardlim函数结果是几个固定值,如1,0等,满足某个条件输出1,不满足则为0,计算公式为:

sigmoid型函数的输入值可取任意值,输出值在0和1之间,不仅可以预测出类别,还能够得到近似概率预测,计算公式为:

3.4 建立PCA-EML预测模型

利用Matlab 12.0软件编写程序,选择sigmoid函数、hardlim函数这两种激活函数,在分别使用最佳隐含层神经元个数时,进行分类效果对比。利用500粒玉米种子数据建立ELMs、ELMh两种ELM模型进行训练识别,确定ELMs、ELMh模型最优隐含层的神经元个数,分别为140、190,对预测集玉米种子进行识别,识别结果如表1所示。

表1 玉米种子活力分类模型Table 1 Classification model of maize seed vigor

从表1可以看出,使用ELMs算法建模后,准确率达63.33%,查准率达88.51%,查全率为63.11%;使用ELMh算法建模后,准确率达58.33%,查准率达82.04%,查全率为57.39%。从试验结果可以得出,ELMs模型相对于ELMh模型检测效果更优。说明利用主成分分析后的8个主成分建立的极限学习机分类模型对种子发芽情况具有一定检测能力,为玉米种子发芽潜力预测提供了一条新途径。

4 讨 论

玉米作为我国重要的粮食作物,其发芽潜力直接影响其产量。在当前精播、穴播技术不断推广的背景下,通过精选剔除低发芽潜力的种子,对提高种子发芽率具有重要意义。本研究通过机器视觉技术获取玉米种子的颜色特征信息,实现玉米种子的形态和颜色参数快速无损获取。并进行主成分分析提取8个可以代表上述指标的主成分,采用极限学习机算法(ELMs)建立单粒玉米种子发芽潜力检测模型,该模型的准确率达63.33%,查准率为88.51%,查全率为63.11%。经过玉米种子分拣系统分选后的玉米种子发芽率约87.7%,发芽率提升10%左右。

结果表明,使用机器视觉技术获取种子的颜色和形态特征,结合极限学习机算法建立模型,预测玉米种子发芽潜力具有一定的可行性。通过ELM模型下激活sigmoid函数、hardlim函数识别对比试验,总体上基于激活sigmoid函数和对玉米种子的识别准确率优于hardlim函数。采用极限学习机算法(ELMs)建立单粒玉米种子活力检测模型,查全率仅为63.11%,表明36.89%的发芽种子被判别为发芽潜力低被剔除,准确率为63.33%,总体准确率和样本获选率仍需进一步提高。

研究表明,应用机器视觉和ELMs神经网络建立的玉米种子发芽潜力判别模型具有鉴别速度快、而且不会破坏样品的特点。说明利用该方法可以实现快速、无损地判别玉米种子发芽潜力,对基于机器视觉的其他农产品发芽潜力检测具有一定的指导意义。通过机器视觉提取玉米种子特征时,只提取了颜色特征和形状特征,在之后的研究中,可添加种子的纹理特征,探究进一步提高模型效果的可能。

猜你喜欢
玉米种子个数神经元
不同条件下对济宁地区玉米种子萌发特性的研究
怎样数出小正方体的个数
AI讲座:神经网络的空间对应
怎样数出小木块的个数
贮藏中玉米种子活力与寿命的问题
仿生芯片可再现生物神经元行为
最强大脑
怎样数出小正方体的个数
关于提高玉米种子发芽率标准的探讨
这个神经元负责改变我们的习惯