基于改进leNet-5的番茄病虫害识别的研究*

2020-11-12 02:48刘志勇张丽秀钟婷婷王幸福胡声洲
赣南师范大学学报 2020年6期
关键词:识别率番茄卷积

刘志勇,张丽秀,钟婷婷,王幸福,胡声洲,†

(赣南师范大学 a.数学与计算机科学学院;b.外国语学院,江西 赣州 341000)

1 前言

在农业领域,怎样实现农作物的智能化、自动化生产,一直是农业的一个研究热点[1].

在番茄的生产过程中,常伴有病虫害的发生.怎样快速的识别番茄病虫害,并对症下药,将直接影响番茄的质量与产量.番茄的病虫害种类繁多,而且有一些病害的初期症状,人眼根据番茄叶面的症状,很难准确区分.近年来,随着计算机视觉技术的快速发展,基于计算机视觉的番茄病虫害的自动化识别的研究也比较多.

传统的计算机视觉方法是通过提取、筛选颜色、纹理、形状等特征,再选择合适的病斑特征以及分类器来实现检测.文献[2]提出了一种结合HOG、LBP特征的结合的番茄病虫害检测模型;文献[3]提出了一种基于神经网络的番茄叶部病害识别方法等.目前,由于不存在通用的分割和特征抽取算法,且特征的提取很多时候依赖专业人员的经验,现有传统的计算机视觉方法往往可扩展性差.与传统的计算机视觉方法相比,基于卷积神经网络的图片识别摒弃了复杂的图像预处理和特征提取操作,具有直接抽取分类特征的优点,往往不需要特意设计分类器,简化了识别流程.同时,其抽取特征的方法常适合各种场合下的分类,泛化性较强.近年来,基于卷积神经网络的图片识别的应用也比较多[4].

本文探讨了基于leNet-5的番茄病虫害识别问题,针对传统的leNet-5对番茄病虫害识别效果较差,对其进行了改进.采用2018年AI challenger农作物病虫害检测中的番茄病虫害数据集,通过数据增强的方式对其进行扩充.实验表明,本文提出的改进leNet-5的综合模型,识别精度能达到95.3%,在识别精度与模型建立的效率上都有所提高.

2 卷积神经网络

卷积神经网络(简称CNN),与神经网络相似,其灵感来自于人脑中视觉皮层获取外部信息的方式.其通过网络各层中神经元节点感知图像的不同区域信号并获取其特征信息,然后通过组合网络各层特征信息,得到图像中不同层次的信息,计算机通过不断地学习训练之后,就可能拥有类似于大脑的图像识别能力.近年来,随着计算机视觉技术的发展,CNN在图片识别领域开始大展拳脚,其几乎成了深度学习的代名词.

CNN主要由卷积层、池化层、全连接层3个部分组成.其训练包括信息的前向传播、误差梯度的反向传播2个过程.CNN中信息的前向传播过程,是对图片特征的提取、图片抽象表达的过程,是卷积层、池化层、全连接层等综合作用的结果.

卷积层主要用于提取图片特征,其通过卷积运算对上一层节点进行线性组合,然后对组合结果进行非线性变换得到输出,并将该输出作为下一层的输入,不断重复该过程,从而得到图片的更抽象的表达.如公式(1)所示,为卷积层操作表达式.其中X、W、b、f(·)、A分别表示该层的输入、所使用卷积核、偏置、激活函数及输出.

A=f(W·X+b)

(1)

池化层是利用特定规则进行池化,来降低特征平面维度.常用的池化层有最大池化层、平均池化层等.如(2)所示,为池化操作表达式.其中d(·)、S分别表示该层所采用的池化函数及其池化结果.

S=d(A)

(2)

(3)

(4)

其中ai表示预测值,yi真实值,nL为类别的个数,i为训练样本真实类别序号.

(5)

(6)

3 改进leNet-5网络模型

3.1 经典leNet-5网络

leNet-5适用于手写字体识别,在使用leNet-5识别番茄病虫害叶部图片时,损失值较高,识别率很低,模型训练效率较低.主要存在以下问题:

为了使整个leNet-5网络的番茄病虫害识别性能有更大提升、达到较高的准确率,对其进行优化改进.

3.2 leNet-5模型的改进

针对leNet-5在番茄病虫害识别上的问题,做如下改进:

3.3 改进网络模型描述

表1中给出了改进leNet-5网络结构中各层的具体参数的描述,包括各层所使用的结构,卷积核/池化尺寸、步长大小S、特征图数目及输出尺寸等.其中卷积模块组Inception_v3,包含4个分支,分别记为v1_branch_0、v1_branch_1、v1_branch_2、v1_branch_3.Inception_v3中取步长S=1.v1_branch_0由8个1*1卷积核组成,记为8@1*1;v1_branch_1由两个卷积核4@1*1、12@3*3级联而成;v1_branch_2由卷积核4@1*1、6@5*5进行级联;v1_branch_3由一个5*5 MaxPool层和4@1*1卷积核级联而成.经Inception_v3处理之后,得到8+12+16+4=30个13*13的特征图,记为30@13*13.第4层为卷积模块组Inception_v4,与Inception_v3相似.经Inception_v4处理之后得到64@7*7的特征输出.

表1 网络参数

4 实验

4.1 数据集

本文实验数据集采用2018年AI challenger农作物病虫害检测中的番茄病虫害数据集.共有3种番茄病虫害,每种病虫害分为一般及严重2类.表2是原始数据的统计表.

表2 原始数据的统计表

由于获得新的番茄病虫害图片,需要大量的成本.本文中通过数据增强的方式,如表3所示,来增加番茄病虫害数据集,增加网络的训练量,从而提高模型的泛化能力;通过增加噪声数据,也能有效增强模型的鲁棒性.实验中通过随机划分数据集的方式,以0.8∶0.2的比例将数据集划分成训练集与测试集.分别通过前述的数据增强方式,使数据集达到142 800张.

表3 数据增强方式及其参数

4.2 实验环境

在win10系统下,使用python语言进行网络模型的程序设计,利用pycharm等python代码编写平台,进行程序的编写,通过使用tensorflow及相关的卷积神经网络库实现了改进的leNet-5模型.并利用matlab等工具对实验后得到的数据进行了分析与比较.

4.3 实验内容

对经典leNet-5在卷积核大小,分类器,损失函数上进行改进,将网络中部分卷积核的大小由5×5改为3×3、使用Softmax回归作为分类器并联合交叉熵损失函数,并使用Mini-batch进行梯度更新.在此基础上,分别在经典leNet-5中加入BN层、将激活函数改为PReLU、在网络中加入Inception模块形成3个改进网络模型,记为leNet-BN、leNet-PR、leNet-Inc.并最终将三者均加入leNet-5中形成本文中最后的改进模型leNet-C.具体而言,leNet-BN为在leNet-5的C1、S2,C3、S4层之间加入BN层形成的网络结构;leNet-PR为在leNet-BN模型中将原来的激活函数均改为PReLU之后的网络模型;leNet-Inc为将C1、C3层改为表1中2个Inception模块的网络结构;leNet-C为如表1所述网络结构.记经典leNet-5网络为leNet-O.

在保证其它条件不变下,分别使用leNet-O、leNet-BN、leNet-PR、leNet-Inc、leNet-C对本文中数据集进行实验,并进行比较.

4.4 实验结果与分析

在本文实验中,程序设计时控制好指数衰减学习率、目标优化函数以及参数更新方式保持相同,分别使用leNet-O、leNet-BN、leNet-PR、leNet-Inc、leNet-C对本文中数据集进行实验,比较其对leNet-5网络模型效果的影响.改进实验中都采用Mini-batch梯度下降法,来更新梯度以及参数的学习.如图1所示,为经上述方法对leNet-5进行改进,在经过200次迭代之后,网络模型对番茄病虫害识别的正确率.图2为传统leNet-5及改进后网络模型训练过程中迭代次数与损失值的比较图.

图1 识别的正确率比较 图2 损失值对比

在本文识别番茄病虫害leNet-5改进实验中,从2图中可以看出,在传统的leNet-5的基础上加入BN层、将激活函数改为PReLU函数并在全连接层采用dropout策略、加入Inception模块,在加快网络训练速度、提升网络识别率优化网络上有较好的效果.

表4所示为改进后的网络模型对于识别番茄病虫害的准确率统计表.在综合前者的改进后,各优化方法之间也展现了较好的协同作用效果,使得改进后的网络模型的整体识别率达到了95.3%.

表4 各网络模型识别率统计表

5 总结

本文在传统的leNet-5基础上进行了包括加入BN层、采用PReLU激活函数并在全连接层采用Dropout策略、加入Inception结构等多种改进实验,提出一种对传统的leNet-5的改进模型,采用2018年AI challenger农作物病虫害检测中的番茄病虫害数据集,通过数据增强的多种方式对数据集进行扩充,通过各种改进方案对数据集进行训练和测试,并对各方案及其综合型的识别效果进行比较,最后改进的leNet-5综合模型的识别率达到了95.3%.实验结果表明,改进后的leNet-5综合模型在加快网络训练速度、提升网络识别率、获得有效的图片特征,在识别复杂的番茄病虫害图片等方面取得了较好的效果.

但是本文所采用的数据集图片大小是固定的,不具有普适性.本文中所使用的番茄病虫害的数据集还不够全面,在实际应用中,图片的大小可能具有任意性,病虫害的种类繁多,下一步的研究目标将放在图片的任意性输入,更多类别分类以及网络的进一步优化上.

猜你喜欢
识别率番茄卷积
番茄炒蛋
秋茬番茄“疑难杂症”如何挽救
基于3D-Winograd的快速卷积算法设计及FPGA实现
番茄果实“起棱”怎么办
基于类图像处理与向量化的大数据脚本攻击智能检测
卷积神经网络的分析与设计
从滤波器理解卷积
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
基于傅里叶域卷积表示的目标跟踪算法