基于改进GoogLeNet的玉米叶片病害识别及其可解释性研究

2025-01-19 00:00:00牛潘婷张宝林潘丽杰郭建鹏
中国农机化学报 2025年1期
关键词:迁移学习图像处理深度学习

摘要:

为加强农作物病害的识别,减少病害发生的频率与强度,提高农作物产量与品质,基于迁移学习构建5种深度学习网络,对玉米叶片锈病、大小斑病和灰斑病进行识别分类研究。通过对比AlexNet、VGG19、ResNet50、GoogLeNet和MobileNetV2深度学习网络,GoogLeNet的识别准确率最高,达到96.3%,模型收敛效果最好。通过进一步优化GoogLeNet模型架构,在inception模块中插入卷积注意力模块CBAM,使用LeakyReLU激活函数替换ReLU函数,改进后网络通道注意力增强,测试集的识别准确率达到99.0%,识别准确率提高2.7%。采用CAM和LIME算法对模型的可解释性分析,改进后网络的可解释性增强,更好地关注叶片病害部分。

关键词:深度学习;玉米叶片病害;迁移学习;可解释性;图像处理

中图分类号:TP391.4; S435.131

文献标识码:A

文章编号:2095-5553 (2025) 01-0204-09

Identification and explainability of maize leaf diseases based on

improved GoogLeNet

Niu Panting1, Zhang Baolin1, 2, 3, Pan Lijie1, Guo Jianpeng1

(1. College of Chemistry and Environmental Sciences, Inner Mongolia Normal University, Hohhot, 010020, China;

2. Inner Mongolia Key Laboratory of Environmental Chemistry, Hohhot, 010020, China;

3. Inner Mongolia Water-saving Agriculture Engineering Research Center, Hohhot, 010020, China)

Abstract:

In order to strengthen the identification of crop diseases, reduce the frequency and intensity of disease occurrence, and increase crop yield and quality, five kinds of deep learning frameworks based on transfer learning was used to identify and classify maize leaf diseases, including corn rust, leaf blight and gray spot. Compared with AlexNet, VGG19, ResNet50, GoogLeNet and MobileNetV2 deep learning networks, the recognition accuracy of GoogLeNet is the highest by 96.3%, and the model convergence effect is the best. By further optimizing the GoogLeNet model architecture, the Convolutional Block Attention Module (CBAM) is inserted into the inception module, and the LeakyReLU activation function is used to replace the ReLU function. After the improvement, the network channel attention is strengthened, the recognition accuracy of the test dataset reaches 99.0%, and the recognition accuracy is increased by 2.7%. CAM(Class Activation Mapping) and LIME(Local Interpretable Model-Agnostic Explanations) algorithms are used to analyze the model interpretability, the interpretability of the improved network shows higher explainability, with more attention on disease affected leaf regions.

Keywords:

deep learning; maize leaf disease; transfer learning; explainability; image processing

0"引言

玉米是我国的重要粮食作物,种植范围广、面积大。玉米叶部病害危害较重,影响玉米的产量和质量[1]。要在保护生态的基础上提高病虫害防治水平,需要优化病害识别方法与技术,以减少病害发生频率与强度。因此,农作物病虫害的无损检测是精准农业、智慧农业发展的必然需求。

由于深度学习具有自主学习和特征提取等优点,在图像识别、语义分割等领域取得了重大突破,也成为农业植物保护和环境保护的研究热点[2]。深度学习的出现为病虫害防治提出了新的思路与方法,农作物病虫害识别已进入第3个阶段,即基于深度学习的人工智能阶段。学者们将以AlexNet[3]、VGG[4]、GoogLeNet[5]、ResNet[6]、DenseNet[7]、MobileNet[8]等为代表的深度神经网络应用到农作物病虫害识别、监测中,取得了不错的效果。基于GoogLeNet搭建的苹果树叶片病害诊断模型在叶片病害识别精确率达98.4%[9]。李恩霖等[10]采用迁移学习构建了5种卷积神经网络,CNN的病虫害识别模型在玉米3种病害上表现出良好的效果,准确率达99.73%。许景辉等[11]采用迁移学习方法,基于VGG16构建了新的全连接层,实现了大斑病与玉米锈病的智能识别。李静等[12]通过改进GoogLeNet模型,对玉米螟虫害图像识别准确率达到96.44%。杨长磊等[13]采用迁移学习,改进MobileNet,在5万余张农作物图像上进行训练,病害识别准确率达到了99.67%。Mohanty等[14]利用GoogleNet识别14种作物的26种疾病,准确率达到99.35%。

虽然深度学习在图像分类、语义分割、视频处理和关键点检测等多个领域都取得了优秀的成果,但在可解释性方面,与机器学习算法相比,深度学习有很大的滞后性,给研究带来了很大的阻碍[15]。深度学习网络的可解释性是指理解网络的决策过程和内部机制的能力[16]。在深度学习中,网络通常由许多层和节点组成,层和节点之间的关系非常复杂,使得人们很难理解网络的决策过程和内部机制。因此,深度学习网络模型的可解释性一直是一个热门话题。近年来,研究人员提出了许多方法以增强深度学习的可解释性。2016年,Zhou等[17]提出CAM算法,在图像分类任务中生成热力图,对深度学习网络进行了可解释与显著性分析,同时展现了可帮助图像分类模型解决定位问题的能力。2017年,根据CAM算法衍生出的Grad-CAM[18],对CAM进行优化改进,可以分析深度学习网络的任意一层。LIME算法[19]是基于局部代理模型来对单个样本进行解释,与网络无关,可用性很高。然而,在目前的植物病害识别领域中,模型在特征提取阶段学习到了什么,依据什么进行分类依旧是一种“黑盒”问题,可解释性分析罕见报导。黑盒问题导致深度学习在玉米病害识别分类的可解性研究很少,亟需进行研究探索,助力人工智能在农业领域的应用和智慧农业的发展。

本文以玉米叶片锈病、大小斑病和灰斑病为研究对象,采用迁移学习构建AlexNet、VGG19、ResNet50、GoogLeNet和MobileNetV2五种卷积神经网络进行玉米叶片病害的识别、分类评估,选出最佳模型并进行优化,为病害监督管理方面提出新的方法;进而利用CAM、LIME算法对模型的可解释性进行探索,观察网络在图像分类任务中的学习情况,对深度学习网络的“学习”内容进行分析,明确网络模型改进的方向。基于深度学习技术的玉米病害叶片分类监测和可解释性研究,将有助于玉米病害的识别,做到及时防治,提高作物产量和品质。

1"材料与方法

1.1"数据集构建

数据图像是训练模型的基础,数据集越大,网络模型学习到的图像特征越全面,在测试集上运行效果更好。本研究的数据集由公开数据集、实地拍摄和网络下载的图像构成。实地拍摄图像和网络下载图像有大量的无关信息,需要进行数据的预处理,增强图像分类识别的有效性。采用GrabCut进行图像分割,去除图像中的无关信息(如杂草、土壤、茎秆等)(图1),得到健康玉米叶片图像554张、玉米锈病图像1239张、大小斑病图像1094张、玉米灰斑病图像555张,共计3442张图像数据。同时,通过数据增强扩充数据集。为防止数据样本不均衡、数据样本差距较大等导致的一系列问题,在进行数据扩充时,对玉米灰斑病和健康图像进行多次扩充。经过数据扩充后,玉米健康叶片图像为3324张,玉米锈病图像3717张,大小斑病图像3330张,玉米灰斑病图像3286张,共计13657张(表1)。按8∶2的比例随机划分数据集为训练集与测试集。

1.2"研究方法

由于深度学习在众多领域的成功应用,国内外学者将深度学习与农业领域相结合,其中CNN得到广泛应用。CNN基本结构包括卷积层(Conv)、池化层(Pooling)、激活函数(ReLU)、归一化层(BN)和全连接层(FC)。对于农作物病虫害图像,可以通过卷积层运算提取特征,应用池化层减少数据处理量并保留有用特征,通过完全连接层权重矩阵重建局部特征[2]。迁移学习是将在某个任务上训练出来的网络模型参数,经过微调后直接运用到新的任务中,可减少网络模型训练时间,使模型的泛化能力得到提高[20]。迁移学习的训练成本低,在没有深度学习机器的情况下也可以进行。迁移学习也可运用于小数据集,解决部分数据不足或原有数据少的问题。基于此,利用迁移学习构建深度学习模型。

1.2.1"技术路线

使用Python语言,基于Pytorch框架搭建网络模型。采用迁移学习方法,构建AlexNet、VGG19、ResNet50、GoogLeNet和MobileNetV2模型,并对网络参数进行微调。采用相同的数据,相同的超参数设计进行训练,筛选出运行效果最好的网络模型并进行优化。通过比较模型改进前后的混淆矩阵、识别准确率(Accuracy)、精确率(Precision)、召回率(Recall)和语义特征降维可视化,分析模型优化效果。最后,对深度学习网络进行可解释性分析,将其作为重要的指标之一进行网络评价。技术路线如图2所示。

1.2.2"激活函数

在很多模型中使用ReLU作为激活函数,如果输入激活函数是大于0的信号,信号就将向后传递,其他输出为0。ReLU是当前使用最频繁的激活函数。

f(x)=

xxgt;0

0x≤0

(1)

LeakyReLU是ReLU激活函数的一种变形,是为了解决ReLU激活函数的神经元“死亡”问题提出的。LeakyReLU与ReLU的输出仅在xlt;0时有差异,在ReLU中输入小于0时,输出为0;而LeakyReLU输入小于0时,输出为负值,梯度非常小。这样,当LeakyReLU激活函数输入小于0的信号时,也能够通过计算得到梯度。

f(x)=

xx≥0

axxlt;0

(2)

1.2.3"神经网络模型评价指标

基于深度学习的农作物病虫害监测识别中,常用于评价分类模型的指标主要有准确率、灵敏度、召回率、精确率和F1分数等[21]

1) "识别准确率。

准确率(Accuracy)是正确预测占所有预测的比例,计算如式(3)所示。

Accuracy=TN+TPTN+TP+FN+FP

(3)

式中:

TP——被网络模型预测为正类的正样本;

TN——被网络模型预测为负类的负样本;

FP——被网络模型预测为正类的负样本;

FN——被网络模型预测为负类的正样本。

2) "精确率。

精确率(Precision)是对网络模型判断出的所有正例(TP+FP)来说,真正例(TP)占的比例,计算如式(4)所示。

Precision=TPTP+FP

(4)

3) "召回率。

召回率(Recall)又称查全率,表示的是分类器中判定为真的正例占总正例的比率,计算如式(5)所示。

Recall=TPTP+FN

(5)

4) "F1分数,计算如式(6)所示。

F1-Score=2×Precision×RecallPrecision+Recall

(6)

1.2.4"神经网络模型可解释性

识别准确率不是评价网络模型的唯一指标,模型具有良好的可解释性也是必要的。在深度学习发展中一直有一个困扰人们的问题,就是“黑盒”难题。在深度学习中,常用的CNN普遍被认为是个黑盒,可解释性不高。复杂的神经网络结构导致模型有很大的不透明性,可解释性相较于机器学习很差[22]

在图像分类任务中,第一个步骤是对数据集进行训练,第二个步骤是对数据集进行测试,而不管是训练还是测试,网络结构的内容都是不透明的。只知道模型从训练中学到特征,再应用到测试集,得到数据的分类结果;但不知道网络模型究竟提取了何种特征,按照何种特征进行分类,有哪些侧重点。因此,对模型的可解释性进行研究,有助于对模型进行评估,发现模型的不足。对于模型的可解释性分析,可分为敏感性分析和梯度分析。敏感度分析就是分析模型对哪个特征更为敏感、更感兴趣;梯度分析就是将数据集中的特征通过梯度变化,来说明数据集中的哪些特征是分类的依据。目前,网络可解释性研究的常用的方法包括CAM、LIME、Grad-CAM[23]、SmoothGrad[24]等。本文使用CAM、LIME对模型进行可解释性研究,并将可解释性作为模型的重要评价指标。CAM是类激活图算法,计算简单,可以有效地反映网络在输入中关注的特征,并绘制出相应的热力图,可以发现模型在原图的注意力,关注哪些区域。LIME算法是一种局部可解释性模型算法,主要用于文本类与图像类模型中,具有很强的通用性,性能优越。

2"结果与分析

2.1"基于迁移学习的玉米叶片病害识别

2.1.1"试验超参数设置

采用迁移学习方法构建AlexNet、VGG19、ResNet50、GoogLeNet和MobileNetV2进行训练,对ImageNet图像识别大赛网络的权重参数进行微调网络。在训练网络时,学习率过高网络不稳定,过低模型收敛很慢。采用学习率衰减法,每经过10次迭代,学习率减半。模型Batchsize设置为64,采用Adam进行参数优化。

2.1.2"模型性能评价

1) "模型稳定性。

深度学习网络的损失函数可以反映模型在训练过程中的稳定性。如果训练集和测试集的损失函数值都趋于稳定,表明模型训练稳定;比较模型在训练集与测试集上的训练结果,二者间差距越小,说明模型在数据集上的表现越稳定。根据模型在测试集上损失的变化可知,AlexNet的收敛最差,曲线波动最大,稳定性不好(图3)。通过比较不同模型在训练集和测试集上的误差,可知全部网络整体误差很小(表2)。GoogLeNet与VGG19模型的泛化能力较好,误差很小,模型表现良好。MobileNetV2的曲线波动很小,收敛效果优于AlexNet、VGG19和ResNet50。比较模型在训练集与测试集的损失,可以发现ResNet50模型损失最小,AlexNet损失最大,说明AlexNet模型稳定性最差。

2) "模型分类能力。

根据模型损失函数的变化(图3),可以发现GoogLeNet的性能优于其他模型,收敛效果和损失上表现较优。AlexNet损失函数曲线在epoch=29和epoch=33时骤减,导致曲线波动很大,其原因可能是学习率设置不合理,导致网络训练的收敛效果不好。VGG19和GoogLeNet在识别准确率上相差不大,但VGG19在损失上表现较差,两个网络运行效果远优于其他网络。在扩充数据集上,GoogLeNet模型的损失值远小于其他网络,识别准确率优于其他网络(图4、表3),没有出现过拟合的现象,模型运行效果最好。

根据模型分类混淆矩阵(图5),可以观察到单个病害的识别效果,识别效果最好的是玉米锈病,其次是健康叶片,大小斑病和灰斑病分类效果较差。VGG19的运行效果也很优秀,存在单个病害识别优于GoogLeNet网络的现象。

2.2"基于改进GoogLeNet算法的玉米叶片病害识别

2.2.1"模型架构改进

根据不同模型在数据集上的表现(表3),GoogLeNet性能最为优秀,收敛效果好,准确率最高,达到96.3%。因此,对GoogLeNet改进,推出一个更为优秀的网络结构。GoogLeNet采用的inceptionModule结构,较好地解决了增加网络深度带来的梯度消失问题,同时采用了不同尺寸的卷积核和池化层来解决网络规模可能造成的过拟合问题。

在改进GoogLeNet时,引入注意力机制。注意力机制可以让网络更加关注重要的特征,从而提高网络性能,增强图像分类识别效果。常用的注意力机制模块有SENet、CBAM、ECA和RFB等。CBAM[25]是常用于图像分类的注意力机制,可以增强模型的表达能力,帮助网络更好地捕捉图像中的重要特征,提高模型的性能。CBAM有两个并行的块:通道注意力模块和空间注意力模块(图6)。通道注意力模块通过学习特定通道的重要性来加权每个通道的特征图,空间注意力模块通过自适应地调整不同空间位置的特征响应来提高模型的空间感知能力。CBAM可以自适应地学习哪些特征最重要,并将其加权到模型中。加入CBAM模块后,可以在通道维度和空间维度上进行特征的重要性评估和特征的重新缩放,更好地捕捉具有不同大小和位置的对象,提高对图像细节的感知,更好地捕捉图像中的重要特征,提高网络性能。采用CBAM注意力机制进行网络优化,在GoogLeNet中加入注意机制,以改进网络性能。

在inception模块中加入CBAM模块,ReLU激活函数可能会出现Dead ReLU情形,因此采用LeakyReLU激活函数替代ReLU激活函数。LeakyReLU激活函数比ReLU函数更加稳定,可以解决神经元的“死亡”问题,相对于ReLU激活函数有更快的收敛速度。

在新的网络模型中,在GoogLeNet的每个inception Module中添加CBAM模块,以增强模型的注意力,增强特征表达能力,以提高模型分类准确率和泛化能力。同时,将模型中的ReLU激活函数替换为LeakyReLU激活函数,改进后GoogLeNet的inception结构如图7(b)所示。

2.2.2"模型性能改进

1) "模型稳定性。

模型改进前后稳定性变化较大,网络模型运行曲线可以反映出模型在训练过程中的稳定性。改进后的GoogLeNet模型损失函数曲线波动更小,收敛效果更好,模型的稳定性更好(图8)。同时,对比训练集与测试集测试误差(表4)可知,改进后的GoogLeNet模型在训练集与测试集上的表现差距相较改进前更小,说明改进后GoogLeNet网络模型在数据集上的表现更稳定。

2) "模型准确率。

将通过添加注意力机制和替换激活函数后的新模型,应用于试验数据,采用与之前试验相同的参数设计,对比改进前后模型运行的效果。可以看出,改进后的GoogLeNet在识别准确率方面的表现远优于优化前的模型(图9)。根据改进后GoogLeNet的混淆矩阵(图10),可以看出模型对所有的玉米病害的识别性能都有所提升,其中,玉米大小斑病的提升效果最好,灰斑病与大小斑病错误识别的情形明显减少。

对比模型改进前后的模型评价指标(表5),可以发现,改进后的GoogLeNet在识别准确率、精确率、召回率和F1分数上均优于改进前的GoogLeNet。模型的精确率提高了,错误率降低了,网络模型分类效果明显有提升;F1分数增加,说明网络模型分类效果变好。改进后GoogLeNet模型的性能参数平均为99.0%,接近于1,模型达到稳态,模型性能良好。改进后GoogLeNet模型的性能远优于优化前的网络模型。

3) "特征可视化。

对训练好的模型进行语义特征降维可视化研究,通过测试集数据的降维可视化,观察模型将不同数据划分到什么位置,有助于理解模型在面对图像进行了怎样的判断。将数据投影到二维空间,可以观察到模型的聚类情况,采用t-SNE(t-Distributed Stochastic Neighbor Embedding)函数对测试集的数据图像降维可视化(图11)。可以发现,测试集的数据图像的可分性很好,同类别之间间隔小,不同类之间间隔大。同时,也可以发现模型对灰斑病与大小斑病的分类存在混淆情况,分类效果远不如玉米的健康叶片,造成这一情况的主要原因可能是因为玉米叶片灰斑病与大小斑病的病状存在相似性。

2.2.3"数据集大小对模型的影响

为探究数据集的大小对模型训练的影响,利用扩充前的原始数据(3442张)与数据增强后的扩充数据(13657张)分别进行试验。采用提出的新模型进行对比,学习率设置为当test_loss经过8次迭代没有减小时,学习率减小为原学习率的10%;Batchsize设置为64;采用Adam进行优化参数。可以发现,扩充数据集运行的结果远优于原始数据集,可知数据集的扩充会使模型在测试集上表现更好(图12)。

2.3"模型可解释性研究

采用CAM算法对AlexNet、VGG19、ResNet50、GoogLeNet、MobileNetV2和改进GoogLeNet算法进行可解释分析,可以发现改进后的网络可解释性更好(图13)。模型在提高网络准确率的同时,增强了神经网络模型的可解释性。注意力机制可以将网络的决策集中在输入的特定区域或局部,改进GoogLeNet算法可以更好地关注图像中的病害部分。

同时,AlexNet网络的可解释性相对于其他网络较差,模型的重点关注区域错误。因为在AlexNet网络深层次结构中,存在大量的卷积层和池化层,使得网络中的每一个神经元都难以解释其具体的作用和含义,使AlexNet网络的可解释性较差。对所提出的改进GoogLeNet网络进行LIME可解释分析(图14),绿色区域代表图像当前的类别一致,红色则相反,玉米大小斑病病状区域被识别出,LIME算法进行可解释分析效果良好。

3"讨论

3.1"注意力机制对模型性能的影响

在网络结构中加入注意力机制可以提升模型的精度、泛化能力和网络可解释性。注意力机制可以帮助网络消除输入中的噪声和干扰,增强网络可解释性。根据模型优化前后的运行结果、混淆矩阵和语义降维可视化,可以发现改进的算法在识别精度与算法性能方面都远优于优化前的网络。改进后,识别准确率提高2.7%,模型收敛效果更好,稳定性有所增高。在深度学习网络中添加注意力机制可以提升精度,这与其他学者的研究结果一致。在YOLOv5s的骨干网络中加入CBAM注意力机制模块,提高了识别精度,实现对温室番茄快速识别[26]。YOLOv5s引入优化后的CBAM模块与改进前相比农作物病虫害识别中精度提高了5%[27]。在轻量化Efficient网络中引入CBAM模块,在水稻常见病害数据集上的识别准确率95.63%,提高了1.75%[28]。综上所述,在网络中添加注意力机制模块确实可以避免无关信息的干扰,提升模型的性能,增强模型的特征提取能力,保留图像的关键特征,提高模型分类能力。研究中,将CBAM模块添加到inception模块中提高了模型的表达能力、泛化能力和精度。

CNN的浅层卷积提取的都是颜色、纹理、边缘和斑块等特征,可以依据实际任务进行改进优化神经网络。inception模块能够提取不同尺度的特征图,而CBAM模块能够自适应地对不同通道和空间位置进行注意力加权,能够使得网络更加关注重要的特征,加强特征图的表达能力,提升模型的泛化能力。在后续研究中,可以尝试在GoogLeNet模型的其他地方插入CBAM模块,或者替换GoogLeNet中前几层的卷积层。

3.2"激活函数对模型性能的影响

在优化GoogLeNet模型时,引入LeakyReLU激活函数,因为在实际训练中发现ReLU会出现神经元死亡情况。采用LeakyReLU激活函数可以规避ReLU的“死亡”问题,提高网络性能。LeakyReLU的引入使得梯度在小于0的区域不为0,从而减少训练过程中的抖动,使得训练更加稳定。李静等[12]基于GoogLeNet优化识别玉米螟虫研究中,将ReLU更换为Sigmoid激活函数。但是张瑞青等[29]基于AlexNet模型进行改进识别花生荚果等级的研究中,分析讨论了激活函数的影响,发现更换为LeakyReLU激活函数时网络模型训练提升效果微弱。本文采用LeakyReLU激活函数,没有做不同激活函数对模型运行结果的影响,有待于进一步研究。

3.3"玉米叶片病害误判的原因分析

通过各种不同模型的运行结果、混淆矩阵的比较,可以发现每个模型中玉米锈病的识别准确率都高于另外两种病害。对模型进行语义降维可视化,发现玉米大小斑病与灰斑病有相互误判的情况。其原因可能是数据图像存在错标、病害情形复杂,存在混合病害,识别难度大,又或者因为灰斑病与大小斑病的发病性状有相似性。灰斑病发病时,症状起初为椭圆形至矩圆形灰色至淡褐色,边缘不太明显,后期会变为褐色,病斑区域多局限于平行的叶脉之间[30]。玉米大小斑病发病症状呈椭圆形、近球形、柱形或倒棍棒形,中间或中间稍下处最宽,两端渐细小,褐色至深褐色。由此可知大小斑病与灰斑病症状有相似性,可能导致模型在这两种病害上的识别分类精度不如玉米锈病。

3.4"玉米叶片病害识别模型可解释性

通过对所有搭建的网络进行CAM热力图进行可解释研究,发现改进后的模型网络可解释性更好,这与其他学者研究一致。优化后的网络在提高网络准确率的同时,增强了网络的可解释性。王昕等[27]对优化后的YOLOv5算法通过Grad-CAM进行了可解释分析,发现优化前后的网络关注点不同,优化前的网络更关注局部卷积,优化后的网络可以很好地将局部卷积与全局部卷积结合。于雪莹等[31]通过采用特征图和热力图对CBAM-ResNet进行可视化分析,了解模型对苹果病害的识别机制。通过分析与对比,优化后的网络可以更好地注意病害部分,降低对背景的关注。注意力机制模块可以更加准确地关注输入数据的重要特征,增强网络可解释性。本研究对网络进行了LIME算法可解释性研究,发现本研究的可解释性、可行性很好。LIME算法有很强的通用性,但是运行速度比CAM慢。因为LIME算法通过干扰数据样本的输入变量去理解预测是如何变化来理解分类模型,本研究中数据样本的输入变量为图像中的每个像素[32]

在玉米病害图像识别分类任务,对深度学习网络进行可解释分析,可以发现深度学习网络模型在数据图像上的注意力,在关注什么区域,依据什么特征进行分类。对深度学习模型进行可解释分析,有助于进一步对模型的评估,也可以发现模型的缺点,思考模型为什么分类错误,并提出改进优化方向。在后续研究中,为提高深度学习网络的可解释性,可以尝试一些特殊的技术和方法,例如可视化、解释性对抗训练和局部敏感性分析等,可以多采用一些可解释性算法对深度学习图像分类任务进行分析。

4"结论

1) 基于AlexNet、VGG19、ResNet50、GoogLeNet和MobileNetV2,通过迁移学习方法构建5种深度学习网络,对3种玉米叶片病害进行识别分类,研究表明GoogLeNet的识别准确率最高,达到96.3%。

2) 通过在inception模块中加入CABM改进GoogLeNet,深度学习网络在数据测试集上最高识别准确率达到99.0%,较改进前提高2.7%。研究表明在GoogLeNet中添加CBAM注意力机制模块,提升了模型的稳定性与识别精度,可以帮助网络更好地学习特征表示,提高识别准确率。

3) 网络的可解释分析表明改进后的网络对叶片病害部分更加关注,决策依据集中于病害区域,使可解释性得到增强。因此,模型的可解释性分析可以作为改进网络的参考。

参"考"文"献

[1]

刘丽娟, 刘仲鹏, 张丽梅. 基于图像处理技术的玉米叶部病害识别研究[J]. 吉林农业科学, 2014, 39(1): 61-65.

Liu Lijuan, Liu Zhongpeng, Zhang Limei. Studies on image processing of maize leaf diseases [J]. Journal of Jilin Agricultural Sciences, 2014, 39(1): 61-65.

[2]

翟肇裕, 曹益飞, 徐焕良, 等. 农作物病虫害识别关键技术研究综述[J]. 农业机械学报, 2021, 52(7): 1-18.

Zhai Zhaoyu, Cao Yifei, Xu Huanliang, et al. Review of key techniques for crop disease and pest detection [J]. Transactions of the Chinese Society for Agricultural Machinery, 2021, 52(7): 1-18.

[3]

Krizhevsky A, Sutskever I, Hinton G. ImageNet classification with deep convolutional neural networks [C].Advances in Neural Information Processing Systems, 2012.

[4]

Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition [J]. arXiv preprint arXiv: 1409. 1556, 2014.

[5]

Szegedy C, Liu W, Jia Y, et al. Going deeper with convolutions [C]. 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2015.

[6]

He K, Zhang X, Ren S, et al. Deep residual learning for image recognition [C]. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016.

[7]

Huang G, Liu Z, Van Der Maaten L, et al. Densely connected convolutional networks [C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2017.

[8]

Howard A, Zhu M, Chen B, et al. MobileNets: Efficient convolutional neural networks for mobile vision applications [J]. arXiv preprint arXiv: 1704. 04861, 2017.

[9]

宋晨勇, 白皓然, 孙伟浩, 等. 基于GoogLeNet改进模型的苹果叶病诊断系统设计[J]. 中国农机化学报, 2021, 42(7): 148-155.

Song Chenyong, Bai Haoran, Sun Weihao, et al. Design of apple leaf disease diagnosis system based on GoogLeNet improved model [J]. Journal of Chinese Agricultural Mechanization, 2021, 42(7): 148-155.

[10]

李恩霖, 谢秋菊, 苏中滨, 等. 基于深度学习的玉米叶片病斑识别方法研究[J]. 智慧农业导刊, 2021, 1(10): 1-10.

Li Enlin, Xie Qiuju, Su Zhongbin, et al. Research on maize leaf disease spot recognition based on deep learning [J]. Journal of Smart Agriculture, 2021, 1(10): 1-10.

[11]

许景辉, 邵明烨, 王一琛, 等. 基于迁移学习的卷积神经网络玉米病害图像识别[J]. 农业机械学报, 2020, 51(2): 230-236.

Xu Jinghui, Shao Mingye, Wang Yichen, et al. Recognition of corn leaf spot and rust based on transfer learning with convolutional neural network [J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(2): 230-236.

[12]

李静, 陈桂芬, 安宇. 基于优化卷积神经网络的玉米螟虫害图像识别[J]. 华南农业大学学报, 2020, 41(3): 110-116.

Li Jing, Chen Guifen, An Yu. Image recognition of pyrausta nubilalis based on optimized convolutional neural network [J]. Journal of South China Agricultural University, 2020, 41(3): 110-116.

[13]

杨长磊, 李彩林, 王佳文, 等. 基于改进深度神经网络的农作物病害识别研究[J]. 农业与技术, 2021, 41(6): 1-3.

[14]

Mohanty S P, Hughes D P, Salathé M. Using deep learning for image-based plant disease detection [J]. Frontiers in Plant Science, 2016, 7: 1419.

[15]

杨朋波, 桑基韬, 张彪, 等. 面向图像分类的深度模型可解释性研究综述[J]. 软件学报, 2023, 34(1): 230-254.

Yang Pengbo, Sang Jitao, Zhang Biao, et al. Survey on interpretability of deep models for image classification [J]. Journal of Software, 2023, 34(1): 230-254.

[16]

陈冲, 陈杰, 张慧, 等. 深度学习可解释性综述[J]. 计算机科学, 2023, 50(5): 52-63.

Chen Chong, Chen Jie, Zhang Hui, et al. A Review of interpretability in deep learning [J]. Computer Science, 2023, 50(5): 52-63.

[17]

Zhou B, Khosla A, Lapedriza A, et al. Learning deep features for discriminative localization [C]. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016.

[18]

Selvaraju R R, Cogswell M, Das A, et al. Grad-CAM: Visual explanations from deep networks via gradient-based localization [C]. 2017 IEEE International Conference on Computer Vision (ICCV), 2017.

[19]

Ribeiro M T, Singh S, Guestrin C. “Why should i trust you?” explaining the predictions of any classifier [C]. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2016: 1135-1144.

[20]

庄福振, 罗平, 何清, 等. 迁移学习研究进展[J]. 软件学报, 2015, 26(1): 26-39.

Zhuang Fuzhen, Luo Ping, He Qing, et al. Survey on transfer learning research [J]. Journal of Software, 2015, 26(1): 26-39.

[21]

Ishengoma F S, Rai I A, Said R N. Identification of maize leaves infected by fall armyworms using UAV-based imagery and convolutional neural networks [J]. Computers and Electronics in Agriculture, 2021, 184: 106124.

[22]

苏炯铭, 刘鸿福, 项凤涛, 等. 深度神经网络解释方法综述[J]. 计算机工程, 2020, 46(9): 1-15.

Su Jiongming, Liu Hongfu, Xiang Fengtao, et al. Survey of interpretation methods for deep neural networks [J]. Computer Engineering, 2020, 46(9): 1-15.

[23]

Selvaraju R R, Cogswell M, Das A, et al. Grad-CAM: Visual explanations from deep networks via gradient-based localization [C]. IEEE International Conference on Computer Vision. IEEE, 2017.

[24]

Smilkov D, Thorat N, Kim B, et al. SmoothGrad: Removing noise by adding noise [J]. arXiv Preprint arXiv: 1706. 03825, 2017.

[25]

Woo S, Park J, Lee J, et al. CBAM: Convolutional block attention module [C]. Proceedings of the 15th European Conference on Computer Vision (ECCV), 2018.

[26]

张俊宁, 毕泽洋, 闫英, 等. 基于注意力机制与改进YOLO的温室番茄快速识别[J]. 农业机械学报, 2023, 54(5): 236-243.

Zhang Junning, Bi Zeyang, Yan Ying, et al. Fast recognition of greenhouse tomato targets based on attention mechanism and improved YOLO [J]. Transactions of the Chinese Society for Agricultural Machinery, 2023, 54(5): 236-243.

[27]

王昕, 董琴, 杨国宇. 基于优化CBAM改进YOLOv5的农作物病虫害识别[J]. 计算机系统应用, 2023, 32(7): 261-268.

Wang Xin, Dong Qin, Yang Guoyu. YOLOv5 improved by optimized CBAM for crop pest identification [J]. Computer Systems amp; Applications, 2023, 32(7): 261-268.

[28]

卫雅娜, 王志彬, 乔晓军, 等. 基于注意力机制与EfficientNet的轻量化水稻病害识别方法[J]. 中国农机化学报, 2022, 43(11): 172-181.

Wei Yana, Wang Zhibin, Qiao Xiaojun, et al. Lightweight rice disease identification method based on attention mechanism and EfficientNet [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(11): 172-181.

[29]

张瑞青, 李张威, 郝建军, 等. 基于迁移学习的卷积神经网络花生荚果等级图像识别[J]. 农业工程学报, 2020,36(23): 171-180.

Zhang Ruiqing, Li Zhangwei, Hao Jianjun, et al. Image recognition of peanut pod grades based on transfer learning with convolutional neural network [J]. Transactions of the Chinese Society of Agricultural Engineering, 2020, 36(23): 171-180.

[30]

周慧升. 玉米灰斑病的发生及综合防治[J]. 云南农业, 2020(8): 56-58.

[31]

于雪莹, 高继勇, 王首程, 等. 基于生成对抗网络和混合注意力机制残差网络的苹果病害识别[J]. 中国农机化学报, 2022, 43(6): 166-174.

Yu Xueying, Gao Jiyong, Wang Shoucheng, et al. Apple disease recognition based on wassersteingenerative adversarialnetworks and hybrid attention mechanism residual network [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(6): 166-174.

猜你喜欢
迁移学习图像处理深度学习
机器学习在图像处理中的应用
电子制作(2018年18期)2018-11-14 01:48:20
模糊图像处理,刑事侦查利器
图像处理技术的实战应用
基于多特征融合的跨域情感分类模型研究
奇异值分解与移移学习在电机故障诊断中的应用
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
软件导刊(2016年9期)2016-11-07 22:20:49
基于深度卷积网络的人脸年龄分析算法与实现
软件工程(2016年8期)2016-10-25 15:47:34
一种基于迁移极速学习机的人体行为识别模型
物联网技术(2015年9期)2015-09-22 09:23:43