胡玲艳 周婷 刘艳 许巍 盖荣丽 李晓梅 裴悦琨 汪祖民
摘要: 为了实现番茄病害的精准识别,本研究提出一种轻量级网络自适应特征提取方法。该方法首先对图片进行正形处理,然后基于SqueezeNet模型构建轻量级网络模型GKFENet。GKFENet模型包含全局特征提取和关键特征提取2个模块,其中全局特征提取模块逐层提取番茄病害叶片的全局特征,关键特征提取模块通过学习评估出特征图各通道的重要程度,计算出权重值,最后将该值加权到原特征图上,从而实现病害关键特征的自适应提取。结果显示,正形机制有助于神经网络学习特征,本研究构建的GKFENet模型的平均识别准确率为97.90%,模型大小仅为2.64 MB,且在强噪声环境下,其识别准确率仍能保持在78.00%以上。GKFENet模型在训练过程中相对稳定,对8种番茄病害的识别准确率均超过96.00%。相比Bayes、KNN、LeNet、SqueezeNet、MobileNet模型,本研究构建的GKFENet模型的识别精度高,稳定性强且占用内存小,对于移动端未来的应用具有较高的实际价值。
关键词: 轻量级网络; 正形机制; 特征提取; 番茄; 病害识别
中图分类号: TP391;S641.2 文獻标识码: A 文章编号: 1000-4440(2022)03-0696-10
Tomato disease recognition based on lightweight network auto-adaptive feature extraction
HU Ling-yan, ZHOU Ting, LIU Yan, XU Wei , GAI Rong-li, LI Xiao-mei, PEI Yue-kun, WANG Zu-min
(School of Information Engineering, Dalian University, Dalian 116622, China)
Abstract: To realize accurate recognition of tomato diseases, a lightweight network auto-adaptive feature extraction method was proposed. This method firstly performed a correction processing on the image. Then, based on the SqueezeNet model, a lightweight network model named global and key feature extraction network (GKFENet) was built. The GKFENet model included global feature extraction and key feature extraction modules. The global feature extraction module extracted the global features of tomato diseased leaves layer by layer. The key feature extraction module evaluated the importance of each channel in the feature images through learning, and calculated the weight value. Finally, the value was weighted on the original feature images to realize the adaptive extraction of the key features of the diseases. The results showed that the correction mechanism helped the neural network to learn features, the average identification accuracy of GKFENet model constructed in this research was 97.90%, and the model size was only 2.64 MB. In an environment with strong noise, the recognition accuracy of the model was still above 78.00%. GKFENet model was relatively stable during the training process, and the recognition accuracies of eight types of tomato diseases were all over 96.00%. Compared with Bayes, k-nearest neighbor (KNN), LeNet, SqueezeNet and MobileNet models, the GKFENet model constructed in this research has higher recognition accuracy, stronger stability and less memory. It has strong practical value in future mobile applications.
Key words: light weight network; correction mechanism; feature extraction; tomato; disease recognition
番茄富含维生素和矿物质,兼具特殊药理作用,被人们广为食用,已经被世界粮农组织列为第六大蔬菜 [1-2] 。种植过程中的病虫害严重制约着番茄的产量和收益,一旦对疾病判断有误或者诊断不及时,将给农户带来巨大的经济损失。因此,快速、精准地识别番茄病害类型,及时进行干预,有助于农户番茄种植的提质增效。
随着计算机技术和人工智能的快速发展,利用这些信息技术对植物病害类别进行诊断、识别,逐渐成为一种新趋势。目前,国内外针对番茄病害识别方面的研究取得了较大进展,基于传统的机器学习算法,通过手工提取特征和分类器进行分类 [3-4] ,可以初步满足病害识别的要求,但复杂的特征提取工程极大地影响了工作效率,且人工提取的特征是主观的、有限的、粗糙的。深度学习浪潮的兴起,为上述问题提供了解决办法。其中,卷积神经网络具备强大的“自学”能力,能够在最大程度上获取所有与输入、输出相关联的信息,避免了繁重的特征提取工作,备受研究者们青睐。Jiang等 [5] 和Rangarajan等 [6] 采用不同的深度卷积神经网络识别番茄病害,每个模型的预测精度均在97%以上。王艳玲等 [7] 和Jia等 [8] 将迁移学习与神经网络模型相结合,通过“固定低层,微调高层”的训练策略,建立的模型能快速、准确识别10种番茄病害。Wu等 [9] 利用DCGN网络模型增强数据,并分别采用AlexNet、GoogLeNet、VGG16、ResNet网络模型对番茄叶片病害进行识别。上述研究均采用经典的深层网络模型,随着研究的推进,这些模型的层数逐渐增多。增加网络模型深度可以有效提升准确率,但同时需要耗费巨大的存储空间和运算时间。在识别番茄叶片图像的过程中,神经网络模型会提取整个图片的信息,然而真正需要提取的有用特征仅存在于目标对象所在的局部区域。因此,人们从增加网络模型深度转而开始研究如何实现对病害关键特征的提取。胡志伟等 [10] 、李晓振等 [11] 以及Meeradevi等 [12] 提出将注意力机制与多种深层网络模块相结合的方法,利用注意力机制有效抽取番茄病害不同层次的特征信息,加强关键特征的表达,同时抑制无关特征的表达,最终构建的模型均有较高的准确率。这种方法通过对目标特征的精准提取,实现计算资源的合理分配,进而提升模型的识别性能,但网络模型巨型化的问题仍未得到有效解决,因此这些模型难以应用到移动端。
随着物联网技术在各行各业的广泛应用、移动设备的日趋普及,人们开始研究可以应用在移动端的病害识别算法。方晨晨等 [13] 和郭小清等 [14] 在深层网络架构的基础上,采用多尺度卷积核、深度可分离卷积等操作对传统网络模型进行改进,缩小了模型大小,实现了准确率和存储空间的平衡,其中改进的AlexNet模型识别田间番茄病害的准确率达到89.2%。Elhassouny等 [15] 基于现有的轻量级网络模型MobileNet构建一种应用程序,识别10种常见的番茄叶部病害。Agarwal等 [16] 搭建了1个8层的简化卷积神经网络(CNN)模型,在Plant Village数据库上的测试效果均优于K最近邻算法和深层网络模型VGG16。上述算法在简化模型大小方面取得了一定进展,同时保持着较高的准确率,但神经网络模型在缩小模型以及提高准确率方面仍有很大的提升空间。此外,大多数的研究结果来源于理想的图片和环境,未考虑模型在复杂环境下的性能,其鲁棒性难以保证,也有部分研究在实际环境下对模型进行检测,但准确率较低。因此,要想在实际生产中使用,上述研究还存在一定距离。
综上所述,在近期识别番茄病害的研究工作中,人们考虑了准确率、模型大小以及鲁棒性等特性,但没有实现这些性能的综合平衡。本研究拟采用正形机制对病害图片进行处理,结合Fire模块的优点和注意力机制 [17] 的特性构建轻量级网络模型GKFENet,识别常见的番茄病害类别,以期实现准确率、模型大小、识别速度以及鲁棒性的综合平衡,可以更好地在实际环境中指导农业生产。
1 材料与方法
1.1 数据集
本研究模型采用的数据集来自大型公开数据库Plant Village [18] ,该数据库共收集了18 160 张感染病害的番茄叶片图片。综合考虑番茄种植过程中病害的发病率以及研究适用性等因素,从Plant Village数据库中选取感染早疫病、晚疫病、叶霉病、花叶病、斑枯病、细菌性斑点病、叶螨病的叶片与健康叶片共8种番茄叶片作为本次研究的数据集。下面对这8种番茄叶片的纹理特征图像以及病害特征进行描述 [19-20] 。
早疫病:感病初期叶片出现水渍状暗褐色病斑,呈离散状分布,扩大后近圆形,有同心轮纹,边缘多具浅绿色或黄色晕环。严重时,多个病斑连成不规则形大斑,导致叶片枯萎,当环境潮湿时,病斑处还会长出黑霉。
健康:番茄叶片颜色质地均匀,为深绿色或者浅绿色,无大小病斑,无残缺,无孔洞,无扭曲,无枯萎,无生理性卷叶,无子叶上举等异常症状。
晚疫病:葉片发病初期出现暗绿色水渍状不规则病斑,病健交界处不明显,扩大后变为褐色,干燥时呈绿褐色,后变暗褐色直至枯萎。湿度大时叶片背面出现白色霉层,多从植株下部叶尖或叶缘开始发病,然后逐渐向上部叶片蔓延。
叶霉病:叶片染病后出现椭圆形或不规则淡黄色病斑,叶片背面长出灰褐色至黑褐色的绒状霉层,条件适宜时,染病叶片正面也长出霉层,一般中、下部叶片先发病,然后逐渐向上部叶片蔓延,病害严重时病斑连片,叶片逐渐卷曲、干枯。
花叶病:叶片染病后会出现黄绿相间或浓绿与淡绿相间斑驳,亦或是颜色深浅分布不均匀的绿色病斑,叶片外形变得细长且小,叶片增厚,且略有皱缩扭曲。
斑枯病:染病后,叶片正面、背面均出现圆形或近圆形的病斑,呈现大量凸起的小黑点,病斑周围区域泛黄,叶片边缘的发病部位会发生微卷曲,严重时形成大的枯斑,病部组织坏死穿孔,导致叶片干枯脱落。
细菌性斑点病:染病后,叶片出现大量褐色病斑,呈聚集状态,病斑周围的过渡区呈现黄褐色,发病后期病斑枯萎,形成孔洞。
叶螨病:叶螨即红蜘蛛,受损害的叶片部位会由于水分缺失而变为白色,叶片表面呈现大量白色病斑,叶片卷曲。
1.2 图片的正形处理
Plant Village数据库中每张番茄图像只有一张叶片,每张叶片只患一种疾病,图像背景简单,但叶片在图像中的位置不固定,且叶片的朝向是任意的。为了使叶片朝向统一,本研究提出了正形机制,该机制旨在将所有叶片的方向统一为叶尖朝上,叶柄朝下,使得叶片尽可能处于图片的正中位置,保证叶片与图片中线的偏离角度范围为-5°~ 5°。通过正形机制对图像进行处理,有利于卷积神经网络提取到更多、更细致的病害特征,进而提高神经网络模型的学习效率,增强稳定性。其工作流程如图1所示,具体步骤为:第一,获取病害图片;第二,对图片进行灰度化处理;第三,利用高斯滤波降低图片噪声;第四,利用多级边缘检测算法-Canny边缘检测算子 [21] 提取叶片的边缘特征;第五,绘制最小外接多边形,获得图片旋转角度( θ );第六,利用旋转角度( θ )对图片进行仿射校正。
本研究选取11 250 张图像,筛除朝向正确的图片,剩下需要进行正形机制处理的图像共有7 568 张,图2为部分叶片经过正形处理后的结果。此外,数据集中各类图像数量分布的不均衡,往往会对模型训练产生极大影响,甚至产生过拟合的现象。为了缓解图片数量不均衡的问题,以8种番茄叶片样本的平均值为基准,采用随机复制的方式对数据量较少的早疫病、叶霉病和花叶病进行数据扩充 [22] ,最终得到的图像样本共13 118 张,数据集具体信息如表1所示。
1.3 病害识别模型设计
1.3.1 模型的构建 本研究构建的轻量级网络模型GKFENet的结构如图3显示,该模型包括全局特征提取子网络GFE-Net和关键特征提取子模块KFE-Block 2个部分,GFE-Net通过一系列卷积池化操作,对输入图片的颜色、纹理和形状等全局特征进行提取,获取图片的整体属性,输出多个特征图。KFE-Block将这些包含全局特征的特征图进行池化压缩,得到通道维度的信息描述符,捕获该通道描述符之间的非线性相互作用关系,根据关键程度为每个特征通道分配权重,最后将该权重作用在输入的特征图上,从而提升关键特征的表达并抑制不相关特征,实现对关键特征的精准提取。
1.3.2 组成模块
1.3.2.1 全局特征提取子网络GFE-Net 原SqueezeNet [23] 网络模型中包含8个Fire模块,网络层数和参数量均较多,运算时间长。综合考虑8种番茄病害图片数量的适合度,同时避免过拟合,将SqueezeNet中的Fire3、Fire6、Fire8和Fire9这4个模块删除,利用剩余的模块构建GFE-Net子网络。GFE-Net子网络由4个Fire模块、2个卷积层、3个池化层、1个全局平均池化层、1个Dropout层和1个Softmax层组成,表2为构建的GFE-Net子网络的具体参数,其中Fire模块重新排序命名。每个Fire模块包括Squeeze层和Expand层,每层仅由1× 1或3× 3大小的卷积核组成,与传统的卷积层相比,该方法将网络模型的参数量减少了90%,其结构如图4显示。2个卷积层分别处在GFE-Net子网络的前端和后端,能够有效提取到图像基本特征和高层语义信息。3个最大池化层能够提取出低分辨率、强语义信息的特征图。用全局平均池化层代替全连接层,可以有效减少网络模型的计算复杂度和参数量,从而提高模型训练速度。Dropout层的引入能够有效防止过拟合。利用Softmax函数计算出每个类别的概率,输出预测结果。
1.3.2.2 关键特征提取子模块KFE-Block 本研究引入关键特征提取子模块,实现与全局网络模块的有效结合,同时能够对特征的重要程度进行评估,获取权重值,强化病害关键特征的表达。结合注意力机制的KFE-Block包括1个全局平均池化层、2个全连接层、2个激活函数和1个矩阵乘法操作,该模块提取关键特征的过程如下:
步骤1:获取通道描述符。从GFE-Net子网络卷积层输出的特征图维度为[ H , W , C ], H、W、C 表示特征图的长、宽、通道数,将其输入到KFE-Block中,首先经过全局平均池化层,对大小为 H × W 的特征图上的所有值进行求和取平均值,每个通道的输出值用 gc 表示,运算公式如下:
gc= 1 H×W Hi=1 Wj=1 uc(i,j) (1)
其中, H、W、C 表示特征图的长、宽、通道数; i 、 j 表示特征图上像素的位置索引; uc(i,j) 表示特征图上的值; gc 为每个通道的输出值。 C 个通道的总输出值为 G ,则 G =[ g1 , g2 ,…, gc ]。
步驟2:降维,获取通道间非线性关系。将前面获得的总输出值 G 先经过全连接层1,该层通过缩放因子 r 将通道数从 C 降低到 C/r ,减少计算量。然后再利用激活函数ReLU获取通道之间的非线性关系。运算公式如下:
R =max(WT1× G ,0)(2)
其中,W1表示全连接层1的权重参数矩阵,维度为( C / r )× C ;T表示转置; G 为特征图经过全局平均池化的结果,维度为[1,1, C ]; R 为输出值,维度为[1,1, C/r ]; C 为通道数; r 为缩放因子。
步骤3:升维,获取关键值。将上一步获得的输出 R 经过全连接层2,此操作将通道数恢复到原始数量。然后通过Sigmoid函数进一步捕获通道间的非线性关系后进行评估,输出各通道的关键度值,其值记为 K_V ,运算公式如下:
K_V =11+exp(-WT2× R )(3)
其中,W2表示全连接层2的权重参数矩阵,维度为 C ×( C / r );T表示转置; R 为步骤2的输出值; K_V 表示关键度值,为包含 C 个数值的标量,且[ k_v1 , k_v2 ,..., k_vc ]的数值大小代表对应通道关键程度的高低。
步骤4:关键特征提取。将获取的关键值逐通道加权到先前的特征图上,即将每个特征图[ H , W ,1],[ H , W ,2],...,[ H , W , C ]分别与[ k_v1 , k_v2 ,..., k_vc ]相乘,运算公式如下:
xc = k_vc×uc (4)
其中, uc 为特征图上的值; k_vc 为 C 通道对应的关键度值; xc 为每个通道的输出值。 X 为 C 个通道输出的总特征图,与输入维度一致,但此时特征图上的值都已被重新标定,即关键特征的特征值变得更大,无关的特征变得更小甚至被抑制,从而实现关键特征的提取。图5为KFE-Block子模块的结构。
1.4 模型训练
1.4.1 试验参数设置 本研究在服务器上的试验配置环境如下:计算机操作系统Window10,搭载处理器Intel Xeon E5-2620,内存64 G,显卡NVIDIA GTX 1080Ti,显存11 G。采用Tensorflow2.0深度学习框架,将Python3.6作为编程语言。
将预处理后的数据集随机划分为训练集、验证集和测试集,这3部分的图像数量比例为8∶ 1∶ 1,最终形成10 500 张训练集图像,1 300 张验证集图像,1 318 张测试集图像。用随机划分后的样本数据集对不同分类模型进行训练,得到各模型的性能评估结果。
在番茄叶片病害识别模型的训练过程中,输入图像大小设定为256× 256,选用优化速度较快的自适应矩阵估计算法(Adam)优化网络模型,其初始学习率设置为0.000 5 ,并采用多分类对数函数作为损失函数。每组试验反复进行10次,每次迭代100次,试验中训练集和验证集的批次大小均设置为64,测试集的批次大小为128,关键特征提取子模块中的缩放因子 r 设置为8。同时,为了防止过拟合,设置正则化系数为0.000 5 。
试验选用的评价指标有3个,分别为准确率、模型大小和识别速度。准确率定义为被正确分类的病害图像数量与总病害图像数量之比。模型大小与参数量有关,在训练过程中使用Summary函数记录网络模型的参数量。识别速度为进行单张图片测试时所需的时间。
1.4.2 试验方案设计 为了更全面地验证正形机制的作用以及GKFENet模型的性能,选取Bayes、KNN、LeNet、MobileNet、SqueezeNet模型作为对比模型。其中,MobileNet模型直接从Keras官方应用网站(Keras Applications)下载,其他分类模型均在本研究搭建的试验环境中进行代码编写。试验方案设计如下:
步骤1:准备2个数据集,将包含任意朝向叶片的原始数据集标志为Data1,经过正形机制处理后的数据集标志为Data2,比较4种神经网络模型(LeNet、MobileNet、SqueezeNet、GKFENet)在2种数据集上的准确率和鲁棒性,验证正形机制操作处理后的数据集对模型性能的影响。
步骤2:确定模型中所包含的Fire模块数量,并对比模型加入关键特征提取模块前后各性能指标的变化情况,验证该模块加入的必要性。
步骤3:将GKFENet模型与其他模型进行对比,从准确率、模型大小、识别速度、鲁棒性以及稳定性等多个维度进行试验,验证所提出模型的综合性能。
2 结果与分析
2.1 正形机制对不同模型识别性能的影响
图6展示了不同分类模型在2种数据集上得到的试验结果,可以看出,与Data1数据集相比,LeNet、MobileNet、SqueezeNet、GKFENet模型在Data2数据集上表現出更优的性能,且各模型的准确率均提升了1%左右。这可能是因为卷积神经网络具备学习能力,在训练的过程中可以根据损失函数不断更新参数,而朝向统一的图片能够进一步加深网络模型的“理解和记忆”,有助于模型快速、细致地学习到目标特征,得到更优的一组权重参数,从而使模型获得更高的准确率。
为了进一步探究正形机制对模型鲁棒性的影响,分别在Data1、Data2数据集上添加同等的高斯噪声。图7显示,在2个数据集中添加高斯噪声后,各个模型的准确率均出现不同程度的下降,每个模型在Data1数据集上的准确率下降幅度均高于在Data2数据集上的下降幅度。不难分析出,由于数据集经过正形机制处理,几乎所有叶片都位于图片的中心位置,而病害特征也会局限在这个区域内,因此根据这些同向的叶片,神经网络模型将提取到更多相关的、重叠的特征,可以在一定程度上缓解噪声环境的干扰。综上可以得出,对数据进行正形机制处理,有助于提高模型的准确率和鲁棒性。因此,后续研究均采用Data2数据集进行试验。
2.2 GKFENet模型的综合性能
2.2.1 Fire模块个数对模型的影响 结合本研究所采用数据集中的图片数量,为了防止过拟合,相应删减了原SqueezeNet网络模型中的Fire模块。为了确定最佳的Fire模块数量,分别将含有2个、4个和6个Fire模块所对应的GKFENet模型在Data2数据集上进行试验。表3显示,3种模型识别单张图片所用的时间差距极其微小,说明三者检测速度相当。当模型中的Fire模块个数为2时,此时占用内存最少,准确率也最低。与Fire模块个数为2时的模型相比,Fire模块个数为4时,模型大小仅增加0.40 MB,同时准确率增加2个百分点以上。与Fire模块个数为4时的模型相比,Fire模块个数为6时,模型准确率几乎没有增大,但模型大小却增加了0.48 MB。通过上述结果不难分析出,Fire模块个数过多不仅没有明显提升准确率,还可能增加存储负担;若数量过少,虽占用内存较少,但不利于对特征进行完全、细致的提取,从而使得准确率较低。因此,为了保证设计的模型在准确率、占用内存方面均具备较好的表现,最终在模型中保留4个Fire模块,此时GKFENet模型的综合性能更佳。
2.2.2 关键特征提取模块对模型的影响 为了验证关键特征提取模块对网络模型性能的影响,在Data2数据集上对GKFENet模型和去掉KFE-Block模块的GKFENet模型进行训练,将后者命名为模型Ⅰ。结果(表4)表明,与GKFENet模型相比,模型Ⅰ准确率略高,模型略小,识别速度略快,但二者均处于同一数量级,差别甚微,因此都能满足小型化、快速、精准识别的要求。然而,当在Data2的测试集中添加不同级别的高斯噪声时,模型Ⅰ的准确率骤降,且下降的幅度分别高达21.76个百分点、32.68个百分点,几乎很难精准地识别病害,而GKFENet模型的准确率降低幅度均不超过20.00%,仍能保持78.00%以上的识别准确率。这是因为模型中包含的关键特征提取模块能够抓住主要的、关键的特征,忽略其他不重要的特征或者干扰源,从而具有较好的鲁棒性。在评估模型性能时,准确率、模型大小固然重要,但鲁棒性同样必不可少,否则模型仅仅是在实验室中的识别效果好,一旦应用到复杂的实际农业环境中,性能将大打折扣,无法满足现实需求。因此,从准确率、模型大小和鲁棒性3个维度综合考虑,在本研究提出的GKFENet模型中加入KFE-Block模块是很有必要的。
2.2.3 模型的准确率和模型大小 本研究基于数据集Data2,比较3种分类模型对番茄8种病害图像识别的准确率、模型大小和识别单张图片所用时间。表5显示,GKFENet模型的准确率为97.90%,远远高于传统分类算法模型Bayes和KNN;与经典神经网络模型LeNet相比,虽然单张图片识别耗时略久,但在准确率和模型大小2个方面表现较好。GKFENet模型与2种常见的轻量级网络模型MobileNet、SqueezeNet相比,单张图片识别耗时相当,但GKFENet模型仅占2.64 MB,内存需求更小,且准确率更高,识别性能更好。在番茄识别的实际应用中,准确率和模型大小是更为重要的性能指标,因此,综合考虑模型的性能和可移植性,GKFENet网络模型具有一定的应用优势。
2.2.4 模型的稳定性和鲁棒性 本研究分析了LeNet、MobileNet、SqueezeNet、GKFENet这4种神经网络模型在100轮迭代过程中的准确率、损失函数变化情况,其中LeNet模型只迭代了50轮,因为50轮以后出现验证集准确率上升,而损失值不降反增的现象,模型发生过拟合。图8显示,MobileNet模型和SqueezeNet模型在训练初期,均能快速达到较高的准确率,但在迭代过程中发生明显抖动,且抖动持续时间较长,模型稳定性较低。LeNet模型虽然上升比较平稳,但准确率明显低于其他3种模型。对于GKFENet模型,虽然初始迭代时准确率上升相对缓慢,也有几次抖动,但随着迭代次数的增加,模型准确率呈平稳上升趋势,在整个后期训练中只有微小的浮动,且最终的准确率高于其他3种模型,损失值最小,因此GKFENet模型具有较好的稳定性。
图9显示,随着高斯噪声等级的增加,各个模型的准确率都有所降低,除GKFENet模型外,LeNet模型、MobileNet模型、SqueezeNet模型的准确率均出现大幅骤降,当噪声等级增加到0.01时,这3个模型的准确率均低于61.00%,此时这些模型无法正常完成病害识别任务。而对于GKFENet模型,在同样的强噪声干扰下,准确率仍能达到78.61%,可以准确识别出番茄病害数据集约3/4的图片。说明,GKFENet模型在噪声干扰的环境中,仍然具备良好的识别性能,准确率虽有降低但在可接受范围内,具有较好的鲁棒性。
分析GKFENet模型在数据集Data2测试集上的混淆矩阵,图10横向数据表示标签值,纵向数据表示预测值,对角线上的深色区域内数据表示预测正确的个数。0~ 7分别表示番茄早疫病、健康、晚疫病、叶霉病、花叶病、斑枯病、细菌性斑点病、叶螨病,對应的预测准确率分别为96.58%、99.34%、99.45%、98.65%、99.34%、99.44%、98.98%、99.38%。本研究构建模型对早疫病的识别能力稍弱,对其他7类病害的识别准确率均在98.00%以上。这是因为早疫病图片本身数量少,并且图片中展现的病害严重程度不同,不利于网络学习,所以准确率略低。
3 结 论
为了满足精准农业的发展需求 [24-26] ,本研究基于番茄病害的现有研究成果,提出一种自适应特征提取的番茄病害识别方法。根据2种数据集以及GKFENet、Bayes、KNN、LeNet、SqueezeNet、MobileNet这6个模型设计对比试验,分析试验结果,得出以下结论:
第一,经过正形处理后,4种网络模型的准确率提高1%左右,且鲁棒性增强,说明正形机制与神经网络的学习能力相配合,能起到正向增强作用。
第二,GKFENet将全局特征提取和关键特征提取2个模块有效结合,在获取基础语义信息的基础上进一步筛选出重要的特征,并弱化不相关的特征。这种自适应提取病害特征的方式能够更精准地提取到关键特征,实现了对8种番茄叶片病害的精确识别,与现有的一些识别方法相比,该方法具有明显优势。
在前期工作的基础上,结合精准农业的发展蓝图以及现有的技术背景,本研究构建的模型在计算复杂度和参数量方面还可进一步优化、提升,使其能够在移动端上快速精准地识别出病害类别,从而实现病害的早期评估和预警,减少作物损失。
参考文献:
[1] TM P, PRANATHI A, SAIASHRITHA K, et al. Tomato leaf disease detection using convolutional neural networks: 2018 International conference on contemporary computing (IC3) [C]. Piscataway: IEEE Press, 2018.
[2] MIM T, SHEIKH M H, SHAMPA R A, et al. Leaves diseases detection of tomato using image processing: 2019 International conference on system modeling and advancement in research trends (SMART) [C]. Piscataway: IEEE Press, 2019.
[3] MOKHTAR U, ALI M A S, HASSANIEN A E, et al. Identifying two of tomatoes leaf viruses using support vector machine[M]. New Delhi: Springer Press, 2015:771-782.
[4] 柴 洋,王向东. 基于图像处理的温室大棚中番茄的病害识别[J]. 自动化技术与应用, 2013, 32(9): 83-89.
[5] JIANG D, LI F, YANG Y, et al. A tomato leaf diseases classification method based on deep learning: 2020 Chinese control and decision conference (CCDC) [C]. Piscataway: IEEE Press, 2020.
[6] RANGARAJAN A K, PURUSHOTHAMAN R, RAMESH A. Tomato crop disease classification using pre-trained deep learning algorithm[J]. Procedia Computer Science, 2018, 133: 1040-1047.
[7] 王艷玲,张宏立,刘庆飞,等. 基于迁移学习的番茄叶片病害图像分类[J]. 中国农业大学学报, 2019, 24(6): 124-130.
[8] JIA S, JIA P, HU S, et al. Automatic detection of tomato diseases and pests based on leaf images: 2017 Chinese automation congress (CAC) [C]. Piscataway: IEEE Press, 2017.
[9] WU Q, CHEN Y, MENG J. DCGAN based data augmentation for tomato leaf disease identification[J]. IEEE Access, 2020,8: 98716-98728.
[10] 胡志伟,杨 华,黄济民,等. 基于注意力残差机制的细粒度番茄病害识别[J]. 华南农业大学学报, 2019, 40(6): 124-132.
[11] 李晓振,徐 岩,吴作宏,等. 基于注意力神经网络的番茄叶部病害识别系统[J]. 江苏农业学报, 2020, 36(3): 561-568.
[12] MEERADEVI A K, RANJANA V, MUNDADA M R, et al. Design and development of efficient techniques for leaf disease detection using deep convolutional neural networks: 2020 IEEE international conference on distributed computing vlsi electrical circuits and robotics (DISCOVER) [C]. Piscataway: IEEE Press, 2020.
[13] 方晨晨,石繁槐. 基于改进深度残差网络的番茄病害图像识别[J]. 计算机应用, 2020, 40(增刊1): 203-208.
[14] 郭小清,范涛杰,舒 欣. 基于改进Multi-Scale AlexNet的番茄叶部病害图像识别[J]. 农业工程学报, 2019, 35(13): 162-169.
[15] ELHASSOUNY A, SMARANDACHE F. Smart mobile application to recognize tomato leaf diseases using convolutional neural networks: 2019 International conference of computer science and renewable energies (ICCSRE) [C]. Piscataway: IEEE Press, 2019.
[16] AGARWAL M, GUPTA S K, BISWAS K K. Development of efficient CNN model for tomato crop disease identification [J]. Sustainable Computing: Informatics and Systems, 2020, 28(1):100407.
[17] HU J, SHEN L, SUN G, et al. Squeeze-and-excitation networks: IEEE conference on computer vision and pattern recognition[C]. Piscataway: IEEE Press, 2017.
[18] HUGHES D P, SALATHE M. An open access repository of images on plant health to enable the development of mobile disease diagnostics[EB/OL]. (2016-04-04)[2021-09-20]. https://arxiv.53yu.com/ftp/arxiv/papers/1511/1511.08060.
[19] 刘子记,杜公福,牛 玉,等. 番茄主要病害的发生与防治技术[J]. 长江蔬菜, 2019(19): 59-62.
[20] 刘鹏鹏. 基于深度学习的番茄叶面型病虫害识别研究[D]. 南昌:南昌大学, 2020.
[21] CANNY J. A computational approach to edge detection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986, 8(6): 679-698.
[22] 宋余慶,谢 熹,刘 哲,等. 基于多层EESP深度学习模型的农作物病虫害识别方法[J]. 农业机械学报, 2020, 51(8): 196-202.
[23] IANDOLA F N, HAN S, MOSKEWICZ M W, et al. SqueezeNet:Alexnet-level accuracy with 50× fewer parameters and <0.5 MB model size[EB/OL]. (2016-11-04)[2021-09-20].https://arxiv.org/abs/1602.07360v4.
[24] 宋永嘉,刘 宾,魏暄云,等. 大数据时代无线传感技术在精准农业中的应用进展[J].江苏农业科学,2021,49(8):31-37.
[25] 李仁路,万书勤,康跃虎,等. 基于微灌工程设计成果数据的农田电子地图构建方法[J].排灌机械工程学报,2020,38(9):939-944.
[26] 林 娜,陈 宏,赵 健,等. 轻小型无人机遥感在精准农业中的应用及展望[J].江苏农业科学,2020,48(20):43-48.
(责任编辑:王 妮)
收稿日期:2021-09-20
基金项目:国家自然科学基金青年基金项目(61601076);大连市科技创新基金项目(2020JJ26SN058)
作者简介:胡玲艳(1978-),女,河北沧州人,博士,副教授,主要从事智慧农业、作物动态生长监测研究。(E-mail)hulingyan@dlu.edu.cn
通讯作者:汪祖民,(E-mail)wangzumin@dlu.edu.cn