摘 要: 准确识别农田中常见类型的玉米叶病害并及时治疗是提高玉米产量的关键,可以提高效率并降低种植成本。为了解决玉米叶病害识别精度不高、检测效率低以及在移动端设备难以部署的难题,本文提出了一种改进的名为GSW-YOLOv7 的目标检测模型。首先,设计了GS-ELAN结构优化模型颈部,降低模型的参数量。其次,将简单且无需参数的SimAM注意力机制融入网络结构中,在不增加额外参数的情况下提高检测的精度,获取更具代表性的玉米叶病害特征。最后,采用高效的Wise-IoU 损失函数以加快收敛速度,并提高模型的精度。实验结果表明,GSWYOLOv7网络模型平均精度(mAP)为85.60%,检测速度为26.79FPS,该模型在检测任务中权衡了模型的检测精度和检测速度,与YOLOv5、YOLOX等算法相比,该算法性能最好,能够快速、准确地检测常见的玉米叶病害,为农业生产提供了创新的解决方案。
关键词: 玉米叶病害;YOLOv7;目标检测;深度学习;注意力机制
中图法分类号: TP391.4 文献标识码: A 文章编号: 1000-2324(2024)04-0566-13
玉米,作为全球三大主要粮食作物之一,在农业生产中扮演着重要角色,是我国重要的粮食作物。然而,在玉米的生长过程中,叶片病害问题是影响产量和质量的主要因素之一,叶片病害会直接导致产量减少和质量下降[1]。目前,我国对玉米叶病害的识别和分类主要依赖于专业技术人员的经验判断。技术人员需要具备良好的观察技巧和丰富的经验,才能进行疾病的识别[2]。然而,这种方法需要投入大量人力物力,且严重依赖个人经验,识别准确性低、效率差。因此,为确保玉米的稳定增产,快速准确地识别常见玉米叶病害至关重要。
近年来,随着大数据分析技术和图形处理单元(GPUs)的迅速进步,计算机的计算能力得到了显著提升,深度学习技术广泛应用于多个领域,包括农业病虫害的识别[3]。在这方面的研究中,Yinglai Huang 等人[4]对传统的ResNet-50 模型进行了改进,将LeakyReLU 激活函数替代ReLU激活函数,并调整了残差块中批归一化层、激活函数和卷积层的顺序,这一改进后的网络在玉米叶病图像分类中取得了98.3%的准确率。Haoyu Wu[5]提出了一种基于VGG 和ResNet 的双通道卷积神经网络,他们成功将在验证集上对玉米叶病害类型的识别准确率提高到98.33%。Deng 等人[6]建立并测试了一种基于FPN 的Faster R-CNN高精度谷物检测模型,其平均准确率达到了99.4%。以上算法具有较高的准确度,但由于模型参数量大、大存储空间和计算消耗,这在实际应用中导致难以在嵌入式设备上部署庞大的算法模型的问题。
近年来基于深度学习的深度卷积神经网络成为研究热点,深度卷积神经网络在图像目标检测上展现出显著优势,检测方法可以归纳为两类。第一类是基于区域生成的方法,这类方法先生成一系列候选框,然后对这些候选框中的目标进行分类,代表性的模型包括RCNN[7]、Fast-RCNN[8]和Faster-RCNN[9]。这类方法在识别准确性上表现出色,错误率和漏检率都相对较低,但由于处理过程较为复杂,导致检测速度较慢,难以满足实时检测的需求。第二类是基于回归的方法,这类方法在目标定位的同时直接预测目标分类,YOLO系列网络[10-12]是该类方法的典型代表。这类方法具有识别速度快的特点,能够满足实时性的要求,并且在准确性上也接近第一类方法的水平。随着深度学习的不断发展,研究人员发现目标检测算法已经能够在高性能计算机上实现实时检测。然而,将模型部署到嵌入式设备上时,存储和计算方面依然存在问题。因此,轻量级网络在计算机视觉领域引起了广泛关注。以此为背景,Howard 等人[13]提出了MobileNetV1,这是一个轻量级的骨干网络,通过深度可分离卷积显著减少了模型参数量。Zhang 等人[14]通过改进的YOLOv4 模型进行苹果水果检测,引入了带有坐标注意模块的GhostNet 特征提取网络,以及深度卷积来重建颈部和YOLO头部结构,实现了高达95.72%的mAP,同时使得模型轻量化。Su 及其团队[15]在温室环境中采用轻量化的YOLOv3 模型,并结合轻量级网络,成功用于对番茄成熟度的分类检测,取得了97.5%的mAP。轻量化的改进往往伴随着检测精度的降低,而注意力机制可以提高检测的精度。在疾病识别领域,Li 等人[16]通过应用混合注意力Atrous SpacePyramid Pool (ASPP)对DeepLab V3+进行优化,实现了对黄瓜霜霉病和白粉病的精确分割和自动评估。Yang 等人[17]在YOLOv4 中添加了注意力模块,提高了小麦穗计数的准确性。Cui 等人[18]通过将CBAM引入到自动编码器中进行玉米叶病的分类任务,在实验室环境中从PlantVillage 识别玉米叶病,取得了99.44%的识别准确度,虽然具有较高的准确度,但是该研究只是在实验环境中进行的分类任务,不能精确反应在真实农田中的情况,相比于该研究,本文应用了比较流行的YOLO模型进行玉米叶病害的目标检测任务,并针对在真实环境下的玉米叶数据集进行实验,同时对数据集进行数据增强,而且对YOLOv7 模型采用了无参数、准确度高的SimAM 注意力,以及采取一系列更加先进的改进措施,具有更高的可靠性。上述研究表明,通过采用不同的策略优化神经网络可以进一步提高识别准确性并减少模型参数量。常见的玉米叶病主要有玉米锈病、灰斑病、枯萎病,本文主要针对这三种常见的玉米叶病进行研究。考虑到不同玉米叶病害之间微小差异,建立一个在移动终端上实现快速且准确识别常见的玉米叶病害的模型仍然是一个巨大的挑战。
为了在改进YOLOv7 目标检测模型的同时减少模型参数量并提高检测准确性和速度,本研究提出了一种改进后的YOLOv7 模型,命名为GSW-YOLOv7。该模型在保持较高性能的同时能够准确识别常见玉米叶病害,弥补了当前研究所面临的一些局限性。本文的贡献可以总结如下:
(1)在本研究中,构建了轻量级GS-ELAN结构用于优化YOLOv7 模型的颈部,减少模型参数量,使模型轻量化。
(2)为增强轻量级模型在常见玉米叶病害检测中的准确性,引入了SimAM 注意力机制到网络架构中。SimAM注意力机制在不引入额外的参数的前提下提高模型的精度。
(3)将YOLOv7 算法模型中原始的CIoU 损失函数替换为WIoU 损失函数。该方法进一步提高了YOLOv7 的边界框回归精度和检测精度。