基于改进ResNet34的玉米病害分类研究

2023-09-15 13:05涵,唐友,辛鹏,杨
无线互联科技 2023年13期
关键词:注意力卷积病害

李 涵,唐 友,辛 鹏,杨 牧

(1.吉林化工学院,吉林 吉林 132022;2.吉林农业科技学院,吉林 吉林 132101;3.一汽东机工减振器有限公司,吉林 长春 130001)

0 引言

玉米是全球重要的农作物之一,其种植面积和产量在全球都排名前列。然而,玉米病害的发生给玉米生产带来了很大威胁。从叶部、茎部、穗部等不同部位的病菌的入侵,到玉米生长过程中的气候因素,都可能导致玉米病害的发生,并直接影响着玉米产量和质量。为了有效预防和治疗玉米病害,必须迅速准确地对其进行识别和分类。传统玉米病害分类方法大多依赖专业人员的经验判断,效率低下且容易造成误判。另外,由于不同玉米病害外形相似,且它们的区分度并不高。因此,需要聚焦于区分不同种类病害的关键特征。随着深度学习技术的不断发展和应用,深度学习已经被广泛应用于计算机视觉领域[1],在图像分类中取得了巨大的成功。基于深度学习的玉米病害分类成了一种新的解决方案,它利用计算机强大的自我学习、自我优化的能力,自动从玉米病害图像中学习、判断和分类,可以提高诊断的准确性和效率。

本文提出了一种基于深度学习的玉米病害分类方法。该方法使用深度卷积神经网络对玉米病害进行分类,并采用一种注意力机制来增强网络的性能[2]。

1 相关技术

1.1 深度学习

深度学习是机器学习的一个重要分支,也是人工智能领域的重要组成部分。深度学习的优势在于其具备学习和提取数据特征的能力,通过建立多层神经网络模型,并使用大量数据进行训练。在计算机视觉、自然语言处理、语音识别等领域,深度学习已经具有广泛的应用,例如:在图像识别方面,深度学习技术通过层层神经元相互协作,可以完成高效、准确的图像分类和目标检测任务。

1.2 卷积神经网络

卷积神经网络通常由卷积层、池化层、激活函数、全连接层等[3]组成。其中,卷积层用于提取特征,池化层用于降维和避免过拟合,激活函数用于引入非线性和增加网络表达能力,全连接层则用于输出最终的类别概率。

卷积神经网络(CNN)作为深度学习中最重要的一种神经网络,已经在图像处理领域取得了令人瞩目的成功[4]。CNN的网络结构简单、有效,具有可共享权重和局部感知域等特点,可以大幅提升训练效率和计算速度。在处理高维图像数据时,卷积神经网络展现出非常强的特征提取和分类能力。利用基于CNN的深度学习算法,可以在图像分类、目标检测、图像识别等领域实现更加准确和高效的效果。

1.3 数据增强

数据增强是一种通过对原始数据集进行多样性处理来增加样本数量和多样性的技术,以扩大训练集规模、提高模型鲁棒性、防止过拟合等目的。在深度学习领域,常常使用一些数据增强技术,如旋转、翻转、裁剪、缩放、加噪声、色彩变换等,以生成更多、更多样化的训练数据,从而提高模型的泛化能力和性能。数据增强是一种常用的数据预处理技术,被广泛应用于计算机视觉、语音识别、自然语言处理等领域中。

1.4 CBAM注意力模块

CBAM是一种常用于图像分类任务的注意力机制,它在卷积神经网络中常常被作为一种优化方式使用。CBAM模块可以通过对输入图像和特征通道分别进行注意力加权来提升模型的性能。主要分为两个部分:通道注意力模块(CAM)和空间注意力模块(SAM)。结构如图1所示。

图1 CBAM注意力模块

CAM部分通常包括一个全局平均池化层,用来得到每个特征通道的全局统计量,经过两个全连接层来得到每个特征通道的重要性分数。使用sigmoid函数对其进行归一化处理,作为每个通道的注意力权重,用来对通道特征进行加权,使得网络更加关注有利于分类的通道特征,提高分类的准确率。

SAM部分通常包括一个卷积层和一个最大池化层,通过这两个步骤来获取输入特征图每个空间区域像素的重要性。将两个模块的结果相乘,得到特征图,使得网络更加关注重要的空间位置特征,提高网络的泛化能力和精度。

总之,CBAM模块适用于目标检测、图像分类等任务,它可以使模型更加关注关键的特征区域,提升模型的性能。

1.5 ResNet34模型

ResNet34是由微软公司提出的一种深度卷积神经网络,常被应用于图像分类、目标检测和语义分割等视觉任务中。ResNet34是ResNet系列中的一个子系列,相比于更深层次的ResNet50和ResNet101,其网络结构简洁,计算速度快,同时在性能上也表现出色。

ResNet34的主要特点在于使用残差学习(Residual Learning)机制。在深度卷积神经网络的训练中,梯度消失是一个很严重的问题,而ResNet则通过一种特殊的残差模块,堆叠多层Residual Block来学习非常深的网络,并避免了这一问题。Residual Block包含2个或3个卷积层,其中第一个卷积层的卷积核大小为1×1,中间层的卷积核大小为3×3,最后一个卷积层的卷积核大小也是1×1,而且在该结构中还包含了跨层的连接,以便更容易地训练出更深的网络。ResNet34共有32个Residual Block,其中前16个Block包含8个基础卷积层,后16个Block包含16个基础卷积层,使得网络能够高效地提取图像特征,从而在图像分类任务中取得了优秀的性能表现。

1.6 CBAM_ResNet34模型结构

本文在ResNet34模型的基础上,在平均池化层的前面加入了CBAM注意力模块,可以对卷积层进行特征加权,有助于保留更多的信息,以增强对重要信息的感受性。它还可以优化ResNet34模型的空间特征学习能力,进而提高图像分类的准确性。模型结构如图2所示。

图2 CBAM_ResNet34模型

2 实验和结果

2.1 实验环境

本文的实验基于Linux系统,使用了两个4 110处理器和NVIDIA RTX 3090 GPU平台。在实验过程中,本文采用了PyTorch框架来构建和训练深度学习模型,同时进行了一系列实验验证和性能评估。

2.2 实验数据

本文的数据集是一个公开的玉米病害数据集,包含8种类别,总计3 534张图片,通过调整图片尺寸、色调、裁剪、旋转、边缘填充5种数据增强方式进行数据扩充得到17 670张图片。在使用数据集前,将数据集按照6∶2∶2的比例划分为训练集、验证集、测试集。

2.3 模型训练

本文将加入CBAM模块的ResNet34与ResNet34两个模型进行实验对比分析,同时设置相同的超参数以保证实验条件的一致性。在训练过程中,记录了模型在验证集上的准确率。实验结果表明,CBAM_ResNet34模型的验证集准确率达到88.5%,相比ResNet34提高了1.5%。这表明加入CBAM模块可以有效提高ResNet34模型的性能,使得模型在验证集上的表现更好。

2.4 模型评估

本文研究的是玉米病害分类问题,模型的评价指标包括准确率、召回率、精确率和F1-score等。为了评估模型的分类效果,首先通过对模型进行训练,选择每个模型最好的权重,然后对所划分的测试集测试模型的性能指标。实验结果如表1所示,由表可知,使用CBAM注意力模块对ResNet34进行改进,所得的分类结果表现更好,相比于ResNet34,CBAM_ResNet34在4个评价指标中均取得了更好的性能指标。CBAM_ResNet34的准确率、精确率、召回率和F1分数分别为88.1%、84.9%、84.0%和84.5%,相比ResNet34分别提高了1.1%、1.5%、1.3%和1.4%。这说明CBAM注意力模块的引入确实有助于提高玉米病害分类的性能。

表1 模型评估 单位:%

2.5 分类预测

本文采用改进后的模型来预测玉米病害的种类,为了保证模型具有良好的泛化性能和可靠性,在未经过训练的测试集图片上进行了预测,这样可以更好地模拟出实际应用中的情况。预测结果如图3所示,对一张测试集图片进行了预测,并准确地将其分类为锈病一般,预测准确率达到100%。这意味着本文的模型在未知数据集上具有较好的分类能力和泛化性能,具有较高的实用价值。

图3 分类预测

3 结语

本文利用深度学习技术对玉米病害进行了分类研究,在模型中加入了CBAM注意力模块,以帮助模型更有效地学习图片中的特征,进而提高分类准确率。玉米病害分类是一项复杂而具有挑战性的任务,在不断探索和研究的基础上,需要不断提升模型的精度和准确性。未来的研究方向将包括提高模型的鲁棒性、推广到更多的玉米病害类型、将模型应用于不同领域等。

猜你喜欢
注意力卷积病害
早春养羊需防六大病害
让注意力“飞”回来
小麦常见三种病害咋防治
基于3D-Winograd的快速卷积算法设计及FPGA实现
葡萄病害周年防治历
果树休眠期咋防病害
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
“扬眼”APP:让注意力“变现”
一种基于卷积神经网络的性别识别方法