基于深度学习的玉米病虫害分类研究

2022-11-10 12:22林祥锐郭春阳
智能物联技术 2022年2期
关键词:池化卷积尺寸

张 立,林祥锐,张 钰,郭春阳

(广东白云学院,广东 广州 510450)

0 引言

近年来,随着人工智能技术的发展,机器学习和深度学习模型广泛应用在工业生产和生活中。如在农业生产中,应用“Inception V3”算法建立玉米病虫害识别模型,训练识别精度达到93.7%,测试精度达到92.3%,通过HTTP协议将模型部署在云端,完成对图片的识别[1];通过无人机对玉米农田的拍摄,将图片分析结果转化为指令传送至无人小车,对玉米叶片进行农药喷洒[2];通过爬虫构建玉米病虫害数据集,基于深度学习网络模型RTA-NET建立玉米病虫害分类模型,实现对玉米生长状态的实时监控[3];为了避免深度学习模型在编码过程中丢失语义信息,提出基于深度学习的CornDisNet网络分割模型,在精度和召回率上都有较大的提升[4];在工业生产中,通过改进ResNet-50模型和迁移学习实现对石油管道焊缝缺陷图片的分类[5];通过迁移学习实现热轧钢带的缺陷分类,为工业生产提供可行的解决方案[6]。

1 深度学习基础理论

卷积神经网络通过设定判定规则实现对数据的分类处理、目标标定,主要包含:数据增强、卷积运算、激活函数、池化运算、反向传播等模块。

1.1 数据增强

深度学习是基于大量数据提取语义特征的模型,数据输入到模型中,经过一系列的卷积运算提取特征,再由反向传播算法优化参数,最后提取用于分类的主要特征。当数据量较少难以获得大量的特征时,通过图像的增强来获得倍增的数据集就显得格外重要。数据增强的主要方式包括随机裁剪、缩放、滤波、旋转、弹性变换等。数据增强能够扩大训练集,有利于深度学习模型对分类特征的提取,提高测试集的测试精度。

1.2 卷积运算

卷积运算类似滤波处理,将带有权重的卷积核与图像数据矩阵相乘,由左到右、由上到下,即可得到一幅新图像。经过卷积运算之后,图像的尺寸会缩减,影响特征提取。为了尽可能保留图像边缘信息,卷积运算通常需要进行边缘填充,选择padding=“same”;卷积滑动的步长也会影响图像尺寸的大小,通常设置步长为1或2。卷积后图像尺寸如公式(1)所示。

式中:N为卷积后特征的尺寸,W为输入图像尺寸,F为卷积核尺寸,P为padding,S为步长。

1.3 池化运算

图像相邻位置的像素具有较强的关联,对图像隔行抽取样点并不会影响图像的真实表达。池化是对一定区域内的数据进行采样,不仅可以大幅减少计算量,还可以增大卷积核的感受野,保持对特征的旋转不变性。池化函数的主要形式包括均值池化(mean pooling)、随机池化、最大池化(max pooling)。其中均值池化可以减少均值方差并保留图像的背景信息;最大池化可以减少估计均值的偏移,保留图像的纹理信息。实验中采用最大池化,不仅减少计算量,同时还能保留用于分类的最明显特征。

1.4 反向传播

反向传播是深度学习训练中常用的优化算法,其作用是使目标值与训练值尽可能接近,减小误差。反向传播的理论基础是链式法则,对神经网络的前向传播结果进行链式求导,不断优化前向传播的结果和权重参数。链式法则以及优化过程如公式(2)和(3)所示。

式中:f(x)=h(g(x)),h(x)为映射函数,g(x)为前向传播函数。

式中:L(θ)为损失函数,li(θ)为单个样本损失函数,θ为卷积核参数。

经过公式(2)使得总的损失函数达到最小,即θ*=argminL(θ)。参数即为整个网络所优化的目标。

2 实验过程及结果

实验中的玉米生长状态来自于开源数据。实验数据如图1所示,四种生长状态分别用类别0,1,2和3代替。

图1 玉米生长状态Figure 1 Growth status of corn

玉米病虫害特征明显,因此卷积神经网络的深度较浅,实验中使用四个卷积层提取玉米病虫害特征和三个全连接层进行分类。模型结构如图2所示。

图2 模型结构Figure 2 Model structure

原始数据集数量分别为360,320,160和380,增强后的数据集数量分别为440,360,210和450,训练集和测试集比例为4:1。随机打乱图片顺序增加模型的稳定性,再输入模型中,训练30个epoch。训练集和测试集测试分类精度结果图3a)所示。为了探究不同尺寸的数据集对实验结果的影响,采用控制变量法进行对照实验,如图3 b)所示。可以看出,随着训练的进行,分类精度逐渐增加,在20epoch后精度稳定。

图3 分类精度变化Figure 3 Classification accuracy changesa)Test classification accuracy of training and test sets b)Classification accuracy of three dimensions

三种图片在验证集中的最大精度、最小精度和平均精度,如表1所示。

表1 三种尺寸图片精度对比Table 1 Accuracy comparison of images of three sizes

验证实际模型的识别效果,分别准备未参加训练的四种数据进行测试,分类结果以及预测矩阵如图4所示,实验分类正确。

图4 分类结果Figure 4 Classification results

3 结语

本文对四种玉米病虫害叶片进行数据增强,并搭建7层卷积神经网络,得到平均分类精度为93.7%,为玉米叶片病虫害的识别提供了可靠的保障。对比三种不同尺寸的数据集,分别为100×100,150×150和256×256。实验结果表明,保证相同结构、参数、深度的模型,图片尺寸越小,在验证集上效果越好、精度越高,尺寸最小的图片平均精度比最大尺寸图片的精度高出约7%。因此在模型不变的前提下,选择较小数据集可以得到较高的精度,同时模型训练所需要的时间大幅减少。卷积神经网络依赖于对特征进行分类,在不增加数据集规模时,应用VGGNet-16迁移模型可以进一步增加模型精度。

猜你喜欢
池化卷积尺寸
基于高斯函数的池化算法
卷积神经网络中的自适应加权池化
CIIE Shows Positive Energy of Chinese Economy
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络的分析与设计
从滤波器理解卷积
基于卷积神经网络和池化算法的表情识别研究
用于手写汉字识别的文本分割方法
基于傅里叶域卷积表示的目标跟踪算法
D90:全尺寸硬派SUV