周维 牛永真 王亚炜 李丹
摘要: 针对水稻病虫害检测精度低、速度慢、模型复杂度高、部署困难等问题,改进了YOLOv4目标检测算法,结合轻量化GhostNet网络,提出了一种基于改进的YOLOv4-GhostNet水稻病虫害识别方法:1)利用幻象模块代替普通卷积结构,替换主干特征提取网络CSPDarkNet53,构建GhostNet模块进行图像的特征提取;2)改进YOLOv4网络的加强特征提取部分PANet结构;3)结合迁移学习与YOLOv4网络训练技巧。通过试验将YOLOv4及其MobileNet系列轻量化网络与Faster-RCNN系列网络和SSD系列网络进行对比,结果表明,改进的YOLOv4-GhostNet模型平均准确率达到79.38%,检测速度可达1 s 34.51 帧,模型权重大小缩减为42.45 MB,在保持检测精度达到较高水平的同时模型参数量大幅度降低,适用于部署在计算能力不足的嵌入式设备上。
关键词: 水稻病虫害检测; GhostNet网络; YOLOv4; 轻量化; 迁移学习
中图分类号: TP391.4 文献标识码: A 文章编号: 1000-4440(2022)03-0685-11
Rice pests and diseases identification method based on improved YOLOv4-GhostNet
ZHOU Wei, NIU Yong-zhen, WANG Ya-wei, LI Dan
(College of Information and Computer Engineering, Northeast Forestry University, Harbin 150040, China)
Abstract: Aiming at the problems of low accuracy, slow speed, high model complexity and difficult deployment in rice pests and diseases detection, the YOLOv4 target detection algorithm was improved. Combined with the lightweight GhostNet network, a rice pests and diseases recognition method based on the improved YOLOv4-GhostNet was proposed. The phantom module was used to replace the ordinary convolution structure, the backbone feature extraction network CSPDarkNet53 was replaced, and the GhostNet module was constructed for image feature extraction. The PANet structure of the enhanced feature extraction part of YOLOv4 network was improved. Transfer learning was combined with YOLOv4 network training skills. YOLOv4 and its MobileNet series lightweight networks were compared with Fast-RCNN series networks and SSD series networks. The results showed that the average accuracy of the improved YOLOv4-GhostNet model was 79.38%, the detection speed was 34.51 frames per second, and the weight of the model was reduced to 42.45 MB. While maintaining high detection accuracy, the number of model parameters is greatly reduced. It is suitable for embedded devices with insufficient computing power.
Key words: rice diseases and pests detection; GhostNet network; YOLOv4; lightweight; transfer learning
水稻是中國主要粮食作物,在中国农业生产中占据重要地位。而水稻病害、虫害直接影响水稻产量及其经济效益,水稻病虫害的研究十分重要 [1-2] 。目前图像识别与机器学习方法在病虫害识别领域中广泛应用。张武等利用K-均值聚类算法和最大类间方差法分割小麦病害图像 [3] 。马媛等利用均值漂移算法监督葡萄生长状态与病虫害 [4] 。鲍文霞等釆用椭圆型度量矩阵提升SVM分类器识别水稻虫害能力 [5] 。王映龙等应用图像处理技术对水稻虫害进行识别 [6] 。Xia等利用原位检测方法检测温室条件下出现多叶重叠遮挡现象和复杂背景的胡椒叶片病害图像识别 [7] 。Ye等基于颜色在强光与非强光区域逐渐变换的原理,提出一种基于概率超像素马尔可夫网络的抗强光照作物特征方法 [8] 。以上基于机器学习的病虫害识别方法,实质上是以图片分类的方式实现,对于复杂背景的图片需要进行多种算法的处理,且各算法之间存在着特征能力描述和识别速度之间相互排斥的矛盾,提取的特征相似度较高,难以同时识别特征相差较大的病害和虫害。
随着深度学习网络的不断发展,其应用也被引入到农作物病害识别领域。Mohanty等利用AlexNet和GoogLeNet识别开放数据库PlantVillage中14种不同植物的26 种病害 [9] 。Ferentinos等利用健康和患病植物叶片图像,训练几种卷积神经网络,检测9 种不同的番茄病虫害 [10] 。房若民等使用MobileNet模型,检测10个物种,包括27个类型的农业病虫害 [11] 。燕斌等利用Inception-V3网络和ImageNet数据集实现8 种病害的识别 [12] 。杨国国等利用优化后的卷积神经网络识别复杂自然背景下茶园害虫 [13] 。
基于深度学习的方法往往需要大量数据作为模型训练基础,而农业病虫害检测数据集构建困难,缺少病虫害公共数据集,实际数据检测精度往往较低。为了提升深度学习网络的精度,往往设计网络层数更深、结构更复杂、参数量更大的神经网络,这使得模型训练时间长,模型复杂度高,部署困难。对于从事水稻病虫害研究与防治的用户而言,其设备计算资源、存储能力往往有限,研究轻量化的水稻病虫害目标检测方法十分必要。张陶宁等利用一种改进的YOLOv3-MobileNet目标检测算法,提升了模型的检测精度和运算速度 [14] 。李维刚等利用一种基于改进YOLOv4的新型室内场景目标检测算法,使平均检测精度达到83.0% [15] 。曹远杰等利用GhostNet残差结构进行4 种饮料识别,衡量指标mAP到达79.43%,参数量缩减10% [16] 。张官荣等利用面向小目标检测的轻量化YOLOv3-CSP算法,实现对原模型参数量95%的压缩 [17] 。董艺威等应用轻量化卷积神经网络 SlimNet将参数量降低32%,计算量降低50% [18] ;。刘超军等应用GhostNet的卷积特征,改进EOC目标跟踪算法,提高了全程的跟踪速度 [19] 。
本研究拟构建轻量化GhostNet结构,对YOLOv4框架的主干特征提取网络CSPDarkNet53进行替换,对加强特征提取金字塔PANet进行改进,并采用基于PASCAL VOC [20] 数据集得到的基础网络,进行迁移学习,冻结训练数据量较小的水稻病虫害目标检测模型,同时检测9种水稻病虫害。
1 材料与方法
1.1 数据材料
1.1.1 数据采集 拟利用PASCAL VOC数据集对模型进行预训练。PASCAL VOC数据集数据量大,图像种类多,具有背景信息丰富、目标提取简单等易于泛化的图像特征,其包含了图片、标签和训练集、测试集、验证集划分文件。
构建水稻病虫害数据集,对图片数据进行采集,图片来源于百度、谷歌网站,部分图片如图1所示。其中水稻病害数据主要有5 类:稻曲病、水稻细菌性条斑病、稻瘟病、水稻胡麻斑病、水稻白叶枯病;水稻虫害数据主要有4 类:稻飞虱、稻蝗、稻棘缘蝽、螟虫。采集的数据类别及种类占比信息见表1。由于图片来源有限,数据量少,拟采用数据增强策略来提高模型对检测目标的鲁棒性。
1.1.2 数据预处理 水稻病虫害图像数据总计1 009 张,通过离线数据增强操作对图像进行加噪声、反转、旋转、平移、光度随机调节、HVS调节,将数据量扩充至6 054 张,按PASCAL VOC数据集格式,创建水稻病虫害数据集。利用Python脚本,将增强后的数据图片以数字序号批量重命名,修改图片格式,以.jpg格式存入相对应的图片文件夹中。使用LabelImg软件人工标定数据,生成.xml格式的标签文件,记录所有的目标检测框的位置、大小和类别信息,命名为对应图片的编号,存入标签文件夹。按照63∶ 27∶ 10的比例划分训练集、验证集、测试集。在模型训练过程中,使用在线增强策略,对输入图片数据进行随机放缩、扭曲、调整色域等增强操作,同时对目标检测框实施相应的校准,使得每次训练进入网络的数据具有不相同的概率,无需将增广后的数据合成出来,节省了数据的存储空间,具有很高的灵活性。
1.2 方法
1.2.1 迁移学习 利用公开数据集PASCAL VOC的预训练权值,得到基础网络。修改网络的通道数,将已经学习到的图像特征迁移到本研究构建的水稻病虫害目标检测网络上,对模型进行训练。水稻病虫害数据集(6 054 张)与PASCAL VOC数据集(20 000 张)相比,数据量小,图像特征的相似度低,因此采用冻结与训练(Freeze and Train)策略:凍结预训练模型中前 K 层主干特征提取网络的权重,将更多的算力资源分配给后面的 N-K 层网络。冻结训练迭代100次后,解冻冻结层,训练整体网络100 次。该策略弥补了水稻病虫害数据集大小不足的缺陷,使得训练时间与计算资源的利用得到了极大的改善。
1.2.2 经典 YOLOv4算法 作为经典的单阶段目标检测算法,YOLOv4 [21] 网络模型由以下4部分组成:
输入端(Input)将尺寸为416× 416× 3的图像输入网络,进行图像预处理。使用Mosaic数据增强,每次通过对4 张图片组合进行翻转、裁剪、色域变化,丰富检测物体的背景信息,加快批量归一化(Batch normalization, BN)的计算效率。运用类平滑标签(Label smoothing)防止数据过拟合。采用自对抗训练(Self-Adversarial-Training, SAT)在增添扰动的图像上训练,进行前、后向对抗式数据增强,提升网络精度与泛化能力。
基准网络(BackBone)采用 CSPDarkNet53 [22] 特征提取网络,引入 CSPNet结构,将残差块的堆叠拆分成2 个部分,平衡每层的网络计算量,消除网络反向优化时梯度信息冗余现象,增强卷积网络学习能力。采用梯度更为平滑的Mish激活函数 [23] ,增加信息传播深度。
颈部网络(Neck)采用空间金字塔池化(Space pyramid pool, SPP) [24] 和路径聚合网络(Path aggregation network, PANet) [25] 结构。SPP网络对特征层进行多种尺度的最大池化(Maxpooling)操作,增加主干特征的接受范围,将重要的上下文特征进行分离。PANet结构对特征金字塔网络(Feature pyramid network, FPN) [26] 进行了改进,将FPN层自顶向下捕获强语义特征与PAF自底向上传达强定位特征组合,解决在传递过程中出现浅层信息丢失的问题,实现目标精准定位的功能。
头部网络(Head)采用完全比值损失函数(Complete IoU, CIoU),在距离比值算法(Distance-IoU, DIoU)的基础上,添加重叠率、惩罚项等因素,检测框的回归更加稳定。利用非极大抑制算法,考虑边界框中心点的位置信息,保留最佳预测框,检测结果更加准确。
YOLOv4整体网络结构如图2所示。
训练时,采用模拟余弦退火 [27] (Cosine annealing)策略降低学习率。余弦函数中随着 x 的变化,余弦值下降可分为3 个阶段:缓慢下降、加速下降、缓慢下降。这种变化模式和预热学习率的方式配合,减少模型的不稳定因素,加快模型的收敛速度,使得模型慢慢趋于稳定,便于得到全局最优解。
检测阶段,输入图像(以输入尺寸大小416× 416 为例)经过特征提取和融合,被划分为 A× A 网格。每个网格单元对应3 个预测框,每个预测框带有5 种信息(2 个中心点坐标偏移量、2 个边框大小偏移量和1 个目标置信度)、目标的分类结果和检测概率。如图3所示,红色小框部分为目标中心点所在的网格,黄色实线框为真实框,蓝色实线框为预测框。
1.2.3 改进的YOLOv4算法
1.2.3.1 幻象模块Ghost Module的引入 为减少冗余特征图,提升主干特征提取网络的运算速度,进一步减小网络大小和计算量,采用幻象模块(Ghost module [28] )对输入图像(Input)进行操作(图4)。通过1 次卷积(Convolution)生成 m 个原始特征图 T ,进行两部分变换:一部分采用1× 1的普通卷积进行映射(Identity),生成 m 个必要特征濃缩;另一部分利用深度可分离卷积块进行逐层卷积,对 T 进行线性变换(Linear transformation)与堆叠(Stack),生成 s 个幻象特征图。将 T 映射后的 m 个特征图与 s 个幻象特征图堆叠,得到 n 个新特征图, n= m× s 。
1个幻象模块具有1个恒等映射和 m× (s-1) 个线性运算,设普通卷积核大小为 p× p ,每个线性运算规模相同,且线性运算后卷积核大小为 j× j ,输入图像高度为 g ,宽度为 k ,输入通道数为 c ,输出图像高度为 g′ ,宽度为 k′ ,其运算量 s 1 为
s 1 =m×g′ ×k′ ×c×p×p+m×(s-1)×g′ ×k′ ×j×j (1)
而使用普通卷积的运算量为
s 2 =n×g′ ×k′ ×c×p×p (2)
因此,幻象模块升级普通卷积操作的理论加速比为:
r s =s 2 s 1
=n×g′ ×k′ ×c×p×pm×g′ ×k′ ×c×p×p+m×(s-1)×g′ ×k′ ×j×j
=n×g′ ×k′ ×c×p×p(n/s)×g′ ×k′ ×c×p×p+(n/s)×(s-1)×g′ ×k′ ×j×j=c×p×p(1/s)×c×p×p+(s-1s)×j×j
由于 j<<p ,因此
r s ≈c×p×p(1/s)×c×p×p
即 r s ≈s (3)
同理计算参数压缩比为
r c =n×c×p×pm×c×p×p+m×(s-1)×j×j
=n×c×p×p(n/s)×c×p×p+(n/s)×(s-1)×j×j
=c×p×p(1/s)×c×p×p+(s-1s)×j×j
≈c×p×p(1/s)×c×p×p
因此
r c ≈s (4)
上述分析结果说明,GhostNet网络较大地提升了模型的速度和参数量。
1.2.3.2 主干特征提取网络的替换 YOLOv4网络将其主干特征提取网络CSPDarknet53的3个有效特征层,分别传入加强特征提取网络SPP和PANet,进行特征金字塔的构建。在改进YOLOv4网络过程中,利用幻象模块(Ghost module)代替CSPDarknet53中的普通卷积,获得幻象瓶颈结构(Ghost bottlenecks),重构主干特征提取网络,获取3 个有效特征层。其中,幻象瓶颈结构由多个卷积层和剪短路径(Shortcut)组成,剪短路径由下采样层和步长(Stride)为2的深度卷积DWConv(Depthwise convolution)实现。
改进前后有效特征层尺寸与参数量大小对比数据如表2所示。由表2中参数量大小的变化可知,GhostNet主干特征提取网络将原CSPDarknet53的参数量减小了28.37%。
1.2.3.3 加强特征提取网络PANet的改进 在PANet中,利用 3×3 深度可分离卷积(Depthwise separable convolution)和1× 1点卷积代替普通3× 3卷积。深度可分离卷积的实现过程为:逐通道卷积(Depthwise convolution)和卷积核数目相同的特征图(Feature map)生成,再利用1× 1逐点卷积(Pointwise convolution)在通道的深度上增加权重,生成新的特征图(图5)。
设卷积层有 w 个滤波器,每个滤波器核心尺寸为 h× h ,输入通道数为 i ,输出通道数为 j ,输入图片尺寸为 c× c ,则:
普通卷积参数量为: w×h×i×j (5)
计算量为: w×h×(c-w+1)×(c-h+1)×i×j (6)
深度可分离卷积的参数量为: w×h×i+i×j (7)
计算量为: w×h×(c-w+1)×(c-h+1)×i+w×h×i×j (8)
深度可分离卷积参数量为普通卷积的 1/j ,且在相同计算量的情况下可以将神经网络层数加深。PANet网络的3× 3深度卷积利用不同的卷积核对输入的通道数进行卷积,再通过点卷积整合深度卷积的输出特征图,防止普通卷积层中任意1 个卷积核都需要对所有通道进行操作。
在YOLOv4及其轻量化网络输入图片尺寸相同的条件下,总参数量最低的为GhostNet网络,为CSPDarkNet53的8.05%,其网络大小缩减为YOLOv4网络的6.12%,且较MobileNet系列轻量化网络也有较大的提升(表3)。利用深度可分离卷积块改进PANet后,各轻量化网络参数量下降为原来的25.0%左右,PANet的改进有效降低了网络的参数量。
1.2.4 试验准备
1.2.4.1 试验环境 使用的硬件配置为Intel(R)Core(TM)i7-10750H CPU,NVIDIA GeForce RTX 2060 Ti显卡, Windows10操作系统。软件环境为CUDA10.0,Cudnn10.0,采用Pytorch深度学习框架,安装Scipy、Numpy、Matplotlib、Opencv等软件进行数据分析与图像绘制。输入图片的尺寸为416× 416× 3,运用马赛克数据增强和余弦退火学习率策略,平滑标签设置为0.005。共设置200次迭代,进行4 类损失值观测。其中,冻结训练迭代次数为100 次,初始学习率设置为0.001,Batch size为16;解冻训练迭代次数为100 次,初始学习率为0.000 1 ,Batch size为8。损失函数随迭代次数的变化关系如图6所示。由图6可见,前25次迭代损失值急剧降低,直到50次迭代后变化趋于稳定。后面的迭代过程中,4 类损失值均变化较小,在小范围振荡。
1.2.4.2 模型评价机制 水稻病虫害检测问题本质上属于二分类问题。针对一个二分类问题,本研究将9 类待检测实例划分为正类和负类。若一个实例是正类,并且被预测为正类,即为真正类(True positive, TP);若一个实例是正类,但是被预测为负类,即为假负类(False negative, FN);若一个实例是负类,但是被预测为正类,即为假正类(False positive, FP);若一个实例是负类,并且被预测为负类,即为真负类(True negative, TN)。于是定义如下评价指标:
精确率( Precision )表示预测为正的所有样本中真正为正样本所占的比例,计算公式为:
Precision=TPTP+FP (9)
召回率( Recall )表示真正为正的样本中被预测为正的样本所占比例,计算公式为:
Recall=TPTP+FN (10)
F 1值為在 Precision和Recall 的基础上对 Precision和Recall 进行整体评价, F 1的定义如下:
F1=Precision×Recall×2Precision+Recall (11)
平均精度( AP )为精确率-召回率曲线(Precision-Recall curve)下的面积, Total images 代表数据集中总图片数目,计算公式为:
AP=∑PrecisionN(Totalimages) (12)
mAP 值为所有待检测类别(Class)的 AP 的平均值, Total classes 代表数据集中待检测目标总类别数,计算公式为:
mAP=∑APN(Total classes) (13)
在目标检测系统中,由于 F 1值与 mAP 评价指标综合考虑了准确率和召回率,消除了单一评价对结果的影响,因此性能参数优先级别由大到小依次为 mAP 值、 F 1值、准确率和召回率。
2 结果与分析
2.1 迁移学习试验结果分析
使用预训练权重与冻结训练的迁移学习策略,获得了基础特征网络,将PASCAL VOC公开数据集上学习到的知识或模式应用到水稻病虫害检测领域中。由表4可见,使用迁移学习策略获得的基础特征网络加强了轻量化网络提取特征的效率,使得模型在迭代次数较低(200 次)的条件下,获得近2倍的 mAP 值的提升。融合迁移学习训练的水稻病虫害目标检测模型,平均训练时间大幅度缩减为原来的近1/12,CPU占用率平均降低约12%,内存使用情况也有所降低。迁移学习策略的应用,大幅度提升了模型的平均训练速度,降低了对模型训练的计算机性能要求。
2.2 不同模型对水稻病虫害目标检测性能的比较
为验证改进的YOLOv4轻量化模型对水稻病虫害目标检测性能,按照各种评价指标的优先级次序,将其与经典目标检测模型Faster-RCNN系列、单激发多盒探测(SSD)系列进行对比,并对结果进行分析。图7显示,在各目标检测网络模型的 mAP 值中,YOLOv4系列目标检测算法的 mAP 值最低为79.02%,最高可达84.79%,整体性能优于Faster-RCNN系列的63.64%与SSD系列目标检测模型的63.32%; SSD-MobileNet系列 mAP 值仅为38.38%,YOLOv4系列轻量化模型可达81.60%,实现2.13倍的提升,可见改进的YOLOv4轻量化模型更适合对水稻病虫害的目标检测。
表5显示,改进的YOLOv4系列模型 F 1值明显高于Faster-RCNN系列与SSD系列模型,YOLOv4-MobileNet对9类检测目标的 F 1值平均值为0.780,YOLOv4-GhostNet为0.781,表明单阶段目标检测算法YOLOv4在采用了多尺度检测后,综合准确率与召回率更好。
图8显示,Faster-RCNN系列和未改进的YOLOv4模型坐标点距原点距离过远,其中未改进的YOLOv4模型训练时间长达67 020 s,模型权重大小达到244.37 MB,相比于SSD系列和改进的YOLOv4轻量化模型,模型大小与参数量规模庞大,在水稻病虫害检测中,严重消耗算力资源,增加模型检测成本。
综合上述分析,SSD系列模型训练时间最短,模型权重最小,但是准确率过低,无法实现水稻病虫害的目标检测任务;Faster-RCNN系列的训练时间过长,模型权重过大,训练准确度虽比较SSD系列有所提升,但仍然处于较低水平;YOLOv4目标检测网络平衡了准确率、训练时间、网络大小与参数量,可以较好地完成水稻病虫害目标检测任务。
2.3 不同轻量化YOLOv4模型的水稻病虫害检测效果
在水稻病虫害数据集上,分析YOLOv4模型与其轻量化改进的数据,结果表明各类水稻病虫害检测效果的 AP 值(精确度-召回率曲线与 x 轴所围图形的面积)基本持平(表6)。其中GhostNet网络最小,参数量最低, AP 值最高可达97.2%。
与原YOLOv4模型和YOLOv4-MobileNet系列轻量化目标检测模型对比,YOLOv4-GhostNet的检测精度 mAP 值略有损失,平均降低1.895个百分点;权重大小仅为YOLOv4的17.37%,比YOLOv4-MobileNet系列平均缩小8 MB;传输帧数与原YOLOv4模型相比,每秒提高了11.59帧,相较于YOLOv4-MobileNet系列平均降低了15.20帧;训练时间比其余4 种模型平均减少了41.72%(表7)。本研究通过对YOLOv4-GhostNet模型部分结构与训练策略的改进,综合考虑目标检测模型的各种评价指标与影响因素,实现了对9 种水稻病虫害的检测,在不影响精度的条件下缩减模型规模,降低参数量。改进的YOLOv4-GhostNet模型更适用于配置在普通算力的设备上,进行水稻病虫害的精准检测。
2.4 不同数据集与不同数据类别对改进的YOLOv4-GhostNet模型检测效果的影响
在分析不同数据集对改进的YOLOv4-GhostNet模型检测效果影响的试验中,利用水稻病虫害数据集与其他研究者不同的研究方法和不同的数据集进行对比,并分析水稻病虫害数据集自身的检测数量、检测类别对改进的模型的影响,数据如表8所示。
文献[28]和文献[15]分别使用植物幼苗数据集和室内场景数据集对2种模型进行了评估,平均检测精度( mAP 值)均接近80%,与YOLOv4模型相比,YOLOv4-GhostNet模型和文献中改进的YOLOv4模型每秒传输帧数均获得提升,但模型的权重大小降低幅度不明显。本研究在使用PASCAL VOC数据集、水稻病害数据集、水稻虫害数据集和水稻病蟲害数据集进行对比检测时,在YOLOv4模型下获得了较高的 mAP 值,使用改进的模型后, mAP 值和 F 1值略有损失,但权重文件大小缩减为原来的1/6,且传输帧数有了近1 s 10帧的提升。
水稻病虫害数据集(6 054 张)相比于PASCAL VOC数据集(20 000 张)较小,检测目标物体图像细节特征不明显,导致 mAP 值下降。水稻病害、虫害数据集划分训练与合并训练对改进的YOLOv4-GhostNet模型的各类评价指标均无较大影响,说明该模型对水稻病虫害检测具有较强的适应性。
由表5可知,各检测网络对稻曲病、稻蝗、稻棘缘蝽等病虫害的检测效果较好。这类病虫害图像特征表现为检测目标体积大、密度小、重叠少、种类单一、与背景清晰分离,且数据集制作时标注清晰明确,人为误差较小。而对于稻飞虱、水稻细菌性条斑病、白叶枯病等病虫害的检测效果略差。原因为其图像特征表现为检测目标小、数量大、密度高,在进行图像特征提取时,有效特征数据被缩减。同时在轻量化网络构建时,由于缩减了网络参数进而导致细小目标的特征被模糊化,导致检测 AP 值下降。为降低网络轻量化与人为标注时产生的误差,本研究在对该类目标进行数据标注时采用了成组标注法,即对待检测目标进行区域性标注,使得单个目标检测框中的目标数量增加,降低有效特征被裁剪的概率,有利于提升目标检测的准确性,减少人为标注误差带来的不良结果。
3 结 论
本研究用构建的GhostNet结构替换YOLOv4目标检测模型中的主干特征提取网络CSPDarkNet53,对水稻病虫害进行特征提取。利用深度可分离卷积代替普通卷积,改进了PANet特征金字塔。结合迁移学习与YOLOv4网络的训练技巧,对YOLOv4-GhostNet水稻病虫害网络模型进行训练。改进的YOLOv4-GhostNet模型平均精确度达到79.38%,检测速度为1 s 34.51 帧,模型权重大小缩减为42.45 MB,在降低参数量和计算量的同时,增加了特征表达能力,提升了水稻病虫害检测的性能,轻量便捷。与Faster-RCNN系列、SSD系列和YOLOv4及其MobileNet系列轻量化模型相比,改进的YOLOv4-GhostNet模型各项性能具有较高的水平和较强的鲁棒性,为水稻病虫害目标检测的具体应用提供了新思路与新方向。
参考文献:
[1] 商世吉,杨立群,赵庸洛,等. 水稻品种抗稻瘟病性鉴定方法的研究[J].东北农学院学报,1989(4):321-326.
[2] 张亚玲,周万福,靳学慧. 黑龙江省稻瘟病菌与水稻品种的互作分析[J].东北农业大学学报,2011,42(1):28-33.
[3] 张 武,黄 帅,汪京京,等. 复杂背景下小麦叶部病害图像分割方法研究[J].计算机工程与科学,2015,37(7):1349-1354.
[4] 马 媛,冯 全,杨 梅. 基于HOG的酿酒葡萄叶检测[J].计算机工程与应用,2016,52(15):158-161.
[5] 鲍文霞,邱 翔,胡根生,等. 基于椭圆型度量学习空间变换的水稻虫害识别[J].华南理工大学学报(自然科学版),2020,48(10):136-144.
[6] 王映龙,戴香粮. 图像处理技术在水稻虫害系统中的应用[J].微计算机信息,2007(26):274-275,256.
[7] XIA C, LEE J M , LI Y ,et al. Plant leaf detection using modified active shape models[J]. Biosystems Engineering, 2013,116(1):23-35.
[8] YE M, CAO Z, YU Z , et al. Crop feature extraction from images with probabilistic superpixel Markov random field[J]. Computer & Electronics in Agriculture, 2015, 114:247-260.
[9] MOHANTY S P, HUGHES D P, MARCEL S. Using deep learning for image-based plant disease detection[J]. Frontiers in Plant Science, 2016,7: 14-19.
[10] FERENTINOS K P. Deep learning models for plant disease detection and diagnosis[J]. Computers and Electronics in Agriculture, 2018,145:311-318.
[11] 房若民,沈凱文,李浩伟. MobileNet算法的嵌入式农业病虫害识别系统[J].单片机与嵌入式系统应用,2020,20(5):61-63.
[12] 燕 斌,周 鹏,严 利. 基于迁移学习的小样本农作物病害识别[J]. 现代农业科技,2019(6):87-89.
[13] 杨国国,鲍一丹,刘子毅. 基于图像显著性分析与卷积神经网络的茶园害虫定位与识别[J].农业工程学报,2017,33(6):156-162.
[14] 张陶宁,陈恩庆,肖文福. 一种改进MobileNet_YOLOv3网络的快速目标检测方法[J].小型微型计算机系统,2021,42(5):1008-1014.
[15] 李维刚,杨 潮,蒋 林,等. 基于改进YOLOv4算法的室内场景目标检测[J].激光与光电子学进展,2022,59(18):1-19.
[16] 曹远杰,高瑜翔. 基于GhostNet残差结构的轻量化饮料识别网络[J].计算机工程,2022,48(3):310-314.
[17] 张官荣,陈 相,赵 玉,等. 面向小目标检测的轻量化 YOLOv3算法[J].激光与光电子学进展, 2022,59(16):1-13.
[18] 董艺威,于 津. 基于SqueezeNet的轻量化卷积神经网络SlimNet[J].计算机应用与软件,2018,35(11):226-232.
[19] 刘超军,段喜萍,谢宝文. 应用GhostNet卷积特征的ECO目标跟踪算法改进[J].激光技术,2022,46(2):239-247.
[20] EVERINGHAM M, GOOL L V, WILLIAMS C, et al. The pascal visual object classes (VOC) challenge[J]. International Journal of Computer Vision, 2010, 88(2):303-338.
[21]WANG C Y, MARK LIAO H Y, WU Y H, et al. CSPNet: a new backbone that can enhance learning capability of CNN[C]//IEEE. 2020 IEEE/CVF conference on computer vision and pattern recognition workshops (CVPRW). Seattle, WA, USA: IEEE Press, 2020: 1571-1580.
[22] 周睿璇,汪俊霖,孙 宏,等. 一种改进YOLO v3的货车车轮检测算法[J].山西电子技术,2021(4):37-40.
[23] HE K, ZHANG X, REN S, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 37(9): 1904-1916.
[24] LIU S, QI L, QIN H, et al. Path aggregation network for instance segmentation[C]//IEEE. 2018 IEEE conference on computer vision and pattern recognition. Salt Lake City, UT, USA:IEEE Press, 2018: 8759-8768.
[25] LIN T Y, DOLLAR P, GIRSHICK R, et al. Feature pyramid networks for object detection[C]//IEEE. 2017 IEEE conference on computer vision and pattern recognition. Honolulu, HI, USA. IEEE Press, 2017: 936-944.
[26] 张 娜,贺兴时. 基于模拟退火的自适应正余弦算法[J].纺织高校基础科学学报,2021,34(1):84-90.
[27] HAN K, WANG Y, TIAN Q, et al. Ghostnet: More features from cheap operations[C]//IEEE. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Washington, USA:IEEE Press, 2020: 1580-1589.
[28] 李文婧,徐国伟,孔维刚,等. 基于改进YOLOv4的植物叶茎交点目标检测研究[J].计算机工程与应用,2022,58(4):221-228.
(责任编辑:张震林)
收稿日期:2021-12-09
基金项目:国家级大学生创新训练计划项目(41111214)
作者简介:周 维(2001-),女,吉林长春人,本科,研究方向为计算机视觉与病虫害目标检测。(E-mail)xingan_cangshu@nefu.edu.cn
通讯作者:李 丹,(E-mail)ld725725@126.com