基于AD-YOLOX-Nano的茶叶嫩芽识别算法

2025-01-19 00:00:00高芳征温鑫黄家才陈光明金少宇赵雪迪
中国农机化学报 2025年1期
关键词:注意力机制

摘要:

为解决茶叶嫩芽识别困难,提高自然环境下茶叶嫩芽识别的精确性和鲁棒性,提出一种融入注意力机制和深度可分离卷积的改进型YOLOX-Nano(AD-YOLOX-Nano)茶叶嫩芽识别算法。该算法以YOLOX-Nano模型为基础,采用CSPDarkNet作为主干网络,通过在CSPDarkNet网络中引入深度可分离卷积(Depthwise Separable Convolution)来减少特征提取工作量,并将卷积注意力模块(Convolutional Block Attention Module)融入到YOLOX-Nano网络的特征金字塔中,学习不同通道的特征相关性,增强网络的深度信息传递,提高模型在不同场景下对茶叶嫩芽的识别能力。结果表明:AD-YOLOX-Nano算法的平均精度AP值和F1值分别为85.6%和86%,相较于同环境下YOLOX-Nano算法,该算法的模型大小基本保持不变,但其AP值和F1值分别提高2.7%和3%。与常用的YOLOv5-S、YOLOv4和Faster R-CNN等目标检测算法相比,该AD-YOLOX-Nano算法模型大小仅为它们的1/7,但AP值分别提高5.4%、5.5%和6.28%。所提算法在模型轻量化和检测精度方面优势显著,为茶叶智能化采摘的嵌入式硬件部署提供有效解决方案。

关键词:茶叶嫩芽识别;AD-YOLOX-Nano算法;注意力机制;深度可分离卷积

中图分类号:S24; TP391.4

文献标识码:A

文章编号:2095-5553 (2025) 01-0178-07

Tea bud recognition algorithm based on AD-YOLOX-Nano

Gao Fangzheng1, Wen Xin1, Huang Jiacai2, Chen Guangming3, Jin Shaoyu2, Zhao Xuedi2

(1. "School of Automation, Nanjing Institute of Technology, Nanjing, 211167, China;

2. School of Mechanical Engineering, Nanjing Institute of Technology, Nanjing, 211167, China;

3. College of Engineering, Nanjing Agricultural University, Nanjing, 210000, China)

Abstract:

In order to address the difficulties in identifying tea buds and improve the accuracy and robustness of tea bud recognition in natural environments, this paper develops an improved YOLOX-Nano algorithm (AD-YOLOX-Nano) by integrating attention mechanism and depthwise separable convolution. The algorithm is based on the YOLOX-Nano model, which uses CSPDarkNet as the backbone network. It reduces the workload of feature extraction by introducing Depthwise Separable Convolution in the CSPDarkNet network. The Convolutional Block Attention Module is incorporated into the feature pyramid of the YOLOX-Nano network to learn the feature correlation of different channels, enhance the transmission of depth information in the network, and improve the recognition capability of tea buds in different scenarios. The experimental results show that the AP value and F1 values of the AD-YOLOX-Nano algorithm are 85.6% and 86%, respectively. Compared to the YOLOX-Nano algorithm in the same environment, this algorithm maintains a similar model size, but achieves an improvement of 2.7% in AP value and 3% in F1 value. Compared to the commonly used object detection algorithms such as YOLOv5-S, YOLOv4, and Faster R-CNN, the AD-YOLOX-Nano algorithm has a model size of only 1/7 of theirs. But it achieves an improvement of 5.4%, 5.5%, and 6.28% in AP value, respectively. The proposed algorithm has significant advantages in terms of model lightweighting and detection accuracy, providing an effective solution for the deployment of embedded hardware for intelligent tea picking.

Keywords:

tea buds recognition; AD-YOLOX-Nano; attention mechanism; depthwise separable convolution

0"引言

茶叶是中国的传统出口商品之一[1]。随着生活水平的提高,人们对茶叶尤其名优茶的需求量日益剧增。然而,茶叶采摘是一项劳动密集型工作,具有采摘期短、工作强度大的特点,传统的人工采摘方式受限于劳动力短缺、效率低下等因素无法满足当前茶叶采摘应用需求[2]。因此,探索对茶叶嫩芽自动化识别和检测,实现茶叶智能化采摘已成为当前研究热点[3]

近年来,随着深度学习算法的发展,基于深度学习的目标检测方法在农产品检测领域中得到广泛应用[4]。以苹果采摘为例,王卓等[5]提出了一种基于嵌入式平台的改进YOLOv4型轻量化检测方法,该方法的苹果检测平均精度为92.23%。尚钰莹等[6]提出了一种基于YOLOv5s的苹果花朵检测方法,该方法在精确率、召回率、模型大小和检测速度方面表现出色,并且在不同天气和光照条件下具有较高的稳定性和鲁棒性。赵德安等[7]提出了基于YOLOv3的苹果定位方法,该方法通过单个卷积神经网络实现了复杂环境下苹果的高效准确检测,为苹果采摘机器人的应用提供了理论基础。在其他农产品检测的研究中,刘小刚等[8]针对目前草莓识别定位大多在简单环境下研究且存在识别效率较低的问题,提出了一种改进的YOLOv3草莓识别方法,测试集验证显示该方法精度均值为87.51%,并在果实遮挡和复杂场景下性能良好。另外,Liu等[9]在YOLOv3基础上,通过圆形边框提高番茄定位准确性,提出了一种改进的番茄检测模型YOLO-Tomato,与Mask R-CNN等先进的检测方法对比,该方法在复杂环境下表现出更为优越的检测性能。杨坚等[10]提出了一种改进YOLOv4-tiny模型的番茄成熟度识别方法,该方法通过增加检测头、集成注意力模块等技术,实现对遮挡和小番茄的准确识别,平均精度达到97.9%。

然而,针对茶叶嫩芽目标检测的研究却不多见。近年来,黄家才等[11]针对YOLOv4检测模型进行轻量化改进,提出一种基于Compact-YOLOv4算法的茶叶嫩芽移动端识别方法。在保持检测精度和速度前提下,该算法改进后的模型内存占用量仅为原来的1/5,降低了模型推理计算的硬件性能需求。朱红春等[12]探索了Faster R-CNN目标检测算法在复杂场景下茶叶嫩芽检测方面的应用。在不区分茶叶嫩芽类型的情况下,该方法平均准确度为54%,均方根误差为3.32。但上述研究由于未考虑复杂多变的自然环境下光线对茶叶嫩芽检测效果的影响,造成算法对环境和光照要求较高,从而导致所提算法鲁棒性不强,在实际应用中受到一定限制。

基于上述分析,为实现自然环境下茶叶嫩芽的精确快速识别,本文提出一种基于AD-YOLOX-Nano的茶叶嫩芽识别算法。该算法以YOLOX-Nano模型为基础,通过在骨干网络的特征金字塔中引入卷积注意力模块,增强对目标特征的关注。同时,在CSPDarkNet网络中引入深度可分离卷积,以减少特征提取的工作量,克服复杂环境下光线变化造成的识别困难。

1"图像采集与数据集制作

1.1"试验数据获取

由于缺少可用的茶叶嫩芽数据集,在江苏茶博园进行茶叶嫩芽图片拍摄工作,采集时间为2023年3—5月。同时,为减少重复图片以及不合格图片对模型训练的影响,对拍摄的图片进行筛选,共得到3500张符合要求的图片。图1为部分合格图片样本。

1.2"数据集准备

使用开源软件LabelImg对茶叶嫩芽图片进行标注。采用拉框标注方法,将标注的图片命名为“Teabud”,具体的标注原则:(1)对茶叶枝干上无遮挡的嫩芽进行标注。(2)对茶叶枝干有遮挡的情况,通过人工估计的方式进行标注。对其中嫩芽清晰可见的图片进行标注;对被遮挡的嫩芽图片则不进行标注。(3)对图片中视野较远的嫩芽,若其像素面积过小,则不进行标注。

1.3"数据集扩充

在茶叶嫩芽图片中,复杂环境下不同天气和不同时间光照条件不同,导致采集到的嫩芽图片颜色差异很大;另外,室外茶垄生长姿态各异,茶叶嫩芽遮挡情况严重。为增加样本多样性,降低模型过拟合的概率,采用数据增广的方式对数据集进行扩充。数据增广可有效增加样本的多样性,提高模型的鲁棒性[13]。采用图像处理方法:(1)改变图片的亮度来模拟实际情况中光照条件的变换。(2)使用仿射变换来模拟实际情况中摄像机角度的变换。(3)使用随机遮挡来模拟实际环境中嫩芽在复杂多变的环境中被遮挡的情况。(4)添加随机裁剪来扩充数据集数量。如图2所示,通过以上方法,最终扩增数据集至6423张图片。

2"改进YOLOX-Nano模型网络构建

YOLOX-Nano是一种单阶段目标检测算法。通过引入多项创新技术,如Fcous结构、空间金字塔池化、YOLOHead和SimOTA动态正样本匹配等技术,使得YOLOX-Nano比其他常用的YOLO系列检测算法具备更快的收敛速度和更高的精度,从而可以实现高精度的快速目标检测与识别任务。

2.1"注意力机制

2.1.1"通道注意力机制

通道注意力机制(Channel Attention Mechanism,CAM)主要用于关注输入图像中有意义的信息[14]。由两个关键部分组成:全局信息池化和通道权重计算。全局信息池化是通过对整个特征图进行空间维度上的池化操作,以获取全局上下文信息。通道权重计算则利用全局信息来计算每个通道的重要性得分,常见的方法包括使用全连接层、卷积层或者简单的线性变换。最后,将通道权重乘以原始特征图,实现对不同通道特征的加权融合。通过引入通道注意力机制,模型可以自适应地学习每个通道的重要性,并对不同通道的特征进行动态调整,以更好地捕捉输入数据中的相关信息。通道注意力机制可帮助模型集中关注最相关的特征,减少冗余信息的干扰,提高模型的判别能力和泛化能力。通道注意力模块结构如图3所示。

经过通道注意力机制处理后,输入特征矩阵通过式(1)计算得到通道注意力机制输出的特征映射。

F′=Mc(F)F

(1)

式中:

F——输入的特征矩阵;

F′——

经过通道注意力机制处理后的特征映射;

Mc——通道压缩权值矩阵。

2.1.2"空间注意力机制

空间注意力机制(Spatial Attention Mechanism,SAM)[15]可帮助模型集中注意力于感兴趣的区域,提高模型的感知性能和准确性。

空间注意力机制同样由两部分组成:位置信息的提取和权重计算。位置信息的提取可以通过使用卷积操作或者其他空间变换操作来实现,以捕获不同空间位置的特征表示。权重计算则根据位置信息对不同位置的重要性进行建模,通常使用全连接层、卷积层或者简单的线性变换来计算位置权重。最后,将位置权重与原始特征图相乘,实现对不同位置特征的加权融合。

通过引入空间注意力机制,模型可以自适应地学习不同空间位置的重要性,并调整输入特征图中不同位置的贡献度,有助于模型集中关注重要的图像区域,提高对关键信息的感知和提取能力。图4为空间注意力模块结构。

经过空间注意力机制处理后,通道注意力机制输出的特征矩阵经过式(2)计算得到空间注意力机制输出的特征矩阵。

F″=Ms(F′)F′

(2)

式中:

F″——空间注意力机制输出的特征矩阵;

Ms——空间压缩权值矩阵。

2.2"改进过程

YOLOX-Nano的主干网络由多个跨阶段层(Cross Stage Partial)组成,具有多个残差网络和较大的残差边,这些残差会将特征信息连同包含的噪声一起传输到较深的网络中,对主干网络的特征提取产生不利影响。因此,引入通道注意力模块和空间注意力模块,以增强网络对重要特征的关注,抑制非必要特征的影响。

2.2.1"混合注意力机制

混合注意力机制是指将两种或多种注意力机制结合在一起形成的全新注意力机制。将通道和空间两种注意力机制进行混合。这种混合可以采用串联或者并联的方式进行多种组合。为确定具体方案,对通道和空间注意力机制的串并顺序和基础的SENet注意力机制[16]进行对比试验,结果如表1所示。

由表1可知,采用YOLOX-Nano+CAM+SAM,即先通道后空间的方法效果更好。与Woo等[17]提出的卷积注意力模块结构(CBAM)完全一致,CBAM模块结构如图5所示。

2.2.2"深度可分离卷积

BaseConv是YOLOX-Nano主干网络的基本卷积结构,结构如图6所示。BaseConv主要由Conv、BN、SiLU组成,在网络中扮演着特征提取的关键角色,是模型主干网络中最重要的组成部分。

然而,BaseConv卷积提取的特征过多会造成计算量较大,因此,为减少计算量,本研究在YOLOX-Nano主干网络中引入深度可分离卷积(DSConv)[18],其结构如图7所示。

通过应用深度可分离卷积,可以减少特征提取工作的计算量和参数量,更好地配合CBAM对图像进行检测。在资源受限的场景下,深度可分离卷积和CBAM的组合可以展现出更佳性能。

2.2.3"AD-YOLOX-Nano网络结构

受上述试验启发,在YOLOX-Nano模型的主干网络CSPDarkNet中引入深度可分离卷积,并将CBAM融入到改进后网络的特征金字塔中,称这种改进后的模型为AD-YOLOX-Nano,其结构如图8所示。图8中有底纹部分表示相对于原始YOLOX-Nano模型进行的改进和优化;而无底纹部分则保留原始网络结构,不做改变。

2.3"模型训练和测试

2.3.1"试验平台

训练平台为配备Windows10操作系统的台式计算机,其中CPU为Intel Core i7-13700F,GPU为RTX2060。训练环境和测试环境相同。

2.3.2"网络训练

将采集到的6423张图片按7∶2∶1的比例随机分为训练集、验证集和测试集,具体分类如表2所示。

对训练参数进行配置,训练模式为本机显卡训练的本地训练模式;迭代轮次设置为300轮次;基础学习率设置为默认值1;Patch大小选择大;训练中采用Mosaic增强和Mixup数据增强的方式进行数据增强。并且考虑在Mosaic增强过程中,如果样本与实际情况偏离较大,可能会对模型的训练效果造成负面影响,因此在训练的最后30轮次中,关闭Mosaic和Mixup数据增强[19]

3"结果与分析

3.1"模型轻量化分析与比较

为验证算法基础网络YOLOX-Nano的优异性,试验使用相同的数据集训练3种轻量化的YOLOX模型,分别为YOLOX-Nano、YOLOX-Tiny和YOLOX-S,如表3所示。

表3结果显示,在相同的测试集下进行测试时,3种模型的F1值相差不大,即它们在目标检测任务中的性能相对接近。然而,与YOLOX-tiny和YOLOX-S相比,YOLOX-Nano在平均精度AP方面表现更好,分别相较于YOLOX-Tiny和YOLOX-S提高4.3个百分点和2.6个百分点。此外,YOLOX-Nano的模型大小仅为3.70MB,远小于YOLOX-tiny和YOLOX-S。

在上述结果中,YOLOX-Nano在更小的模型尺寸下表现最优,这是因为在训练过程中对三种模型采用相同的增强策略(即消除Mosaic和MixUp的时期相同)。然而,不同大小的模型可能需要不同的增强策略。对于大模型而言,采用更强的增强策略可以带来更好的效果。

综上所述,由于小模型能够在有限的计算资源和存储容量下运行,并且仍能保持较好的检测精度,因此在嵌入式和移动设备上部署目标检测模型时,选择小模型非常重要。因此,本研究选择YOLOX-Nano作为基准模型,该模型在模型尺寸较小的情况下表现最优,并且具备在有限资源条件下高效执行目标检测任务的能力。

3.2"消融试验结果与分析

为验证改进后YOLOX-Nano模型的性能,在茶叶嫩芽数据集上进行消融试验。试验在原有YOLOX-Nano模型的基础上加入CBAM与DSConv,训练过程中,试验结果如表4所示。从表4可以看出,原模型的AP值为82.9%。引入CBAM模块后,AP值提高2.1%。引入DSConv模块后,AP值则提高0.7%。两则共同配合后,模型的AP值提高2.7%。试验结果表明,改进方案取得预想的效果,证明改进的有效性。

3.3"改进后YOLOX-Nano模型识别结果与分析

为验证改进后YOLOX-Nano模型的性能,在相同的茶叶嫩芽数据集上进行对比试验。如图9所示,YOLOX-Nano模型在检测难度较高的目标上存在漏检问题,而AD-YOLOX-Nano模型无此现象。同时,对于正确检测到的目标,YOLOX-Nano检测到的相同嫩芽的置信度从左到右分别为0.96、0.87、0.97、0.98,而AD-YOLOX-Nano模型检测到的同样的茶叶嫩芽的置信度从左到右分别0.99、0.97、0.98、0.97,表明AD-YOLOX-Nano模型在识别茶叶嫩芽时具有明显更高的置信度。改进前后模型检测结果对比如表5所示,各指标对比如图10所示。

根据表5可知,提出的AD-YOLOX-Nano目标检测网络,在模型大小基本不变及平均检测时间相差不大的情况下,精确率P值、召回率R值、F1值和AP值均有所提升。改进后P值为89.21%,相较于YOLOX-Nano网络提升5.75%;R值为83.01%,相较于YOLOX-Nano网络提升0.67%;F1值为86%,相较于YOLOX-Nano网络提升3%;AP值为85.6%,相较于YOLOX-Nano网络提高2.7%。

在复杂自然环境下,AD-YOLOX-Nano模型可以在一定程度上提高茶叶嫩芽识别结果的鲁棒性。CBAM通过通道注意力机制和空间注意力机制,分别对特征图中不同的通道和不同位置的特征点赋予权重值,深度可分离卷积则减少计算量和参数量,二者的结合使得提取到的茶叶嫩芽特征更加精炼,总体上提升模型检测的平均精度,其模型体积和检测时间也均满足嵌入式设备部署需求。

3.4"横向对比试验

为客观评估AD-YOLOX-Nano模型的性能,在相同条件下训练其他轻量化的YOLO模型,并与AD-YOLOX-Nano模型进行对比,结果如表6所示。

由表6可知,AD-YOLOX-Nano模型的F1值最高,与YOLOv5-S[20]和YOLOv4[21]相比,其在AP值上分别提高5.4%和5.5%,同时模型大小仅为它们的1/7,平均检测时间也快于YOLOv4。与双阶段检测器Faster R-CNN[22]相比,AD-YOLOX-Nano的AP值提高6.28%,在平均检测时间和模型大小均有显著提升。与轻量化网络Compact-YOLOv4[11]相比,AD-YOLOX-Nano的AP值提高12.67%。

4"结论

1) 针对传统基于深度学习的识别方法在茶叶嫩芽识别方面存在的不足,提出一种基于AD-YOLOX-Nano的茶叶嫩芽检测方法。该方法以YOLOX-Nano模型为基础,通过在骨干网络的特征金字塔中引入卷积注意力模块,增强对目标特征的关注。同时,在CSPDarkNet网络中引入深度可分离卷积,减少特征提取的工作量。

2) AD-YOLOX-Nano网络在茶叶嫩芽检测方面的AP值为85.6%,F1值为86%,与原YOLOX-Nano模型相比,这两个指标均有明显提升。与YOLOv5-S、YOLOv4、Faster R-CNN等模型相比,AD-YOLOX-Nano模型在茶叶嫩芽识别效果上也表现出显著优势。

3) AD-YOLOX-Nano模型对单幅图像的检测时间为21.72ms,帧率为46f/s,模型大小为3.76MB,适用于嵌入式设备和移动端设备的硬件部署需求。

综上所述,本研究所提的AD-YOLOX-Nano目标检测算法在模型大小、检测精度和检测速度方面均具有一定优势,对茶叶智能化采摘的嵌入式硬件部署提供可行方案,也可为其他农产品的采摘提供参考。

参"考"文"献

[1]

Pan S Y, Nie Q, Tai H C, et al. Tea and tea drinking: China,s outstanding contributions to the mankind [J]. Chinese Medicine, 2022, 17(1): 1-40.

[2]

Han Y, Xiao H, Qin G, et al. Developing situations of tea plucking machine [J]. Engineering, 2014, 6(6):45606.

[3]

Xu W, Zhao L, Li J, et al. Detection and classification of tea buds based on deep learning [J]. Computers and Electronics in Agriculture, 2022, 192: 106547.

[4]

孙红,李松,李民赞,等.农业信息成像感知与深度学习应用研究进展[J].农业机械学报, 2020,51(5):1-17.

Sun Hong, Li Song, Li Minzan, et al. Research progress of image sensing and deep learning in agriculture [J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(5): 1-17.

[5]

王卓,王健,王枭雄,等.基于改进YOLOv4的自然环境苹果轻量级检测方法[J].农业机械学报, 2022,53(8):294-302.

Wang Zhuo, Wang Jian, Wang Xiaoxiong, et al. Lightweight real-time apple detection method based on improved YOLOv4 [J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(8): 294-302.

[6]

尚钰莹,张倩如,宋怀波. 基于YOLOv5s的深度学习在自然场景苹果花朵检测中的应用[J].农业工程学报, 2022,38(9):222-229.

Shang Yuying, Zhang Qianru, Song Huaibo. Application of deep learning using yolo v5s to apple flower detection in natural scenes [J]. Transactions of the Chinese Society of Agricultural Engineering, 2022, 38(9): 222-229.

[7]

赵德安,吴任迪,刘晓洋,等.基于YOLO深度卷积神经网络的复杂背景下机器人采摘苹果定位[J].农业工程学报, 2019,35(3):164-173.

Zhao De,an, Wu Rendi, Liu Xiaoyang, et al. Apple positioning based on yolo deep convolutional neural network for picking robot in complex background [J]. Transactions of the Chinese Society of Agricultural Engineering, 2019, 35(3): 164-173.

[8]

刘小刚,范诚,李加念,等.基于卷积神经网络的草莓识别方法[J].农业机械学报, 2020,51(2):237-244.

Liu Xiaogang, Fan Cheng, Li Jianian, et al. Identification method of strawberry based on convolutional neural network [J]. Transactions of the Chinese Society for Agricultural Machinery, 2020, 51(2): 237-244.

[9]

Liu G, Nouaze J C, Touko Mbouembe P L, et al. YOLO-tomato: A robust algorithm for tomato detection based on YOLOv3 [J]. Sensors, 2020, 20(7): 2145.

[10]

杨坚,钱振,张燕军,等.采用改进YOLOv4-tiny的复杂环境下番茄实时识别[J].农业工程学报, 2022,38(9):215-221.

Yang Jian, Qian Zhen, Zhang Yanjun, et al. Real-time recognition of tomatoes in complex environments based on improved YOLOv4-tiny [J]. Transactions of the Chinese Society of Agricultural Engineering, 2022,38(9):215-221.

[11]

黄家才, 唐安, 陈光明,等. 基于Compact-YOLOv4的茶叶嫩芽移动端识别方法[J]. 农业机械学报, 2023, 54(3):282-290.

Huang Jiacai, Tang An, Chen Guangming, et al. Mobile recognition solution of tea buds based on Compact-YOLOv4 algorithm [J]. Transactions of the Chinese Society for Agricultural Machinery, 2023, 54(3):282-290.

[12]

朱红春,李旭,孟炀,等.基于Faster R-CNN网络的茶叶嫩芽检测[J].农业机械学报, 2022,53(5):217-224.

Zhu Hongchun, Li Xu, Meng Yang, et al. Tea bud detection based on Faster R-CNN network [J]. Transactions of the Chinese Society for Agricultural Machinery, 2022, 53(5):217-224.

[13]

陈国防,陈兆英,王玉亮,等.基于数据增强深度学习的苹果花检测方法研究[J].中国农机化学报,2022,43(5):148-155.

Chen Guofang, Chen Zhaoying, Wang Yuliang, et al. Research on detection method of apple flower based on data-enhanced deep learning [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(5): 148-155.

[14]

卫雅娜,王志彬,乔晓军,等.基于注意力机制与EfficientNet的轻量化水稻病害识别方法[J].中国农机化学报, 2022, 43(11): 172-181.

Wei Yana, Wang Zhibin, Qiao Xiaojun,et al. Lightweight rice disease identification method based on attention mechanism and efficientnet [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(11): 172-181.

[15]

于雪莹,高继勇,王首程,等.基于生成对抗网络和混合注意力机制残差网络的苹果病害识别[J].中国农机化学报, 2022, 43(6): 166-174.

Yu Xueying, Gao Jiyong, Wang Shoucheng, et al. Apple disease recognition based on wasserstein generative adversarial networks and hybrid attention mechanism residual network [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(6): 166-174.

[16]

王红君,季晓宇,赵辉,等.SENet优化的Deeplabv3+淡水鱼体语义分割[J].中国农机化学报,2021,42(2):158-163.

Wang Hongjun, Ji Xiaoyu, Zhao Hui, et al. SENet optimized Deeplabv3+ freshwater fish body semantic segmentation [J]. Journal of Chinese Agricultural Mechanization, 2021, 42(2): 158-163.

[17]

Woo S, Park J, Lee J Y, et al. CBAM: Convolutional block attention module [C]. Proceedings of the European Conference on Computer Vision, 2018: 3-19.

[18]

王建翠,惠巧娟,吴立国.基于多尺度注意力和深度可分离卷积的农田杂草检测[J].中国农机化学报, 2023, 44(5): 182-187.

Wang Jiancui, Hui Qiaojuan, Wu Liguo. Field weeds detection based on multi scale attention and depth separable convolution [J]. Journal of Chinese Agricultural Mechanization, 2023, 44(5): 182-187.

[19]

Hao W, Zhili S. Improved mosaic: Algorithms for more complex images [C]. Journal of Physics: Conference Series. IOP Publishing, 2020, 1684(1): 012094.

[20]

Zhou Q, Zhang W, Li R, et al. Improved YOLOv5-S object detection method for optical remote sensing images based on contextual transformer [J]. Journal of Electronic Imaging, 2022, 31(4): 043049.

[21]

Li S, Cui X, Guo L, et al. Enhanced automatic root recognition and localization in GPR images through a YOLOv4-based deep learning approach [J]. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 1-14.

[22]

尚文卿,齐红波.基于改进Faster R-CNN与迁移学习的农田杂草识别算法[J].中国农机化学报,2022,43(10):176-182.

Shang Wenqing, Qi Hongbo. Identification algorithm of field weeds based on improved Faster R-CNN and transfer learning [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(10): 176-182.

猜你喜欢
注意力机制
基于注意力机制的行人轨迹预测生成模型
计算机应用(2019年3期)2019-07-31 12:14:01
基于注意力机制和BGRU网络的文本情感分析方法研究
多特征融合的中文实体关系抽取研究
基于序列到序列模型的文本到信息框生成的研究
基于深度学习的手分割算法研究
从餐馆评论中提取方面术语
面向短文本的网络舆情话题
基于自注意力与动态路由的文本建模方法
软件导刊(2019年1期)2019-06-07 15:08:13
基于深度学习的问题回答技术研究
基于LSTM?Attention神经网络的文本特征提取方法