基于YOLOv5的鹿食植物细胞识别方法

2024-05-27 13:43王鑫玉王姝蒙李文顺
科技资讯 2024年1期
关键词:注意力机制图像识别人工智能

王鑫玉 王姝蒙 李文顺

关键词: YOLOv5 图像识别 人工智能 注意力机制

中图分类号: TP391 文献标识码: A 文章编号: 1672-3791(2024)01-0230-04

黑龙江省大小兴安岭、老爷岭、完达山等林区分布着数量不等的马鹿群,为保护马鹿种群正常的生存繁衍[1],相关领域的工作人员付出了大量的心血,如运用野外观测法等方法评估马鹿种群数量,从而确保马鹿种群的多样性等。对鹿种群数量进行研究,有助于了解鹿的种群生态和生活史,也有利于动物的管理和保护。记录濒危物种或狩猎物种在一段时间内种群数量的变化,有助于保护区或管理人员对该物种的保护措施做出相应的调整。

目前,对于野生鹿的种群数量、种群结构等的调查方法有样线法、微卫星标记、红外相机、直接观察法、无线电相圈法等,但这些方法实施难度大、准确度低[2]。

近年来,计算机视觉技术不断发展,神经网络用于分类识别也比较成熟,目前,有些学者将这些先进的技术应用到了植物细胞壁识别分类方面,并进行全面研究,解决了利用显微镜人工辨认对粪便显微组织植物表皮角质碎片进行分析效率较低下的问题。但鹿食植物细胞分类是一个很繁琐的问题,由于客观因素太多,且植株经动物咀嚼消化后,已经不可能具备有完整的叶片形态,导致鹿食植物的分类等问题迟迟未能得到有效解决。未解决这一问题可以通过植物残渣的细胞壁形态来进行鉴定和分类,例如:粪便显微分析法是根据鹿排泄的粪便中植物表皮角质形成细胞在被消化后仍然具有细胞壁结构这一特征,来鉴定鹿食植物的种类和数量与成分组成。

根据这种情况,本文提出了一种“基于深度学习的鹿食植物细胞与种群数量关系的分析方法”,采用计算机视觉技术将马鹿粪便中各类植物细胞壁的特征提取出来,并通过建立卷积神经网络模型,将所有输入的数据进行识别与分类。并通过植物残渣细胞壁形态来研究鹿摄食习性,从而鉴定鹿食植物的种类、数量与成分组成。提高分析效率和鹿种群监测的准确率,为鹿种群监测提供一种新的手段和方法。

1 实验样本处理方法

1.1 鹿食植物叶片样本处理方法

本文研究建立的数据集有十几种树木叶片,这些叶片具有十分复杂的相似性。为了最大限度地丰富叶片数据集[3],从而使利用数据集进行训练的神经网络模型能可以更加充分地学习叶片上各种不同的特征,因此本文建立叶片图像数据集时不仅仅局限于拍摄单一背景的图片,而是进行了更有复杂背景下的图片处理。

在收集原始材料的过程中,首先需要摘取叶片较为完整的、叶面纹路较为清晰的植物叶片,然后将这些采集到的叶片样本放置在纯白色的背景板上。为了能够获取不同角度下的叶片图像,本文使用了索尼数码相机,在尽可能保证光照、温度、湿度等外界环境因素不变的前提下,进行了全方位的拍摄,而后在获取叶片纹路细节图像时,本文采用科密扫描仪对叶片进行了图像扫描,并导出了扫描结果[4]。

复杂环境叶片数据的采集工作主要是通过索尼照相机在野外拍摄完成的。在此过程中,尽量寻找完整的树木叶片,但并不设特定拍摄的背景。采集人员根据树木叶片的长势随机拍摄,确保拍摄图片是叶片最真实生长环境。但是这种采集方法由于野外环境的复杂,经常导致获取的树木叶片图像有光照不均、杂乱背景、显示不全、细节不清晰等问题。这些干扰因素也给模型的训练增加了一定的难度。

本文研究建立的数据集有十几种树木的叶片样本,部分样本如图1 所示。根据图可知,不同种类树木的叶片具有十分复杂的相似性,具有很多相似的特征,故而叶片在野外环境下显得十分相似。这也对卷积神经网络的性能提出了更高的要求。

1.2 粪便样本处理方法

在开始制作粪便显微片前,需要对采集到的粪便进行预处理,首先将采集的马鹿粪便样本取出3粒放置在事先准备的干燥容器中,组成一份复合样本,而后将容器放置在烘箱之中,将烘箱温度调整至70 ℃,连续烘干48 h,保证样本中水分全部蒸发,而后将样本从烘箱中取出,去除容器,使用80 目或100 目的筛子对其中的样本进行过滤,最终保留小于80 目和大于100 目的样本。

每种样本取0.5 g 放入相应培养皿中,向培养皿中注入10% 的次氯酸钠溶液,直至溶液浸没培养皿2/3。使用玻璃杯将样本搅拌均匀。密封培养皿8~10 h,打开培养皿,用镊子将溶液上层透明较薄的薄膜放置于载玻片上,而后用滤纸吸取载玻片上多余次氯酸钠溶液,用蒸馏水清洗载玻片2~3 遍。将载玻片放在显微镜下观察,若图像不清晰则继续使用蒸馏水冲洗,若图像清晰则使用甘油封片。鹿食植物细胞样本图像见图2。

本文采用频率转换法对制作的马鹿粪便样本进行分析,首先将粪便纤维片放置在100 倍的光学显微镜下做镜检,在每张纤维片的视野中,按照从上到下由左到右的顺序选取15~20 个视野,并记录每个视野中出现的植物表皮碎片,该方法可以计算出每种植物碎片出现的频率,其数学表达式为

F = 100(1 - e -D) (1)

式(1)中,D 为一种植物表皮碎片的平均密度。

2 网络模型

2.1 YOLO 模型

YOLO 模型由Joseph Redmon 等于2016 年首次提出,并分别于2017 年、2018 年、2020 年提出了YOLOv2~YOLOv4 這3 个改进版本;2020 年,Glenn Jocher等提出YOLOv4 的改进模型YOLOv5。

与YOLOv1~YOLOv4 相比,YOLOv5[5]增加了自适应锚框计算、矩形推理等功能。同时,可以通过宽度系数与深度系数这两个参数来控制模型网络的大小,得到YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x 这4 个模型,从s~x 模型的网络深度与宽度逐渐增加,网络结构逐渐复杂,这样的设计可以便捷地选择模型大小来权衡目标检测速度与精度,并在模型推理时采用矩形推理进一步提高目标检测速度。最重要的是,将YOLOv1~YOLOv4 中一直沿用的“物体由中心点坐标所在的单元格负责预测”思想改进为“物体由中心点坐标所在的单元格与最近的两个单元格负责预测”,这一改进增加了正负样本数量,加快了网络训练的收敛速度。

本文采用YOLOv5 模型6.0 版本中的YOLOv5s 模型进行实验,其网络模型结构如图3 所示。

2.2 注意力机制

注意力机制早期应用于图像领域,其原理是通过模拟人类的视觉中注意力的处理方式,筛选出图像中重要的部分,从而更好地对图像做出判断。随着图像识别技术的不断发展,注意力机制被广泛应用于自然语言处理、目标检测、语义分割等诸多图像识别方向[6]。在目标检测中引入注意力机制理论上可以使模型聚焦于图像中的关键信息,过滤无关信息,节省计算资源,同时提升模型对小目标的检测效果。

注意力机制(Squeeze-and-Excitation,SE)[7]主要包括Squeeze 和Excitation 两部分操作,注重特征图中通道信息的重要性差异,使模型自适应地调整对各通道的注意力权重。

卷积注意力机制(Convolutional Block AttentionModule,CBAM)主要包括通道注意力(Channel Atten AttentionModule,CAM)和空间注意力(Spatial AttentionModule,SAM)两个顺序的子模块,CBAM 在输入特征图的基础上依次融合了沿通道和空间两种维度上的注意力权重,并分别与输入特征相乘得到新的特征,有利于提取特征图上的重要信息。

坐标注意力机制(Coordinate Attention,CA)[8]主要包括坐标信息嵌入(Coordinate Information Embedding)和坐标注意力生成(Coordinate Attention Generation)两部分操作,在避免庞大计算开销的同时增大感受野。

基于规范化的注意力机制(Normalization-basedAttention Module,NAM)[6],利用权重的贡献因子来改善注意力机制的性能。NAM使用批归一化的比例因子来表示权重的重要性,可有效避免使用上述SE、CBAM 模块中的全连接层和卷积层。具体来讲,NAM采用CBAM的模块集成,重新设计了通道和空间注意力子模块,然后将NAM模块嵌入每个网络块的末端[9]。

2.3 损失函数

目标检测领域常用的目标框回归损失函数有IoULoss(Intersection over Union,交并比)、GIoU Loss(GeneralizedIoU)、DIoU Loss(Distance IoU)、CIoU Loss(CompleteIoU)等,IoU 表示目标真实框与预测框的交集与两者并集之比。IoU 的损失函数数学表达式如公式(2)所示。

3 基于YOLOv5 的鹿食植物细胞识别方法

本文将SE、CBAM、CA、NAM 这4 种注意力模块分别引入图3所示的CSP1-2和CSP1-3当中,并且比较其性能的提升程度,最终选择CBAM模块。并且在考虑预测框回归的速度和精度综合的情况下,该实验在输出层选择用DIoU_Loss 作为边界框回归损失函数,加快边界框回归的速率以及提高定位精度,加快对弱小目标的检测速率。

表1 中YOLOv5s 代表使用YOLOv5s 模型获得的实验数据,YOLOv5s_CBAM 代表本文提出的模型在实验中获得的实验数据,根据数据不难看出,在草木、灌木、乔木、针叶四大类别中,本文提出的模型对比原始模型精确度与召回率均有提升,对于所有类别而言,本文提出的YOLOv5s_CBAM模型精确率提升了18.1%,召回率提升了11.1%,mAP@.5 提升了3.4%,mAP@.5:.95 提升了5.1%,YOLOv5s_CBAM 模型在各个性能评估指标的上升说明了在主干网络之后CBAM注意力机制后,有效增强了特征信息。

4 結语

对鹿种群数量进行研究,有助于了解鹿的种群生态和生活史,也有利于动物的管理和保护。记录濒危物种在一段时间内觅食植物种类的变化,有助于保护区或管理人员对该物种的保护措施做出相应的调整。

本文首先建立了基本的鹿食植物叶片图像特征库与鹿食植物表皮碎片图像特征库。而后提出了一种鹿食植物识别方法,该方法结合鹿食植物细胞分类特征,针对鹿食植物细胞数据样本少,类间差别小与目标尺寸小导致的检测精度低、效果不佳等问题该方法在原有YOLOv5s 模型的基础上,加入了注意力机制模块与DIoU_Loss损失函数模块,从而提高了模型的检测效率。

猜你喜欢
注意力机制图像识别人工智能
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
基于深度学习的问题回答技术研究
2019:人工智能
图像识别在物联网上的应用
人工智能与就业
图像识别在水质检测中的应用
基于LSTM?Attention神经网络的文本特征提取方法
基于注意力机制的双向LSTM模型在中文商品评论情感分类中的研究
InsunKBQA:一个基于知识库的问答系统