基于改进版YOLOv8的茶叶嫩芽识别

2024-06-26 07:57郭振华谢学浩王森珑徐洋帆
电脑知识与技术 2024年14期
关键词:目标检测深度学习

郭振华 谢学浩 王森珑 徐洋帆

摘要:中国茶文化历史悠久。茶带给我们的不仅有底蕴丰厚的茶文化,还有巨大的经济效益。目前我国茶叶的种植面积达257.9万公顷,茶叶的产量达189万吨。这么大种植面积和产量,意味着传统的采集方式不能满足需求,效率低下。随着科技的发展和国家政策对农业的扶持力度加大,我国现代化农业不断提升。茶叶的生产也应该更加科技化,文章就茶叶嫩芽识别,提出一种改进型YOLOv8,后续可通过润和AL Camera开发套件用此模型进行茶叶嫩芽的图像采集识别。改进后的YOLOv8识别准确率大有提升和效率都大有提升,为新型茶叶采集技术中茶叶嫩芽识别部分提供技术参考。

关键词:YOLOv8;茶叶嫩芽识别;深度学习;目标检测

中图分类号:TP312 文献标识码:A

文章编号:1009-3044(2024)14-0023-03 开放科学(资源服务)标识码(OSID) :

0 引言

我们国家是茶叶种植大国。茶叶种植面积大,茶叶产量也大。目前我国的茶叶采摘60% 要靠人工完成,效率低下,对于茶叶产业这种季节性密集劳动不太友好。而传统的采茶机,虽然效率有所提升,但是它是一种无差别的采摘,将老叶和我们需要的嫩芽采摘下来。这样的采摘方式仍然需要人工分拣出嫩芽,而且容易损伤嫩芽[1]。如果我们想要实现智能化采摘茶叶,第一步就是要解决茶叶嫩芽的识别问题。

本文就茶叶嫩芽识别,提出了一种基于YOLOv8 改进的模型用于茶叶嫩芽的识别方法。通过增加注意力机制对YOLOv8进行改进,使得其对茶叶嫩芽有更好的识别效果。通过对数据训练得出的结果与原模型进行效果比对,从而完善改进版YOLOv8模型,使得其准确率(precision,P) ,召回率(recall,R) ,平均精度值(mean average precision,mAP) 高于原模型。为智能采茶机中的茶叶嫩芽提供了技术参考。

1 数据集

1.1 图像采集

茶叶嫩芽数据集原始图像采集地点为江西省景德镇市浮梁县庄湾乡寒溪村寒溪茶山,采集对象为浮梁茶,茶树均单拢栽种,长势较好。图像采集设备为松下相机,数据图片的分辨率原本是3 648×2 736像素,以.JPG格式保存。

考虑到采摘茶叶的环境,在对茶叶嫩芽进行图像采集时,校级与茶树的距离为 10~50cm,拍摄角度大致在平行视角和俯视视角之间,即与竖直方向呈 0°~90°夹角。原始图像均是茶园环境拍摄,以茶叶嫩芽为前景,嫩芽以外的信息为背景。共采集原始图像1085幅。

1.2 创建数据集

利用LabelImg 对采集到的茶叶原始图像中的嫩芽部分进行人工标记,以得图像中目标嫩芽的特征信息,并以.txt文件形式保存。数据集按7:2:1分成训练数据集、验证数据集、测试数据集三部分。

2 算法

2.1 YOLOv8

本次研究使用YOLOv8为基础模型,将目标检测问题转化为一个回归问题,通过一次前向传播即可同时检测图像中的多个目标。相比传统的目标检测算法,YOLOv8具有更快的速度和较高的准确性。

YOLOv8的网络结构基于Darknet-53,这是一个由53层卷积神经网络构成的骨干网络。在Darknet-53的基础上,YOLOv8添加了额外的卷积层和上采样层来构建检测头部,以便检测不同尺度的目标[2]。

Yolov8可扩展性强,其采用了模块化设计,便于实验时对其进行扩展和修改,使其改进后,效果更佳。

2.2 改进版YOLOv8

YOLOv8的改进方法有很多,如增加注意力机制、更换卷积或者block、head等,本次使用是针对茶园里茶叶嫩芽的识别。所以我们选用增加注意力机制的方式,对YOLOv8进行改进,帮助模型更好的关注有繁杂环境图像中的茶叶嫩芽部分,从而提高模型识别的准确率。

本次试验是使用CBAM增加注意力机制,CBAMS 是由通道注意力模块(CAM) 和空间注意力模块(SAM) 构成的通过结合CAM和SAM,CBAM模块可以自适应地重新校准特征图中的通道和空间信息,使网络能够专注于相关茶叶嫩芽的特征并抑制无关特征[3]。这种注意力机制有助于提高网络对茶叶嫩芽的判别能力,并增强其捕捉细节的能力。

3 训练与测试

3.1 试验平台

本实验的计算机工作站配置为 Intel Core i5-12400h 处理器,主频2.50GHz,运行内存为 16GB,并配有RTX 3060显卡。试验在Windows 11 操作系统上进行,采用 PyTorch 深度学习框架对模型进行搭建和改进。数据在Loss 曲线收敛后对各算法进行分析。

3.2 参数设置

训练模型时,将训练集图像分辨率调整为 640×640 像素,训练1 000epoch,批次大小设为16,初始学习率为 0.01,动量参数和权值衰减参数分别设置为0.937和0.000 5。验证模型时,置信度设置为0.6。

3.3 评估指标

本次试验采用准确率 P (Precision,%)、召回率 R(Recall,%)、平均精度 XmAP(mean average precision,%)三项指标之间的关系来衡量模型预测的准确度。[4]准确率P(Precision)=TP/(TP+FP)在预测是Positive所有结果中,预测正确的比重召回率recall=TP/(TP+FN),在真实值为Positive 的所有结果中,预测正确的比重。XmAP是用Precision和Recall作为两轴作图后围成的面积。计算公式:XmAP=∫P(R)d(R)[5]。

TP:True Positive,即正确预测,真实为0,预测也为0。FN:False Negative即错误预测,真实为0,预测为1。FP:False Positive即错误预测,真实为1,预测为0。TN:True Negative即正确预测,真实为1,预测也为1。

4 结果与分析

4.1 YOLOv8原版结果

图1(a)为准确率与召回率的调和平均数曲线图(以下称F1曲线图),F1曲线曲线顶部宽度为0.62,顶部高度约为0.7。其中F1=2(precision×recall)/(preci?sion + recall),即F1 =2TP/(2TP + FN + FP)。

图1(b) 为准确率与置信度的关系图(以下称P曲线图),当置信度增大时,类别检测得越准确。

图1(c) 为准确率与召回率的关系图(以下简称PR 曲线图),PR曲线与X轴和Y轴围成的面积称作均值平均精度(即mAP,Mean A verage Precision的缩写)。

所以有XmAP=XmAP=∫P(R)d(R)。如图1(c)所示,XmAP=0.721,说明PR曲线与X轴和Y轴围成的面积趋近于1。

4.2 Y0LOv8改进版结果

图2(a) 为改进版YOLOv8准确率与召回率的调和平均数曲线图,F1 曲线顶部宽度为0.68,顶部高度为0.71。

图2(b) 为改进版的置信度阈值 - 准确率曲线图(P 曲线图),准确率一直都在0.78 以上,也就是说confidence很大,这说明可以容易判断嫩芽,但是会漏检一些置信度低的类别。

图2(c) 为召回率 - 准确率曲线图(PR曲线图),PR曲线与坐标轴围成的面XmAP=0.760。即面积接近1。

定位损失box loss:预测框与标定框之间的误差GloU),越小定位得越准。置信度损失obi loss:计算网络的置信度,越小判定为目标的能力越准。分类损失cls loss:计算锚框与对应的标定分类是否正确,越小分类得越准。如图3所示,训练和验证的loss曲线均趋于拟合,说明改进后模型性能较好。

4.3 与原模型结果对比

将原版YOLOv8和改进版YOLOv8进行比较,由上表可知两个版本的准确率与召回率的调和平均数,在宽度L 上,原版为0.62,改进版为0.68,改进版的YOLOv8比原版多0.06,在高度W上,原版为0.7,改进版为0.71,改进版的YOLOv8比原版多0.01。也就是说改进版的YOLOv8有更好的准确率与召回率的调和平均数,相同情况下,改进版YOLOv8能取得更好的F1分数。

均值平均精度,原版YOLOv8为XmAP=0.721,改进版为XmAP=0.760。改进版YOLOv8 比原版高了0.39。且由图1(c)和图2(c)可以看出,改进版的YO?LOv8波动不大,而原版的PR曲线与改进版相比,波动较大。表示改进版的训练效果比原版好。

5 结论

本研究以YOLOv8为原型,对其进行改进,增加注意力机制。以用于茶园在用智能采茶机,采取茶叶时对茶叶嫩芽的识别。本研究根据茶园环境进行试验,在实际情况下对茶叶嫩芽的图片进行采集、训练、验证和测试。两个版本得到的F1分数均较好,改进版YOLOv8相对较高。两个版本的均值平均精度也都较高,原版和改进版的均值平均精度分别为0.721 和0.760。改进版本的均值平均精度相较于原版高出了0.39,且PR曲线比原版波动较小,也就是说改进后的YOLOv8,精度和效果比原版要好。改进后的YOVOv8 性能有所提升,在自然茶园环境下,对茶叶嫩芽的识别效果有了一定的提升,可以为智能采茶机在茶叶嫩芽识别领域的研发中提供技术参考。

参考文献:

[1] 程永辉,黄彪,周远书,等.茶叶识别技术研究现状[J].计算机科学与应用,2021(2):461-466.

[2] 雷帮军,余翱,余快.基于YOLOv8s改进的小目标检测算法[J].无线电工程,2024,54(4):857-870.

[3] 涂万,于红,张鹏,等.基于通道非降维与空间协调注意力的改进YOLOv8养殖鱼群检测[J].大连海洋大学学报,2023,38(4):717-725.

[4] 胡和平,吴明晖,洪孔林,等.基于改进YOLOv5s的茶叶嫩芽分级识别方法[J].江西农业大学学报,2023,45(5):1261-1272.

[5] 王梦妮,顾寄南,王化佳,等.基于改进YOLOv5s模型的茶叶嫩芽识别方法[J].农业工程学报,2023,39(12):150-157.

【通联编辑:唐一东】

基金项目:国家级大学生创新创业训练项目:采橘说——人工智能加AR 助力研学旅行(项目编号:202210408033X)

猜你喜欢
目标检测深度学习
视频中目标检测算法研究
行为识别中的人体运动目标检测方法
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现
移动机器人图像目标识别
基于背景建模法的运动目标检测