李尚平,李向辉,张 可,李凯华,袁泓磊,黄宗晓
改进YOLOv3网络提高甘蔗茎节实时动态识别效率
李尚平1,李向辉1,张 可2,李凯华1,袁泓磊1,黄宗晓2
(1. 广西民族大学信息科学与工程学院,南宁 530006; 2. 广西大学机械学院,南宁 530004)
为推广甘蔗预切种良种、良法种植技术,结合甘蔗预切种智能横向切种机的开发,实现甘蔗切种装置对蔗种特征的连续、动态智能识别。该文通过甘蔗切种机黑箱部分内置的摄像机连续、动态采集整根甘蔗表面数据,采用改进的YOLOv3网络,建立智能识别卷积神经网络模型,通过拍摄装置内部的摄像头对输入识别系统的整根甘蔗的茎节图像特征进行实时定位与识别,并比对识别信息,及时更新茎节数据,识别、标记出茎节位置,再经过数据处理得到实时的茎节信息,输送到多刀数控切割台进行实时切割。经过训练及试验测试,结果表明:经过训练及试验测试,模型对茎节的识别的准确率为96.89%,召回率为90.64%,识别平均精度为90.38%,平均识别时间为28.7 ms,与原始网络相比平均精确度提升2.26个百分点,准确率降低0.61个百分点,召回率提高2.33个百分点,识别时间缩短22.8 ms,实现了甘蔗蔗种的连续、实时动态识别,为甘蔗预切种智能横向切种机的开发提供数据基础。
卷积神经网络;机器视觉;模型;YOLOv3网络;甘蔗茎节;识别定位
甘蔗作为一种重要的热带经济作物,与中国国家发展,人民生活息息相关。然而甘蔗种植生产仍然面临诸多问题,目前中国使用的甘蔗种植机主要为实时切种式甘蔗种植机,该机型存在使用劳动强度大、播种不均匀、耗蔗种多等问题[1]。近年来,先进的种植技术提出了甘蔗预切种的良法种植技术,即利用优良甘蔗品种按要求切段,经过蔗种筛选,消毒处理等后再种植。该方法便于机械化种植,具有出芽率高、用种少、甘蔗产量高以及种植成本低的特点。这种方法首先需要进行甘蔗的预切种,基于这个生产需求,开发甘蔗预切种智能横向切种机,需要对甘蔗茎节等特征进行快速、有效地识别定位,并能够在短时间内输出结果,以便进行甘蔗蔗种的工厂化生产。
目前针对甘蔗的茎节识别工作还停留在单根或者基本的图像处理与识别方面,对于整根甘蔗图像进行快速处理的方法还很缺乏。如黄亦其等[2]研究了基于局部均值的甘蔗茎节识别方法,通过对图像进行均值滤波,在HSV颜色空间的分量上进行图像分割等处理,然后在G-B色差分量图上以一定步长沿中心横向移动,计算平均灰度值,从而找到最大灰度值对应位置确定为茎节位置,该方法只针对一段的甘蔗进行处理,并且结果受选定的步长与固定模板宽度影响,识别率为90%,时间为0.48 s。陆尚平等[3]探讨了基于机器视觉的甘蔗茎节特征提取与识别方法,对甘蔗蔗段的图像的HSV颜色空间中分量与分量图像进行不同处理,然后将2个图像进行与运算合成,对合成图划分区域并提取不同特征,之后使用支持向量机的方法处理甘蔗茎节与节间部分信息,获取甘蔗茎节位置,茎节数与位置的平均识别率分别为94.11%与91.52%,单幅图像算法执行时间为0.76 s,该方法仍没有针对整根甘蔗的处理。张卫正等[4]基于图像处理的甘蔗茎节识别与定位,通过背景转换、中值滤波并通过阈值获取甘蔗二值化图像,之后采用图像分割,图像翻转以及计算图像中像素值的方法,得到茎节位置,处理的茎节图像数据为单节且没有处理整根,时间为0.3 s。张卫正等[5]基于高光谱成像技术进行甘蔗茎节识别与定位方法研究,通过图像采集装置上方的光谱仪进行数据收集,提取茎节特征波段建立模型,对茎节进行识别,但是识别范围仅限于甘蔗茎节周围区域,并不能识别整根。韦相贵[6]也探讨基于智能算法的甘蔗定位切割方法,通过改进的粒子群算法优化支持向量机模型,对甘蔗图像进行识别,模型可以对图片进行分段识别。王盛等[7]进行基于计算机视觉识别技术的甘蔗种植机械化研究,通过模糊聚类算法对茎节进行识别定位,识别率为80%。张东红等基于图像处理的甘蔗茎节识别与蔗芽检测[8],通过图像处理得到茎节位置,多节识别率80%,识别时间为0.507 s。
目前,基于甘蔗茎节识别研究的情况[9-11]和甘蔗茎节识别算法还不能实现甘蔗切种的智能化及机械化,以及满足日常生产需求。卷积神经网络[12-17]已被证明在图像识别和分类等领域非常有效,不仅在日常生活中的人脸识别[18],车牌识别[19]等方面效果卓著[20],而且在农业领域,已开始应用在植物叶片分类[21]、果实识别[22-24]、动物个体识别[25-26]以及农作物病虫害识别[27-29]等方面,为卷积神经网络在甘蔗表面特征的识别提供了理论参考。
根据自主开发的甘蔗切种机的切种需求,需对整根甘蔗进行特征快速识别,本文提出使用改进的YOLOv3网络对甘蔗特征识别定位处理。通过网络训练建立甘蔗茎节的识别模型,在原始网络识别定位准确率与速度的基础上,进一步提高识别检测速度以及识别率,对切种机拍摄装置采集的数据进行实时处理,对动态传输的传送链上的甘蔗进行茎节特征信息识别定位,并把实际数据传输给后续的切种装置,进行实时切种,对整根甘蔗进行快速实时地识别处理,结合课题组设计的智能甘蔗切种机系统其他部分,使整个切种过程实现机械化、智能化,以期提高甘蔗切种机生产效率,减少人工的劳动强度与时间,为甘蔗预切种的工厂化生产提供研究基础。
YOLOv3网络是J Redmon,A Farhadi于2018年提出的一种物体识别定位算法YOLO的改进版本[30]。比YOLOv2网络[31]更加准确,与其他网络[32-34]相比,YOLOv3网络具有识别定位速度更快,识别率高等特点。YOLOv3网络通过不同尺度的特征图计算损失函数,分别检测不同大小的目标。损失函数如式(1)所示。
式中为茎节真实预测框置信度,^表示模型预测值,为模型输出,为模型输出总数,为样本,为样本总数,、为预测框的宽与高,、为预测框中心点坐标,表示茎节置信度,为类别即茎节,为忽略的预测框。损失函数第一部分对预测框的中心坐标进行计算,优化、的预测值;第二部分计算优化预测框的宽与高;第三部分优化茎节置信度,并减少计算量;第四部分计算类别损失,损失函数计算过程中使用二元交叉熵,用表示。损失函数在不同尺度的特征图上计算损失,并在模型训练过程中使用了ADAM算法[35]优化网络损失函数并对参数进行更新。
鉴于原始YOLOv3网络层数较多,为进一步提高网络识别定位速度,本文在原有网络基础上做出修改,减少网络层数,改变最后输出层的特征图尺寸,并减少anchors数量,由9个减少为6个,达到提升识别速度的效果。具体方式通过减少残差结构,构建改进网络,网络主要结构如图1所示,将原始网络中残差结构3与残差结构4的残差块数量减为原来的1/4,并删减掉残差结构5,网络共减少70层。在正向传播过程中,padding模式中的same模式通过设置卷积步长为1,使得进行卷积操作后的输出与输入尺寸相同,valid表示进行卷积操作时对输入数据不进行填充,通过与卷积操作的步长共同作用,使得运算后特征图维度减半。模型中各卷积层使用L2参数正则化对权重矩阵进行正则化,并在每个批次的训练上对前一层的输出进行规范化,使其数据均值接近0,标准差为1,从而达到加速收敛、控制过拟合、降低网络对初始权重不敏感并允许网络使用较大的学习率的目的,并使用LeakyRelu函数作为激活函数。为了扩大网络对图像特征的提取数量,网络通过跳层将网络早期特征数据与多次降维后采集的特征数据进行连接。数据经过4次步长为2的卷积层降维后,通过卷积运算得到第一个输出,特征图尺寸为26×26,将第一个输出值前的卷积运算结果通过上采样与50层的输出结合,经过卷积运算得到特征图尺寸为52×52的输出,之后将第二个输出值前的卷积运算结果通过上采样与32层的输出结合,经过卷积运算得到第三个输出,特征图尺寸为104×104。网络在最后输出层使用linear函数作为激活函数。改进的YOLOv3网络正向传播过程如图2所示。
图1 改进的YOLOv3网络主要结构
图2 改进的YOLOv3网络正向传播过程
样本选取广西甘蔗生产协同创新中心广西大学扶绥甘蔗育种基地出产的甘蔗良种,甘蔗生长期约为6~8个月,甘蔗平均直径为30 mm,共3批,每批约180根甘蔗。在课题组自主开发的甘蔗预切种式智能横向切种机的拍摄装置下进行图像采集。
本课题组自主设计制作的甘蔗预切种智能横向切种机整体结构如图3a所示,切种机整体由4部分构成,图中显示其中3部分,分别为切种机液压装置,切种机切种装置以及切种机拍摄装置。拍摄装置对甘蔗图像进行采集,如图3b所示,装置内设有链式甘蔗蔗种连续传送机构,传送机构由一台57步进电机驱动,甘蔗通过传送系统可连续、依次横向送入图像采集系统进行图像采集,传送系统由步进电机驱动、PLC控制,传送速度在0.01~0.5 m/s范围内,可根据需要连续调整送进速度。
图3 试验平台
根据传送速度对甘蔗图像清晰度影响的统计试验,如果传送速度太低,影响效率,如速度太快,会影响图像的清晰度。在0.1 m/s的蔗种传送速度、以及平均光照度在430.7 lx时,系统具有最好的识别精度,因此本试验采用传送速度为0.1 m/s。通过内置于视频采集装置上方的摄像头采集视频数据,摄像头在传送链所在平面上方约1.5 m处,使用RMONCAM1080P摄像头G200无畸变型,采集视频图像尺寸为1 920×1 080像素,视频帧率为20 帧/s。将采集的视频图像数据截图并进行标记,生成模型训练所需的训练集、验证集与测试集。试验采用拍摄装置采集的整根的甘蔗图片650张,茎节数量约12 000个,分别作为训练集450张,验证集50张,测试集150张,训练集,验证集与测试集图片分辨率为416×416像素。
本文处理平台为台式机电脑,处理器为AMD2700X,主频为3.7 GHz,8 G内存,显卡GeForce GTX 1060 6 G。运行环境为Windows 10,程序使用python编写,调用Keras、OpenCV等库并在Spyder上运行。
通过构建不同结构的改进YOLOv3网络,将训练用数据集输入网络进行训练,训练过程每6张图片作为一个批次输入网络,训练过程根据验证集数据保留最优模型,训练完成后通过测试集进行模型性能测试,与原始网络测试结果进行对比,选取效果最优的模型作为甘蔗茎节识别模型,并对模型识别情况分析,通过对识别后的数据分析处理,进一步完善改进的YOLOv3的甘蔗茎节动态识别方法。试验流程如图4所示。
图4 试验流程图
在机器学习领域,模型性能评估可以根据模型的准确率、召回率以及模型的平均精确度AP进行评价。AP值为准确率以及召回率构成的P-R曲线的面积,准确率为测试模型中预测的实际正样本与预测的正样本(包括被错误预测为正样本的负样本)的比值,表示模型的预测结果中真实正样本的比例;而召回率为模型预测的真实正样本数量与样本中的真实正样本数量的比值,表示模型预测的正样本占实际正样本数量的比例,具体计算如式(2)、(3)以及(4)所示,其中:TP为被检测到的正样本,即被正确检测到的茎节样本数;TN为被检测到的负样本数,即没有框选的甘蔗其他部分;FN为被检测为负样本的正样本数,即没有被检测的茎节数;FP为被检测为正样本的负样本数,即被检测为茎节的甘蔗其他区域。为精确率下降点个数。通过准确率、召回率以及AP值可以准确表示模型的性能。
将验证集与训练集输入网络中进行训练,在对网络进行训练过程中,经过4 000次迭代,得到训练集与验证集损失函数下降曲线,如图5所示。从图中可以看出在网络迭代训练过程中,500次迭代附近,验证集损失函数变化开始放缓,在2 000次迭代以后,训练集损失函数继续呈现下降趋势,而验证集已不再下降,在45左右浮动,表明在2 000次迭代后,网络对于训练数据出现过拟合现象,从而确定网络训练迭代次数为2 000次。训练过程中网络根据验证集损失函数保留最优权重等参数。
图5 甘蔗茎节识别损失函数曲线
根据实际切种需要,为了能够获取切刀位置,需对茎节完成定位,本文通过从150张测试图片中随机选取10组100张测试图片进行测试计算,图片包含多种光照强度以及甘蔗表面泥土等因素的照片。测试茎节平均每组1 734个,改进模型识别茎节目标平均每组1 622个,其中50个目标为FP,1 571目标为TP,原始模型识别茎节目标平均每组1 570个,其中39个目标为FP,1 531目标为TP。模型的测试性能可由AP值,准确率值以及召回率值表示。由于值与值之间的关系当一个值变大时,另一个将变小,本文要得到两个的平衡点,所以根据实际切种需求。通过设置不同的score值与IoU值测试结束后得到的最优模型,10组模型性能试验平均值对比如表1所示,平均AP值为90.38%,平均值为96.89%,平均值为90.64%,平均识别时间为28.7 ms。相对于原始网络,平均AP提高2.26个百分点,平均值降低0.61个百分点,平均值提高2.33个百分点,识别时间减少22.8 ms。
表1 2种模型测试对比
各种茎节识别方法对比如表2所示。通过试验得到的数据与其他茎节识别方法的比较,本文方法具有速度快,平均精确度高的特点,在茎节每幅图片中能识别整根茎节特征,并且完成图片中所有茎节的识别用时最短。试验环境为实际切种条件下,具有较高的实用性。
表2 甘蔗茎节识别方法对比
经过10组测试试验,平均精确度AP为90.38%,平均每组1 734个目标,其中1 571个茎节目标被识别出来,163个茎节没有识别出来。试验结果如图6所示。测试图片中大方框为模型标记的茎节位置,小方框为人工标记的茎节位置,框内有斜线的为模型预测的错误茎节位置。通过对测试图片的分析,模型测试结果如图6a所示;未识别的茎节,即FN的情况,用圆圈表示,如图6b所示;识别率为90.38%的原因中,一是部分茎节没有被识别出来,即FN,数量占大部分;二是因为茎节其他部分被识别为茎节,并且主要为网络在茎节附近区域的识别错误,即FP,如图6c所示。
对于以上情况,在实际切种过程中,识别定位系统通过对实时视频数据进行处理,对单根甘蔗跟踪识别定位,更新茎节信息以减少实际识别过程中的FN,提高识别率;对于FP的情况,在每根甘蔗识别完成后,对茎节数据进行整合,根据甘蔗生长情况,本文根据预测框的坐标信息设置阈值为5像素值,当两个茎节预测框中心点之间的距离小于阈值时,比对茎节预测框的概率值,舍弃小的茎节预测框,从而达到减小FP的目的,通过10组试验,准确率提高1%。茎节之间距离计算公式为式(5),其中,c为相邻茎节预测框之间距离,u、u分别为2个相邻茎节预测框中心点横坐标,为预测框总数。
c=u−u(1≤<≤)(5)
图6 识别结果分析
根据识别定位网络的性质,在数据输入网络前,输入图片都被转换为固定尺寸,整个模型对图片的识别处理时间主要由2部分构成,一部分是模型对输入图片的尺寸处理时间,另一部分为网络模型对图片的识别处理时间。其中网络模型对图片的识别处理时间恒定,只与网络规模有关,并不受输入图片尺寸影响。通过对1 000张图片试验测试,改进网络在图片处理速度上明显高于原始网络,时间缩短约23 ms。在实际切种过程中,切刀只能处理1根甘蔗信息,传送链上同时收集的多根甘蔗数据没有使用,因此根据实际需要,在保证识别的情况下,对采集的图像数据,保持横向尺寸,截取图像中间部分区域。通过设置输入图片尺寸从1 920×149像素逐渐增大到1 920×1 080像素,进行尺寸处理时间的统计,结果如图7所示,横坐标为图片纵向尺寸,纵坐标为模型缩放图像的处理时间,随着输入图像尺寸的增加而增大,时间由7 ms逐渐增大到35 ms。为了提高识别定位系统整体处理速度,采用对输入图像进行预处理的方法,裁剪图像中间部分,使其尺寸为1 920×150像素,可以使尺寸变化时间减少约28 ms,达到提升整体处理速度目的。
图7 输入图片尺寸与识别系统处理时间的关系
本文提出了基于改进的YOLOv3网络的甘蔗茎节特征识别方法。本方法通过减少中间卷积层构成的残差结构数量,改变输出特征图尺寸以及减少anchors数量,对原始网络进行改进,在甘蔗茎节特征识别速度以及识别率方面得到提高,并通过对改进网络的输出数据进行分析计算,进一步提高方法的准确率。
1)通过试验测试,基于改进的YOLOv3网络的茎节定位识别模型平均精确度达到90.38%,平均识别时间28.7 ms,相对于原始网络,时间缩短22.8 ms,平均精确度提高2.26个百分点,表明改进的YOLOv3网络可以应用于实际的甘蔗切种机中,实现实时快速准确地识别与定位。
2)根据试验情况,在网络输出后增加数据处理部分,整合模型输出数据,根据甘蔗生长情况,对甘蔗茎节预测框中心坐标进行计算,剔除错误预测框,使得准确率值提高1%。
3)为进一步提高切种机整体处理速度,将摄像装置拍摄的视频数据,通过预处理到1 920×150像素,使得整体处理时间缩短约28 ms。
[1]刘庆庭,莫建霖,李廷化,等. 我国甘蔗种植机技术现状及存在的关键技术问题[J]. 甘蔗糖业,2011(5):52-58.
[2]黄亦其,黄体森,黄媚章,等. 基于局部均值的甘蔗茎节识别[J]. 中国农机化学报,2017,38(2):76-80.
Huang Yiqi, Huang Tisen, Huang Meizhang, et al. Recognition of sugarcane nodes based on local mean[J]. Journal of Chinese Agricultural Mechanization, 2017, 38(2): 76-80. (in Chinese with English abstract)
[3]陆尚平,文友先,葛维,等.基于机器视觉的甘蔗茎节特征提取与识别[J]. 农业机械学报,2010,41(10):190-194.
Lu Shangping, Wen Youxian, Ge Wei, et al. Recognition and features extraction of sugarcane nodes based on machine vision[J]. Transactions of the Chinese Society for Agricultural Machinery, 2010, 41(10): 190-194. (in Chinese with English abstract)
[4]张卫正,董寿银,齐晓祥,等.基于图像处理的甘蔗茎节识别与定位[J]. 农机化研究,2016,38(4):217-221,257.
Zhang Weizheng, Dong Shouyin, Qi Xiaoxiang, et al. The identification and location of sugarcane internode based on image processing[J]. Journal of Agricultural Mechanization Research, 2016, 38(4): 217-221, 257. (in Chinese with English abstract)
[5]张卫正,张伟伟,张焕龙,等.基于高光谱成像技术的甘蔗茎节识别与定位方法研究[J]. 轻工学报,2017,32(5):95-102.
Zhang Weizheng, Zhang Weiwei, Zhang Huanlong, et al. Research on identification and location method of sugarcane node based on hyperspectral imaging technology[J]. Journal of Light Industry, 2017, 32(5): 95-102. (in Chinese with English abstract)
[6]韦相贵.基于智能算法的甘蔗定位切割方法[J]. 江苏农业科学,2016,44(4):394-398.
[7]王盛,李明.基于计算机视觉识别技术的甘蔗种植机械化研究[J]. 农机化研究,2017,39(6):198-201.
Wang Sheng, Li Ming. Mechanization of sugarcane planting based on computer vision identification technology[J]. Journal of Agricultural Mechanization Research, 2017, 39(6): 198-201. (in Chinese with English abstract)
[8]张东红,吴玉秀,陈晨.基于图像处理的甘蔗茎节识别与蔗芽检测[J]. 洛阳理工学院学报:自然科学版,2019,29(2):67-72.
Zhang Donghong, Wu Yuxiu, Chen Chen. Sugarcane stem section identification and sugarcane bud detection based on image processing[J]. Journal of Luoyang Institute of Science and Technology: Natural Science Edition, 2019, 29(2): 67-72. (in Chinese with English abstract)
[9]陆尚平. 基于机器视觉的甘蔗茎节识别与蔗芽检测研究[D]. 武汉:华中农业大学,2011.
Lu Shangping. Research on Sugarcane Internodes and Sugarcane Buds Identification Based on Machina Vision[D]. Wuhai: Huazhong Agricultural University, 2011. (in Chinese with English abstract)
[10]张圆圆,何永玲,王跃飞,等.颜色空间图像处理技术在蔗节识别上的应用[J]. 农机化研究,2020,42(1):231-236.
Zhang Yuanyuan, He Yongling, Wang Yuefei, et al. Application of color space image processing technology in sugarcane node recognition[J]. Journal of Agricultural Mechanization Research, 2020, 42(1): 231-236. (in Chinese with English abstract)
[11]石昌友,王美丽,刘欣然,等.基于机器视觉的不同类型甘蔗茎节识别[J]. 计算机应用,2019,39(4):1208-1213.
Shi Changyou, Wang Meili, Liu Xinran, et al. Node recognition for different types of sugarcanes based on machine vision[J]. Journal of Computer Applications, 2019, 39(4): 1208-1213. (in Chinese with English abstract)
[12]Lecun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278-2324.
[13]Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[C]// International Conference on Neural Information Processing Systems. 2012.
[14]Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition[R]. arXiv: 1409.1556, 2014.
[15]He K, Zhang X, Ren S, et al. Deep residual learning for image recognition[C]//Proceedings of the IEEE conference on computer vision and pattern recognition, 2016: 770—778.
[16]Ren S, He K, Girshick R, et al. Faster R-CNN: Towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2015, 39(6): 1137-1149.
[17]Redmon J, Divvala S, Girshick R, et al. You only look once: unified, real-time object detection[R]. arXiv: 1506.02640, 2015.
[18]Xiong C, Zhao X, Tang D, et al. Conditional convolutional neural network for modality-aware face recognition[C]// 2015 IEEE International Conference on Computer Vision (ICCV). IEEE Computer Society, 2015.
[19]Zhao Z, Yang S, Ma X. Chinese license plate recognition using a convolutional neural network[C]// Computational Intelligence and Industrial Application, 2008. PACIIA '08. Pacific-Asia Workshop on. IEEE, 2009.
[20]余永维,殷国富,殷鹰,等. 基于深度学习网络的射线图像缺陷识别方法[J]. 仪器仪表学报,2014,35(9):2012-2019.
Yu Yongwei, Yin Guofu, Yin Ying, et al. Defect recognition for radiographic image based on deep learning network[J]. Journal of Instrumentation, 2014, 35(9): 2012-2019. (in Chinese with English abstract)
[21]龚丁禧,曹长荣. 基于卷积神经网络的植物叶片分类[J].计算机与现代化,2014(4):12-15,19.
Gong Dingxi, Cao Changrong. Plant leaf classification based on CNN[J]. Computer and Modernization, 2014(4): 12-15, 19. (in Chinese with English abstract)
[22]薛月菊,黄宁,涂淑琴,等. 未成熟芒果的改进YOLOv2识别方法[J]. 农业工程学报,2018,34(7):173-179.
Xue Yueju, Huang Ning, Tu Shuqin, et al. Immature mango detection based on improved YOLOv2[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(7): 173-179. (in Chinese with English abstract)
[23]傅隆生,冯亚利,Elkamil Tola,等.基于卷积神经网络的田间多簇猕猴桃图像识别方法[J]. 农业工程学报,2018,34(2):205-211.
Fu Longsheng, Feng Yali, Elkamil Tola, et al. Image recognition method of multi-cluster kiwifruit in field based on convolutional neural networks[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(2): 205-211. (in Chinese with English abstract)
[24]赵德安,吴任迪,刘晓洋,等.基于YOLO深度卷积神经网络的复杂背景下机器人采摘苹果定位[J]. 农业工程学报,2019,35(3):164-173.
Zhao Dean, Wu Rendi, Liu Xiaoyang, et al. Apple positioning based on YOLO deep convolutional neural network for picking robot in complex background[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(3): 164-173. (in Chinese with English abstract)
[25]胡志伟,杨华,娄甜田,等.基于全卷积网络的生猪轮廓提取[J]. 华南农业大学学报,2018,39(6):111-119.
Hu Zhiwei, Yang Hua, Lou Tiantian, et al. Extraction of pig contour based on fully convolutional networks[J]. Journal of South China Agricultural University, 2018, 39(6): 111-119. (in Chinese with English abstract)
[26]赵凯旋,何东健.基于卷积神经网络的奶牛个体身份识别方法[J]. 农业工程学报,2015,31(5):181-187.
Zhao Kaixuan, He Dongjian. Recognition of individual dairy cattle based on convolutional neural networks[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(5): 181-187. (in Chinese with English abstract)
[27]杨国国,鲍一丹,刘子毅. 基于图像显著性分析与卷积神经网络的茶园害虫定位与识别[J]. 农业工程学报,2017,33(6):156-162.
Yang Guoguo, Bao Yidan, Liu Ziyi. Localization and recognition of pests in tea plantation based on image saliency analysis and convolutional neural network[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(6): 156-162. (in Chinese with English abstract)
[28]刘媛. 基于深度学习的葡萄叶片病害识别方法研究[D]. 兰州:甘肃农业大学,2018.
Liu Yuan. Research on Methods for Grape Leaf Disease Recognition Based on Deep Learning[D]. Lanzhou: Gansu Agricultural University, 2018. (in Chinese with English abstract)
[29]张建华,孔繁涛,吴建寨,等.基于改进VGG卷积神经网络的棉花病害识别模型[J]. 中国农业大学学报,2018,23(11):161-171.
Zhang Jianhua, Kong Fantao, Wu Jianzhai, et al. Cotton disease identification model based on improved VGG convolution neural network[J]. Journal of China Agricultural University, 2018, 23(11): 161-171. (in Chinese with English abstract)
[30]Redmon J, Farhadi A. YOLOv3: An incremental improvement[R]. arXiv:1804.02767, 2018.
[31]Redmon J, Farhadi A. YOLO9000: Better, faster, stronger[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2017: 6517-6525.
[32]Liu W, Anguelov D, Erhan D, et al. Ssd: Single shot multiBox detector[C]//European conference on computer vision. Spinger, Cham, 2016: 21-37.
[33]Fu C Y, Liu W, Ranga A, et al. DSSD: Deconvolutional single shot detector[R]. arXiv:1701.06659, 2017.
[34]Lin T Y , Goyal P , Girshick R , et al. Focal loss for dense object detection[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, 1: 2999-3007.
[35]Kingma D P, Ba J. Adam: A method for stochastic optimization[R]. arXiv:1412.6980, 2014.
Increasing the real-time dynamic identification efficiency of sugarcane nodes by improved YOLOv3 network
Li Shangping1, Li Xianghui1, Zhang Ke2, Li Kaihua1, Yuan Honglei1, Huang Zongxiao2
(1.,,530006,; 2.,530004,)
To popularize the technology of sugarcane pre-cutting seed, and cultivation with good method, combine with the development of intelligent transverse sugarcane pre-cutting seed-cutting machine, and realize the continuous and dynamic intelligent recognition of sugarcane seed characteristics by sugarcane seed-cutting device, in this study, an intelligent recognition convolution neural network model based on improved YOLOv3 network was established by continuously and dynamically collecting the surface data of the whole sugarcane through the camera built in the black box of the sugarcane cutting machine. The real-time location and recognition of the image features of the whole sugarcane cane nodes in the input recognition system was carried out by the camera inside the system. Compared with the recognition information, the improved network timely updated the sugarcane nodes data, identified and marked the position of the sugarcane nodes, and then got real-time sugarcane nodes information through data processing, which was transmitted to the multi-tool cutting table for real-time cutting. In this paper, based on the improved YOLOv3 network, a sugarcane nodes recognition system was established. The image acquisition was carried out by the camera in the sugarcane cutting system. The video data of sugarcane was collected before the training of this network, and then the image data was processed to establish training set, validation set and test set. The training data sets of different improved models were tested and the best model was selected as the model in this paper. Through the training and test, the measured results showed that the recognition accuracy of the model for sugarcane nodes was 96.89%, the recall rate was 90.64%, average recognition accuracy AP was 90.38%, and the average recognition time of pictures was 28.7 ms. Compared with the original network, the AP was improved by 2.26percentage point, the accuracy was decreased by 0.61percentage point, and the recognition time was shortened by 22.8 ms. At present, the recognition of sugarcane nodes still remained in single or basic image processing and recognition, and there was still a lack of fast processing methods for the whole sugarcane image. In this study, we proposed to use the improved YOLOv3 network to recognize and locate sugarcane features, and to establish the recognition model of sugarcane nodes through network training. On the basis of the accuracy and speed of the original network identification and location, the speed of identification, detection and the recognition rate were further improved. The whole sugarcane can be identified and processed quickly in real time, which can meet the needs of various sugarcane seed cutting. Combining with the other parts of the intelligent sugarcane cutting machine system designed by our research group, the whole cutting process can be mechanized and intellectualized, which can greatly improve the quality of sugarcane cutting, reduce the labor intensity and time, and greatly improve the production efficiency. It provides a research basis for the industrialized production of sugarcane pre-cutting and realizes the sugarcane production. Continuous and real-time dynamic identification of sugarcane seeds lays the application foundation for the development of intelligent transverse cutting machine for sugarcane pre-cutting.
convolutional neural network; machine vision; models; YOLOv3 network; sugarcane nodes; identification
李尚平,李向辉,张 可,李凯华,袁泓磊,黄宗晓. 改进YOLOv3网络提高甘蔗茎节实时动态识别效率[J]. 农业工程学报,2019,35(23):185-191.doi:10.11975/j.issn.1002-6819.2019.23.023 http://www.tcsae.org
Li Shangping, Li Xianghui, Zhang Ke, Li Kaihua, Yuan Honglei, Huang Zongxiao. Increasing the real-time dynamic identification efficiency of sugarcane nodes by improved YOLOv3 network[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(23): 185-191. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2019.23.023 http://www.tcsae.org
2019-07-12
2019-10-27
广西科技重点研发计划(桂科AB16380199)
李尚平,博士,教授,博士生导师,研究领域:农业机械化工程。Email:spli501@vip.sina.com
10.11975/j.issn.1002-6819.2019.23.023
TP391.4
A
1002-6819(2019)-23-0185-07