基于改进YOLOv4-Tiny的成捆原木端面检测算法

2021-11-22 02:47蔡瑞星林培杰林耀海余平平
电视技术 2021年9期
关键词:原木端面卷积

蔡瑞星,林培杰,林耀海,余平平

(1.福州大学 物理与信息工程学院,福建 福州 350108;2.福建农林大学 计算机与信息学院,福建 福州 350002)

0 引 言

森林资源作为陆地生态系统的主体,是人类赖以生存的重要资源之一。根据国家林业局在2014年发布的第八次全国森林资源清查结果[1],我国森林资源仍存在总量相对不足、质量不高以及分布不均的情况,因此需要合理地规划现有的森林资源。在中国的木材生产、流通过程中,原木材积的准确和有效测量不仅直接影响原木工程的经济效益[2],还能有效防止木材资源的浪费。原木的材积计算由木材端面径级和木材长度两个参数决定,同一批原木长度往往相对固定[3],因此,原木端面检测作为获取原木径级的第一步就显得尤其重要。然而,成捆原木图像中原木端面的形状大小不一、异物遮挡、阴影等问题会给原木端面检测带来严峻的挑战。

现有的原木端面检测方法可以大致分为传统图像处理方法和深度学习方法两个部分。东北林业大学梅振荣等人根据原木端面的图像特征,结合面积阈值法和数学形态学,检测原木端面点[4]。厦门大学林静静等人提出了基于链码的原木端面图像检尺径级识别算法,其较依赖于原木端面的分割效果[5]。东北林业大学赵亚凤等人针对在光照下原木之间阴影相互遮挡的问题,采用了遗传算法确定图像增强的三阶段线性变换的两个转折点,然后用同态滤波器进行图像分割,达到较好的识别效果,但是遗传算法的使用也带来了较大的耗时[6]。河北农业大学唐浩等人针对自然环境对原木端面检测的影响,通过色差值聚类对原木图像进行分割,提取原木端面特征,采用逐级开运算并且改进分水岭算法对原木端面实现计数,但是该方法在复杂背景下的鲁棒性会受影响[7]。

近几年,得益于深度学习领域以及相关硬件设备的快速发展,深度学习越来越广泛地应用于目标检测任务中。深度学习算法相比于传统图像处理方法具有更强的鲁棒性,能够在原木端面形态差异较大的情况下仍然具有较高的识别率。目前的目标检测网络模型主要可以分为二阶段网络和一阶段网络两种[8],其中,二阶段网络是基于区域推荐的一种模型,区域卷积神经网络(Regions with convolution neural network,R-CNN)[9]作为二阶段网络的代表模型,首先通过区域推荐生成候选区域,其次通过卷积网络提取每个候选区域的特征,再次,R-CNN把这些特征输入到支持向量机(Support Vector Machine,SVM)进行分类,最后通过线性回归来调整预测框的位置。这种方法在最近几年也进行了一系列的改进,例如Faster R-CNN[10],Grid R-CNN[11]等,这些方法也同样被应用于各个领域的检测中,但是R-CNN系列的网络结构比较复杂,会带来巨大的模型参数。一阶段网络是基于回归的方法,主要以YOLO(You Only Look Once)[12-13]系列和SSD(Single Shot Multibox)系列为代表,这些一阶段网络将物体的分类和定位放在一个步骤中进行,直接在输出层回归目标检测框的位置和类别。福建农林大学的林耀海等人利用YOLOv3-Tiny结合霍夫变换(HoughTransform)设计出一种等长原木材积检测系统[3],达到了较高的准确率。但是YOLOv3-Tiny采用固定的学习率衰减,容易陷入到局部最优点,其结果是,在原木端面污渍较小、差异不大时检测效果很好,当原木端面差异较大时,检测准确率明显下降。相比于YOLOv3-Tiny,YOLOv4-Tiny采用了余弦退火的学习率衰减,能够有效地逃离局部最优点,训练出更好的模型。河北农业大学唐浩等人采用SSD网络实现不同尺度的目标特征提取,克服了传统算法在不均匀光照下的原木间互相遮挡的问题,达到很高的检测精度。然而SSD网络由于结合了多个尺度的目标特征,不免带来参数冗余问题。

因此,本文采用YOLOv4-Tiny网络,通过引入注意力机制中的压缩和激励(Squeeze and Excitation,SE)模块[14],在保证不会加入更多模型参数的前提下提升网络的识别性能,减少原木端面图像中的漏检原木数量,使得模型能够更加完整地检测出原木端面图像中的原木。同时,考虑便携式手持设备在实际成捆原木端面检测任务中更具有实用性,引入深度可分离卷积(Depthwise Separable Convolution,DSC)[15]来替换YOLO模型中解码网络的卷积步骤,以缩减模型的参数量,提高该深度学习模型在嵌入式设备应用的可行性。通过实验结果对比,本文所提出的改进的YOLOv4-Tiny网络能够在保证召回率的同时,降低模型的参数量,使其更易于移植。

1 材料与方法

1.1 数据集

实验数据总共177张图片,其中一部分来自福建永安某林场的成捆原木图像集,另一部分来自互联网。124张图片作为训练集,53张图片作为测试集。每一张图片的原木数量从3到100根不等,训练集总共有5 112根原木,测试集总共有1 846根原木。部分原木图像如图1所示。原木图像数据采用Pascal VOC2007标准格式,采用LabelImage进行数据标注,标注过程如图2所示,标签设置为log。

图1 部分成捆原木图

YOLOv4-Tiny有一种马赛克(Mosaic)数据增强方式,该数据增强方法包括以下4个步骤:

(1)随机读取四张图片;

(2)对读取图片进行随机的缩放、色域变换以及翻转等操作;

(3)将变换后的图片摆放在左上、左下、右上、右下四个位置;

(4)将真实标注框进行整合。

Mosaic数据增强的结果如图3所示。测原理如图4所示。

图4 YOLO系列检测原理图

经过缩放之后,原始图片被分为N×N个单元格,如果目标中心落在单元格内,单元格内目标的位置和类别信息就会被预测。每个单元格预测类别的条件概率C,边界框B的位置信息以及置信度,边界框置信度包含预测框内是否包含目标Pr(Object)以及预测框和真实框的交并比(Intersection Over Union,IOU)

1.2 YOLOv4-Tiny原理

YOLO系列提供将目标检测问题转换为回归问题的端到端的目标检测框架。它的分类和回归任务在同一个网络中实现,直接预测目标的位置和类别信息,有着较快的检测速度。YOLO系列的目标检两个部分。边界框的位置和大小信息包括中心点坐标(x,y),目标宽度w,目标高度h。其中,中心点坐标是相对于单元格左上角的偏移量,而目标宽高则是相对于整张图片的大小,因此,预测值(x,y,w,h)属于[0,1]。对于分类任务,每个单元会输出C个预测类别的概率值,表示目标属于各个类的条件概率Pr(Classi|Object),因此每个边界框的类别置信度可以表示为:

对于分类和回归任务,YOLO模型中每一个单元格的输出为(B×5+C),如果输入被分为N×N个单元格,那么YOLO模型的最终输出结果为N×N×(B×5+C)。

相比较于YOLOv3,YOLOv4网络主要对数据处理、主干特征提取网络、网络训练方法、激活函数以及损失函数等做了一系列的改进,在数据处理上采用马赛克数据增强方式,主干特征提取网络采用CSPDarknet53替换了原来的Darknet53,采用余弦退火的学习率衰减和标签平滑的训练方法、Mish激活函数替换原来的Leaky Relu激活函数以及使用CIOU损失函数等。

1.3 改进的YOLOv4-Tiny

如图5所示,本文将SE模块用于YOLOv4-Tiny的主干特征提取网络的输出特征中,用以加强特征的表达,同时在YOLOv4-Tiny的解码网络中,采用深度可分离卷积代替原有的卷积层,降低整个模型的解码参数

图5 改进YOLOv4-Tiny的网络结构

1.3.1 压缩和激励模块

如图6所示,SE模块加入到YOLOv4-Tiny的输出特征的网络中,通过一个全局平均池化,将特征图压缩成1×1×C(C为特征通道数)尺度,使用特征通道比例系数r缩放,最后经Sigmoid激活函数,将取值范围归到0和1之间,用来表示每个通道特征的权值。最后通过与YOLOv4-Tiny的输出特征进行按位相乘相加,放大对识别原木有用的 信息特征。

图6 SE模块结构图

1.3.2 深度可分离卷积

为了保证模型的检测性能,同时降低模型的参数量,本文采用深度可分离卷积来替换YOLOv4-Tiny解码网络中普通的卷积层,其结构如图7所示。深度可分离卷积将卷积具体可以分成两个计算 步骤:

图7 深度可分离卷积结构

(1)对每一个特征通道进行卷积提取特征;

(2)利用多个1×1的卷积来进行特征的升维,以达到所需的特征维度

2 实验结果与分析

2.1 实验环境与网络训练预处理

2.1.1 实验平台

本文实验在一台配有显卡的工作站上完成,工作站的主要配置如表1所示。

表1 实验平台配置

2.1.2 实验参数设置

由于YOLOv4-Tiny模型需要对输入图片进行5次下采样,因此输入图片大小需要是32的倍数,同时考虑到实验设备的性能,本文选用608×608作为改进YOLOv4-Tiny模型的输入大小,Batch的大小为32,选择Adam作为模型的优化器,初始学习率为0.000 1,权重衰减值为0.000 5。对于YOLOv4-Tiny先验框的选取,本文采用K-means聚类算法对训练集的数据进行聚类,获取模型的先验框,以IOU作为K-means的距离函数,K的取值采用YOLOv4-Tiny的建议值6,最后得到的先验框为(18,25)、(29,41)、(44,56)、(55,82)、(80,111)、(127,162),其他参数均为YOLOv4-Tiny原始的模型参数。

2.2 评价指标

为了分析模型对于成捆原木端面的检测性能,本文选用平均精准率(Average Precision,AP)、召回率(Recall)、精准率(Precision)、F1得分(F1-score)以及对数平均误检率(Log Average Miss Rate,LAMR)来进行评价。采用模型的权重大小来分析模型的参数量。相关计算公式如下:

式中:TP为正确的检测的正样本数目,FP为错误的正样本数目,FN为错误的负样本数目,Miss为误检率,FPPI为每张图片错误的检测数目,N是测试样本的总样本数,K是错误的检测数目。

2.3 结果与分析

2.3.1 检测结果对比

为了评估所提出的模型对于成捆原木图像中的检测效果,本文将其与二阶段模型Faster RCNN、一阶段模型SSD以及YOLOv4-Tiny进行对比,实验结果如表2和表3所示。

表2 不同探测器整体性能对比

表2中,本文算法无论是AP值还是LAMR值,相比较Faster RCNN和SSD模型都有明显的改善。相比较Faster RCNN,AP值提升了17.55%,LAMR值降低了16.27%;相比较SSD模型,AP值和LAMR值改善得更加明显,AP值提高了25.04%,LAMR值降低了35.43%。虽然本文算法在AP值上相比较YOLOv4-Tiny模型只有少许的下降,但在LAMR上降低了2.07%,达到了22.93%。这表明通过SE网络来实现的注意力机制,能够有效地增强主干特征提取网络的输出特征,显著降低原木端面的误检率,增强了模型的鲁棒性。

表3中,本文算法具有最优的TP、FN、F1-score和Recall,分 别 达 到 了1 755、91、0.94和95.07%,TP指标达到了最高,FN指标达到了最低,说明所改进的模型相比较Faster RCNN、SSD及YOLOv4-Tiny模型,在测试集上的漏检原木数达到了最低,能够更多地检测到一张图片中的原木端面;F1-score指标则说明本文算法相比较其他3种模型能够在精准率和召回率之间达到一个最好的平衡;Recall指标则意味着该模型能够更加完整地检测出一张图片中的所有原木。本文算法的精准率达到了93.3%,相比较SSD模型虽然有一些下降,但在召回率上,本文算法相比较SSD模型有了大幅度的提升,提高了16.96%,同时,SSD的漏检原木数目达到了404根,占测试集所有原木的21.89%,存在明显的漏检。这是因为SSD融合了各个尺度的特征,追求识别的精度,注重所检测到的目标必须都是原木的情况,这在模型优化过程中就容易忽略和背景相似、原木间遮挡、异物遮挡情况下的原木,造成了Recall的严重下降。这对于原木端面检测来说是不利的。原木检测需要将一张图片中的原木尽可能地检测出来,才能有效地代替人工检测,因此SSD的Recall显然不满足实际需求。同时,本文算法相比较于YOLOv4-Tiny网络,由于结合了SE模块,加强了网络的特征提取能力,丰富了特征的表达,误检数目(FP)降低了18.71%,Precision提升了1.43%。如图9所示,本文所提出的模型能够比较完整地检测出一张图片中的所有原木,并且在有异物遮挡、光线较暗的情况下也能够准确地检测出原木目标。因此,本文所提模型相比于其他3种模型,更加适合应用于成捆原木端面检测任务。

表3 不同模型检测结果统计表(置信度阈值为0.5,IOU阈值为0.5)

图9 部分检测结果图

2.3.2 模型参数量对比

本文通过模型权重的大小来比较模型的参数量,结果如表4所示。本文所提出的模型结合了DSC,减少了YOLOv4-Tiny解码网络的参数,因此整个模型权重大小只有15.7 MB,是Faster RCNN的14.54%,是SSD的17.33%。相比较YOLOv4-Tiny模型,本文网络模型减少了29.91%,明显降低了模型的参数量,更加适合在嵌入式平台上移植。

表4 不同模型权重的大小

3 结 语

原木端面的有效检测是原木径级测量的重要环节。为了提高原木端面检测模型的识别性能,增强模型的可移植性,本文提出了基于改进YOLOv4-Tiny的成捆原木端面检测模型,借助压缩和激励模块,能够更加完整地识别出一张图片中的所有原木,适用于有异物遮挡、光线较暗的场景,同时使用深度可分离卷积降低了模型的整体参数量,更利于在嵌入式系统上的运行,实现设备的便携和方便使用。本文改进了YOLOv4-Tiny在应用上的一些不足,但YOLOv4-Tiny模型还存在小目标检测能力低、某些情况下预测框和真实目标贴合度小等问题,因此将在今后的工作中进一步优化和改进网络结构。

猜你喜欢
原木端面卷积
KDF3E成型机滤棒端面触头的原因及排除方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
原木、锯材
原木、锯材
大玩原木设计,写意自在又轻松!
老旧端面磨齿机故障处理
原木、锯材
贯通轴端面花键拉床的设计