结合颜色分量特征和改进YOLO 算法的中国交通标识牌检测*

2022-09-28 01:40徐超秦宇强
计算机与数字工程 2022年8期
关键词:分量卷积准确率

徐超 秦宇强

(太原科技大学计算机科学与技术学院 太原 030024)

关键字 交通标识牌;目标检测;颜色分量;YOLO算法;注意力模块

1 引言

在无人驾驶与辅助驾驶领域中,车辆需要检测和识别前方道路旁设立的交通标识牌,从而得到即将行驶的道路信息,对得到的信息进行相应判断,安全通过道路。

现阶段主要有两种的交通标识牌检测方法:一是传统图像处理方法。例如LI Wenju 等[1]提出的一种结合RGB 颜色空间和形状轮廓空间的在复杂光照环境下的检测交通标志牌的方法。二是基于深度学习的多种目标检测算法进行交通标识牌的检测。目前有Ou Z 等[2]提出了一种基于特征聚合多径网络实时的交通标志牌检测方法,主要解决交通标识牌作为小目标难以检测的问题。

在基于深度学习交通标识牌检测的过程中,交通标识牌的类别的检测是关键的一步,近几年,涌现出的基于深度卷积网络的目标检测可以分为single-stage[3~5]和two-stage[6~7]两种;基 于singlestage 的方法具有较快的检测速度,而基于two-stage的方法需要产生许多候选区域,检测速度较慢,但具有很高的准确率。

2 相关工作

2.1 交通标识牌

根据我国道路交通法律法规规定,将交通标识牌分为最多的警告标志、禁令标志、指示标志和少量的其他标志。本文的方法主要检测警告类、禁令类、指示类交通标志牌。

2.2 颜色分量特征提取

由于禁令标志都是以红色,警告标志都是以黄色,指示类以蓝色作为标志的主要颜色,所以,通过图像中标志的类别,可以将图像最终转换为其颜色分量特征图。同时,为了减少光照和恶劣天气对交通标识牌的颜色检测,本文提出了RGBN 颜色空间。

Mahatme M B 和Kuwelkar M S[8]提出检测目标有着鲜明的颜色特征,就可以依靠算法找到目标的颜色分量特征。因此,本文对算法改进,将分别对三种类型的标识牌,利用RGB 分量分别提取图像中的红、黄、蓝颜色分量的像素点,获得颜色分量特征图。

通过式(1)将RGB 颜色空间的原图像转换为RGBN颜色空间。

式中R,G,B,R′,G′,B′表示通过公式转换的前后三色分量。

2.3 YOLO目标检测

基于机器视觉的交通标识牌检测对准确率和实时性都有较高的要求。YOLO 算法是由Redmon J 等[9]提出具有在准确性和实时性都有较高的表现,可以完美适用于视频中的目标检测,因此本文以YOLO 算法中现阶段最优的YOLOv3[10]网络进行检测。

2.4 注意力机制

深度学习中的注意力机制[11~12]从本质上讲和人类的选择性视觉注意力机制[13]类似,本质上也是在众多的影响信息中挑选出关键的目标。

Woo S 等[14]提出了卷积层的注意力模块(Convolutional Block Attention Module,CBAM),这个模块分为两个部分:通道注意力(channel)和空间注意力(spatial)。优点是可以和任何卷积网络结构一起使用,不会增加额外的开销。

2.4.1 通道注意力

如图1,是一个通道注意力模块(channel Attention Module)输入特征F,分别进行空间的全局平均池化(AvgPool)和最大池化(MaxPool)得到两个通道描述。再将它们分别送入一个两层的神经网络,共享网络(Shared MLP)。最后,将得到的两个特征相加后经过一个Sigmoid 激活函数得到权重系数Mc。

图1 通道注意力模块

2.4.2 空间注意力

如图2,与通道注意力相似,空间注意力模块(spatial Attention Module)给定特征F,先分别进行一个通道维度的平均池化和最大池化得到两个通道描述。然后,经过一个7×7 的卷积层,得到权重系数Ms。

图2 空间注意力模块

2.4.3 CBAM结合YOLO

卷积层的注意力模块(CBAM)是将空间注意力模块和通道注意力模块按照顺序串联。将CBAM 模块分别嵌入YOLOv3 的Darknet53 的五个残渣卷积块(Residual block)[10],改进网络。

3 实验及结果分析

3.1 实验准备与数据集制作

本文实验的计算机配置为CPU i5-9600kf,显卡Gtx2080Ti,内存 16G,操作系统为 Ubuntu16.04。境Windows10,使用Matlab 进行仿真模拟实验。

本次实验数据共计20000 张,其中10000 张为CCTSDB 数据集[15]作为正样本,10000 张非交通标识牌图片作为负样本。

3.2 实验结果分析

3.2.1 实验效果

通过使用训练好的模型,在300 张实景拍摄的测试集下测试,测试结果如图3。

图3 实验效果图

测试结果表明,本文算法可以在自然环境下精确地检测出中国三类交通标识牌。在此基础下,本文设计了对比实验来展示本文算法的综合性能的提升。

3.2.2 对比指标

在目标检测中常使用平均准确率mAP 做为检测结果的评价指标。mAP 的计算依靠准确率和召回率,通过式(3)计算准确率和召回率。

式中,P和R表示需要的准确率与召回率。TP表示实验结果中正样本识别为正样本的数量;FP 表示实验结果中负样本识别为正样本的数量;FN 表示实验结果中正样本识别为负样本的数量。

单类平均准确率AP 的计算是以召回率为x轴,准确率为y 轴,画出P-R 曲线,计算曲线下的面积即为AP 值。包含N 个类别的测试集来说,根据式(4),得到平均准确率mAP。

3.2.3 对比分析

通过将本文的改进YOLO 算法与其他流行的算法在相同交通标识的数据集上进行横向对比,使用IoU 为0.5 标准下的mAP,同时对比各个算法的FPS,对比算法的检测速度。对比结果如表1所示。

表1 的测试结果表明,本文算法在同类检测算法中取得了最好的检测精度,同时也较好地保证了算法的实时性。

表1 对比结果

4 结语

从实验结果表明,本文利用颜色分量提取的三类交通标识牌的颜色分量特征图,并且通过在YOLOv3 的残渣卷积块中嵌入CBAM 注意力模块,改进YOLO 算法,用于自然场景下的交通标识牌检测,在保证目标检测的实时性的同时,提高了准确性。

猜你喜欢
分量卷积准确率
基于全卷积神经网络的猪背膘厚快速准确测定
基于图像处理与卷积神经网络的零件识别
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
画里有话
基于深度卷积网络与空洞卷积融合的人群计数
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤