基于特征重用的交通标志识别技术应用研究

2020-05-11 12:24仲会娟
数字技术与应用 2020年2期
关键词:交通标志准确率卷积

摘要:道路交通标志识别作为主动安全驾驶系统和自动驾驶系统的重要组成部分,在道路行车安全过程中作用巨大,而真实场景采集的交通标志易受复杂环境的影响,造成自动识别精度不高。针对这一问题,以LeNet-5模型为基础,结合密集连接卷积神经网络(Dense Convolutional Network,DenseNet)思想进行网络结构调整,通过图像特征重用挖掘网络潜力、防止梯度消失,加入Dropout策略改善过拟合现象,利用正则化机制约束模型特性,提高模型的泛化能力。在德国交通标志数据集(German traffic sign recognition benchmark,GTSRB)上进行实验,构建了基于特征重用的交通标志识别系统。

关键词:交通标志识别;LeNet-5;深度学习;卷积神经网络;特征重用

中图分类号:TP39 文献标识码:A 文章编号:1007-9416(2020)02-0024-03

0 引言

近年来智能交通系统受到人们的广泛关注,其中主动安全驾驶技术和自动驾驶技术成为了国内外学者、企业都争相进入的研究焦点[1-2]。google公司于2010年开始测试谷歌无人駕驶车辆[3];特斯拉已经在汽车上推出了自动驾驶系统[4]。交通标志识别作为核心技术之一,可以准确、实时的识别交通标志并做出提醒或决策,避免交通事故发生,实现安全驾驶[5]。但现实环境中,交通标志种类繁多、类间区分度不大,且采集的图像易受到外界复杂环境的影响,因此交通标志识别是一个具有挑战性的任务。近年来,LeNet、Alexnet、VGG、GoogleNet、Yolo,ResNet等卷积神经网络(convolutional neural network,CNN)模型在图像检测与识别领域获得了不俗的成绩[6],非常适用于交通标志识别的研究。因此,本文在Lenet-5轻量级卷积神经网络模型基础上[7],基于图像特征重用提出一种简单、通用、准确的标志识别网络,对于提高主动安全驾驶和自动驾驶的安全性具有重要意义。

1 德国交通标志数据集

数据集选用由车载相机在真实交通场景获取的德国交通标志数据集GTSRB[8]。该数据集有43类交通标志,近5万张标志图像,其中39209张训练图像和12630张测试图像,如图1所示。

2 特征重用原理

传统的CNN网络中每一层的输入信息是上一层的输出特征。从5层的LeNet模型、19层的VGG模型到深度达100层的ResNet模型,研究者们多通过增加网络深度或扩大网络宽度来提升网络性能。但随着网络深度增大梯度消失和模型退化问题逐渐凸显。为了促进梯度传播,DenseNet将特征图进行跨网络层连接,即每一层从其之前的所有层获得输入,并将自身的输出特征映射传递给其后的所有网络层,以确保网络中各层之间的信息流最大化[9],从而加强特征传递,抑制梯度消失,如图2所示。

用表示每层的非线性映射变换,其中表示网络层数,第层的输出特征图为:

(1)

其中,表示0,1,...,层的输出特征图,表示将个输入信号串联形成一个张量。

3 基于特征重用的交通标志识别算法设计

数据集中标志图像的分辨率从15pixel×15pixel到250pixel×250pixel不尽相同,首先进行尺寸归一化处理。尺寸变换图像的质量关键由插值方法决定,双线性插值法计算量适中,且能较好的保留灰度值的连贯性[10],因此选用双线性插值将数据集图像标准化为28pixel×28pixel。

笔者以LeNet-5网络结构为基础,结合DenseNet模型中特征重用思想对网络结构进行调整,提出了基于特征重用的交通标志识别算法,如图3所示。

以上结构中,卷积层选用5×5卷积核,最大池化层采用2×2卷积核,每个卷积层后采用Rule激活函数提升网络的表达能力。笔者在文献[9]思想下,将第1个池化层的输出pool1经过二次卷积后与第2个池化层的输出pool2一起送入第3层卷积层,实现了任意两层卷积层之间直接相连,保证了各个尺度上图像特征的极致利用,达到更好的图像分类效果。其中,二次卷积采用32个5×5×32卷积核,滑动步长2。算法中加入正则化,降低模型复杂度,防止模型过拟合;全连接层后加入Dropout机制,削弱神经元节点间的联合适应性,增强模型的泛化能力,同时加快网络训练速度。

4 实验结果分析

4.1 实验环境

实验在Windows 10操作系统的华硕电脑上运行,配置为 Intel Core i5-7300HQ CPU、主频2.5GHz、内存8.0GB。采用Python+ OpenCV在Spyder编译器中编程实现,依赖库如表1所示。

4.2 模型的优化

GTSRB数据集数据量庞大,由于硬件配置限制,选用数据集中0-12共13种类型的交通标志图像进行实验。实验中BATCH_SIZE设为100,EPOCHS设置为200,并且每训练一次输出一次准确率、损失值,监控整个训练过程。

4.2.1 学习率参数选择

学习率的选择决定着模型能否收敛,以及收敛的快慢,取值太小收敛过程十分缓慢,取值太大梯度会在最小值附近来回震荡,甚至无法收敛[11]。笔者对0.0005、0.0008和0.005三组学习率进行了测试,如表2所示。数据说明,学习率为0.005时准确率和损失值都非常差;学习率为0.0008时损失最小,识别准确率最高,因此设置学习率为0.0008。

4.2.2 Dropout参数选择

Dropout通常在CNN的全连接层使用,以防止模型过拟合。因此,笔者在Full Connection层使用该策略。对0,0.3,0.5,0.7四组Dropout值进行实验,如表3所示。数据说明,Dropout参数为0时模型最差,为0.5时模型准确率达到最大值,同时损失最小,因此设置Dropout为0.5。

4.3 模型对比与分析

为了验证算法的有效性,笔者对LeNet-5模型、3层卷积模型和特征重用模型进行对比实验,如表4所示。由表4可知,在相同分类问题中,特征重用交通标志识别算法的识别准确率明显高于其他两种算法。

如图4-9所示,特征重用交通标志识别算法误差的下降趋势比较稳定,整体的准确率趋势同样表现更加稳定。

5 结语

本文以LeNet-5网络结构为基础,结合密集连接卷积神经网络中特征重用的思想,提出了在交通标志识别任务中更为优秀的特征重用交通标志识别算法,对不同尺度的图像特征信息进行有效利用,结合Dropout策略等算法实现交通标志图像更快更好的分类效果。由于实验设备配置限制,本次实验仅采用了GTSRB数据集中部分样本,样本量有待提升,但是该算法具有较高实用价值和参考价值。

参考文献

[1] Spadafora W G,Paielli P M,Llewellyn D R,et al.Intelligent transportation system[Z]. US. US7689230,2010.

[2] Wen Y,Lu Y,Yan J,et al.An Algorithm for License Plate Recognition Applied to Intelligent Transportation System.IEEE Transactions on Intelligent Transportation Systems,2011,12(3):830-845.

[3] 張新钰,高洪波,赵建辉,等.基于深度学习的自动驾驶技术综述[J].清华大学学报(自然科学版),2018(58):438-444.

[4] 陆旻睿.自动驾驶的发展前景浅析[J].中国设备工程,2018(22):126-128.

[5] 谢锦,蔡自兴,邓海涛,等.基于图像不变特征深度学习的交通标志分类[J].计算机辅助设计与图形学学报,2017(4):632-640.

[6] 仲会娟.基于CNN的多尺度特征在手写数字识别中的应用[J].绵阳师范学院学报,2019(5):22-26.

[7] 褚莹,陶纪宇,凌力.基于改进LeNet-5的交通标志识别算法研究[J].微型电脑应用,2019(9):58-61.

[8] Stallkamp J,Schlipsing M,Salmen J,et al.The German Traffic Sign Recognition Benchmark: A multi-class classification competition [C].International Joint Conference on Neural Networks. IEEE,2011:1453-1460.

[9] Huang G,Liu Z,Maaten L V D,et al.Densely Connected Convolutional Networks[A].2017 IEEE Conference on Computer Vision and Pattern Recognition(CVPR)[C].IEEE Computer Society,2017.

[10] 宋青松,张超,田正鑫,等.基于多尺度卷积神经网络的交通标志识别[J].湖南大学学报(自然科学版),2018(45):137-137.

[11] 王全,梁敬文.基于TensorFlow的交通标志识别方法研究[J].价值工程,2019(27):204-206.

Research of  the Application to Traffic Sign Recognition Technology Based on Feature Reuse

ZHONG Hui-juan

(College Ofartificial Intelligence, Yango University, Fuzhou  Fujian  350015)

Abstract:As an important part of active safe driving system and self-driving system, traffic sign recognition plays an important role in the process of road driving safety, however traffic signs collected in real scenes are susceptible to complex environment, resulting in low recognition accuracy. In response to this problem, the network structure is adjusted based on lenet-5 model and densenet ideas, mining network potential and preventing vanishing gradient through feature reuse, the Dropout strategy was added to improve the over-fitting phenomenon, the regularization mechanism was used to constrain the model characteristics and improve generalization ability of the model. Experiments were conducted on the German traffic sign recognition benchmark (gtsrb), a traffic sign recognition system based on feature reuse is constructed.

Key words:traffic sign recognition; lenet-5; deep learning; convolutional neural network; feature reuse

猜你喜欢
交通标志准确率卷积
基于双向特征融合的交通标志识别
基于3D-Winograd的快速卷积算法设计及FPGA实现
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
从滤波器理解卷积
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法
一种基于卷积神经网络的性别识别方法