基于改进卷积神经网络的车号识别算法

2016-05-14 22:11王欣蔚

数字技术与应用 2016年7期

王欣蔚

摘要：动车车号识别是动车安全自动监测系统的一项重要内容。由于光照不均、运动失真等因素，动车车号的可靠识别困难较大。论文研究了基于深度网络的识别算法，通过设计卷积神经网络，以减少资源占用为出发点，获得99.20%的识别正确率。与LeNet-5卷积网络进行对比实验，减少了近6倍的训练时间，并且识别率有所提高。

关键词：字符识别卷积神经网络复杂光照深度学

中图分类号：TP391.4 文献标识码：A 文章编号：1007-9416（2016）07-0126-01

1 相关背景

近两年，深度网络[1]正成为模式识别与人工智能领域的一个重要方向，其中又以卷积神经网络（Convolutional Neural Networks， CNN）[2]等为热点，应用于目标检测、人脸识别等领域。它通过卷积层和下采样层两个特殊结构来实现特征提取过程。能解决传统算法对夜间车号图像识别困难的问题。

然而，其复杂度高、系统资源的需求大，训练需要海量的数据，实际应用不具有以上条件。本文通过研究，在提高识别率的同时，明显降低系统资源的消耗，为深度网络的实际应用探索新的思路。

2 卷积神经网络的车号识别

针对降低网络系统资源消耗、在适度规模的数据集下训练的实际需要，不同的应用主要需要考虑卷积层个数、每层特征图个数、下采样层池化区域大小以及网络的深度。

卷积层的作用是探测上一层特征的局部连接，而下采样层的作用是把相似的特征合并起来。卷积过程要设计卷积核大小，针对样本数据进行调节，如果核的尺寸过大，会增加运算量；如果过小，则不足以提取到有效结构特征。此外，卷积核个数过少会使特征提取的不充足导致识别率低，过多会导致运行时间大大增加。下采样过程需要确定合适的池化区域大小。考虑到信息的损失情况，池化矩阵不应过大，一般为2×2的大小。经以上考虑，本文卷积神经网络结构如图1所示。

由于动车车号应用统一的字体设计，字体结构没有LeNet-5应用场景改变大。因此两个卷积层的设计已满足特征提取的需要，从而大大减少了耗时。由图1可见，首先输入归一化为32×32的像素大小，并以灰度图的形式输入第一层C1。第一个卷积层C1是形成8个经卷积的特征图，得到像素大小为28×28的特征图。之后经过2×2邻域的平均池化，在下采样层S2生成了8个14×14像素的特征图。C3存在20个10×10像素大小的特征图，可生成20个图像大小为5×5像素的S4层。卷积层核的大小均为5×5。接下来的F5层和S4层为全连接，有20×5×5=500个节点，相当于用含500×21=10500个参数的分类器对向量进行分类，因而具有更强的描述能力。

最后，输出层为21个单元，由径向基函数（RBF）组成。对应待测动车车号字符样本库中21个不同的数字和字母。网络的训练过程，通过BP算法[3]由前到后逐层学习的方式。

3 实验结果与分析

实验用的字符样本均来自实际应用环境中获取的动车车号图像。为了提高网络的泛化性能，将原始样本经过仿射变换、添加椒盐噪声和乘性噪声的处理，扩充样本库数量。训练数据集与测试数据集之间没有重叠，部分样本如图2所示。训练数据集包含10500张图像，测试数据集包含2250张图像。所有实验仿真平台为Matlab2012b。

将本文提出的卷积神经网络（记Proposed），与典型的卷积神经网络LeNet-5[3]以及应用BP算法的普通神经网络（记NN）进行识别正确率的实验比较。其中网络的学习率设置均相同。实验结果如图3所示。

因为卷积神经网络相比于普通的神经网络具有更好的鲁棒性，所以两卷积神经网络识别率均高于普通网络8%。而本文的网络比LeNet-5的识别率高0.8%左右。

与LeNet-5在复杂度方面的对比实验，结果如表1所示。

由表可见，本文网络在三种指标上均有优势。由于LeNet-5多一次卷积操作，并且含120个特征图，使复杂度大大提高，致使训练时间比本文提出的网络多出近6倍。

4 结语

传统的方法对图片质量较敏感，对动车车号夜间采集图像识别性能差。本文经过对卷积神经网络的应用研究，在提高识别率的同时，明显降低了系统资源的消耗。结果表明，本文的卷积神经网络识别率达到99.20%，高于LeNet-5，同时缩减了约6倍的训练时间，在内存占用方面占优势。

参考文献

[1]LeCun Y，Bengio Y，Hinton G.Deep Learning[J].Nature，2015， 521（7753）：436-444.

[2]LeCun Y，Kavukvuoglu K，Farabet C.Convolutional networks and applications in vision[C].IEEE International Symposium on Circuits and Systems （ISCAS），2010，253-256.

[3]LeCun Y， Bottou L， Bengio Y，at el.Gradient-based learning applied to document recognition [C]. IEEE，1998.USA： IEEE，1998： 2278-2324.