张 晨
(1.华东交通大学 机电与车辆工程学院,江西 南昌 330013;2.厦门软件职业技术学院,福建 厦门 361024)
汽车已经逐渐成为一种普及化的产品,全球的汽车保有量处于极速增长的趋势,这在很大程度上增加了各类交通的管理难度。随着道路的智能化发展,交通管理朝着自动化和智能化的方向不断发展,车牌识别的需求变得越来越大,同时对于车牌有效识别的要求也越来越高。国外的车牌识别研究开始较早,我国的车牌识别虽然已有十余年的发展,但仍处于较为初级的阶段,技术水平有待进一步完善和提高[1-3]。车牌识别一般包含车牌图像采集和预处理、车牌的定位和分割、字符识别等过程,其中车牌的定位和字符识别是十分重要的环节,直接影响到了整个系统的识别精度,因此合理的方法和模型对于提升关键环节的识别效率至关重要。本研究将SVM和MPL模型分别应用在车牌的定位和字符识别中,同时在分析模型的训练和优化过程中来提升识别效率,为车牌的有效识别提供一定的参考。
目前市面上已有很多车牌识别方案,在不同的软硬件条件和使用场景下,车牌识别系统的工作过程略有差异。通常情况下,车牌识别系统的前端是由安装有摄像头、传感器、交通信号灯等硬件设备的车辆感应区域组成的;后端是由安装有车牌识别软件程序和访问控制程序的计算机系统组成。前后端通过网络进行联网控制。车牌图像的采集和预处理是车牌识别的基本工作和前提。
图像采集技术决定了车牌图像的质量和车牌有效识别的期望。车牌图像的采集一般要求摄像机设备的有效拍摄范围为3~13 m,同时需要具备能够在白天和黑夜以及雨雪、强光、大雾等复杂环境条件下完成高分辨率图像拍摄的能力。当车辆进入识别区域,首先由传感器的感应回路识别并向控制系统发出信号,再由成像系统通过摄像头进行拍摄完成车牌原始图像的采集工作,然后通过图像采集卡完成图像的A/D转换,把模拟图像转换成数字图像并发送到计算机端。车牌识别程序模块分析和处理读取车辆的车牌号,再将车牌号以ASCII码的形式返回给访问控制程序,最后在车牌数据库中进行查询比对和完成车辆的相关授权。车辆信息将储存在访问数据库中,当本次识别过程完成车辆离开识别区域后,系统将为下一辆到达的车辆做好识别的相关准备工作。
图像预处理是车牌的定位和字符识别等后续采用相关模型进行分类和识别的前提。车牌图像预处理过程主要分为三部分:第一部分为初级处理操作,通过高斯滤波降低图像噪声使图像平滑,同时对图像灰度化处理来增强图像的效果,再将灰度图像转化为二值图像。通过处理可以将图像易被忽略的细节部分显现出来,以便进一步提取出图像的特征,方便后续处理;第二部分为中级处理操作,通过Sobel算子得到车牌大致位置,再对图像进行闭操作使车牌区域连接成一个矩形装区域,并按照一定参数阈值筛选出图中符合要求的车牌矩形轮廓同时调整水平。第三部分为高级处理操作,输入的有效车牌图片根据字符的不同将车牌上下边切割,汉字字符进行行切分,非汉字字符进行字切分,最后再归一化到统一尺寸格式。
SVM[4](支持向量机)是一类按监督学习方式对数据进行二元分类的广义线性分类器。MLP[5](多层感知器)属于前馈人工神经网络模型,是典型的深度学习模型。车牌的定位和字符识别关系到车牌的有效识别,如图1所示。在车牌识别系统中通过SVM构建二分类器用于车牌的定位,字符的识别则是通过构建MLP多分类器来完成的。经过前期图像预处理后得到的车牌候选图片将逐一输入到SVM模型中进行识别筛选,找出有效的车牌图片。再经过一系列处理后,被分割的车牌字符图片将输入到MLP模型完成最后字符的识别和输出。在识别的过程中,模型的效率将决定识别的精度,因此通过有效的训练可以达到优化模型提升效率的目的。
使用SVM构建二分类器对车牌样本进行分类,利用HOG和HAAR等方法提取样本特征,并生成特征数据集。训练和预测这两个过程是独立展开的,同时所有正负样本图块都归一化处理并整合为训练集和测试集两类,其中训练集占70%,测试集占30%,再基于RBF核进行模型的训练。在识别过程中,支持向量机将输入向量映射到更高维的空间,构造最大分离超平面,在分隔数据超平面的每一侧上构造两个并行的超平面,分离的超平面是使两个平行超平面之间的距离最大的超平面。这些平行超平面之间的余量或距离越大,分类器的泛化误差就越小。此时SVM性能优化可以通过对惩罚系数C和gamma参数的调整来进行,其中惩罚系数C关系到数据子空间中调节学习效率的置信区间,即对识别误差的宽容度,C的数值越高则越不能容忍出现误差。最优的惩罚系数C在不同的数据子空间是不同的,系数过大易出现过拟合,系数过小则易欠出现拟合,过大和过小都会使泛化能力变差。gamma是RBF核函数关联的一个参数,关系到数据映射到新的特征空间后样本数据子空间分布的复杂程度。支持向量的数量会影响到模型的训练与预测速度,gamma参数越大支持向量就越少,反之则越多。
通过训练取得最优的惩罚系数C和gamma参数对于模型的优化极为重要。惩罚系数C和gamma参数是相对独立的。在本论述中使用穷举法先将惩罚系数C和gamma参数作为变量,通过对模型的训练发现当惩罚系数取值为3时,模型的识别率达到了最优,并随着惩罚系数的增大逐渐趋于稳定;当gamma参数的取值为4到6的区间时,模型性能达到最优,并随着gamma参数增大,模型性能随之下降,最终在取值14以后趋于平稳;在惩罚系数C和gamma参数等值的情况下,在4至16的取值区间内模型性能达到最优。最后选择惩罚因子C取值为4,gamma取值为8。
图1 SVM与MLP在车牌识别的应用
构建MLP多分类器,MLP网络结构包含输入层、输出层和两个隐层,每层之间都是全连接的,每个层中都包含一组神经元,输入的每个神经元层由数值加权突触连接到隐藏的节点层。隐层神经元输出采用tanh激活函数,该函数是连续并可导的非线性函数,可以直接利用数值优化的方法来学习网络参数,根据神经元从输入突触接收的刺激来指定神经元是否被激活。在实际识别场景下,将分割后的车牌字符块样本输入MLP模型,不仅生成实际数据,还生成训练数据,因此会直接影响到模型的准确性,以及模型判断的最终结果,可以通过训练加以改善。
训练过程采用反向传播方法,为了提高学习速度,定义处理元素更新的学习速率关系为ηi=η0f(M,N,K),其中η0是当前层的整体学习率,ηi是用于更新相应网络参数的学习速率;f(M,N,K)由下一层处理元素的输入数量M、可更新元素输入数量N、该元素的输出数量K构成;f的值随M的增加而增加,随N的增加而减小,随K的减小而减小。学习速率用于将处理后的输入向量与相关的目标向量进行比较,并生成反馈控制信息,使用后向传播来更新相应的网络参数。将数据集输入网络的输入层,基于每个输入神经元激活函数的值,隐藏层中的一些神经元的组合层将激活。输出神经元将输出表示为向量,比对网络产生的输出与预期输出之间的差异,并从网络的输出端开始向网络的输入端修改突触的权重。不断训练优化,当网络产生的输出足够接近预期的输出时模型达到最优。
技术的发展日新月异,各个学科领域都在不断发展和相互融合。随着5G技术的发展和商用化的推进,智能化交通网络将进一步发展。车牌识别技术涉及到机器视觉、人工智能等多个学科领域,国内外已有很多相关的研究,对于车牌识别精度的提升一直都是研究的核心内容。车牌的定位和字符识别作为车牌识别系统的重要环节,直接关系到车牌识别的精度。本论述研究利用SVM和MLP来分别完成车牌定位和字符识别的方法,根据实际情况分析了相关模型的训练优化和效率提升,为SVM和MLP在车牌识别的应用研究提供了一种参考。