邓嘉诚 黄贺声 杨林 魏亚东
摘 要:车辆牌照识别技术(Vehicle License Plate Recognition,VLPR)以快速准确从图像中检测出车牌号码的优点,成为智能交通网络实现的前提。车辆牌照识别技术的实现主要分为图像预处理、车牌定位、字符分割和字符识别等部分,每个部分均有若干方式可以实现,本文先介绍了车辆牌照技术中常用的方法,再对比了各种方法之间的优点和缺陷。
关键词:车牌识别;图像预处理;车牌定位;字符分割;字符识别
中图分类号:TP391.41 文献标识码:A 文章编号:2096-4706(2019)16-0078-06
Abstract:Vehicle License Plate Recognition (VLPR) technology,which has the advantage of fast and accurate detection of license plate numbers from images,has become a prerequisite for the implementation of ITN. The realization of vehicle license plate recognition technology is mainly divided into image preprocessing,license plate location,character segmentation and character recognition. Each part can be realized in several ways. This paper first introduces the commonly used methods in vehicle license plate technology,and then compares the advantages and disadvantages of each method.
Keywords:license plate recognition;image preprocessing;license plate location;character segmentation;character recognition
0 引 言
近些年来,人们经济能力提高、城市化建设快速,车辆变得越来越多,交通拥堵逐渐成为我们的日常。目前解决该难题的办法是建立智能交通网络,而车牌识别的精准实现是该网络搭建的前提。
1 绪论
1.1 背景与意义
现代人由于经济能力的提高和生活的需要,把原本是奢侈品的汽车作为代步必需品带入家庭,城市车流量也不断增加。加上早期城市规划不完善,建筑密集,道路明显拥挤。另外,城市的发展吸引了大量人口就业,对交通拥堵也会造成一定的影响。最惨的拥堵一定是节假日在高速路上,其中原因之一就在于收费站没有全面普及ETC收费,让车流一下子堵在了收费站。VLPR通过摄像头拍取图片,对图像分析并得到车牌号码,以效率快、准确度高的优点缓解了交通压力。识别的流程图如图1所示。
VLPR的应用,能有效地协助管理人员管理小区或城镇、监控车辆进出、不停车收费、违规记录等,提高城市交通管理效率和减少停车带来的空气污染。
1.2 国内外研究现状
VLPR研究国外起步较早,大约20世纪80年代就有相关图像处理方法提出,但由于信息处理和计算机性能原因妨碍了发展。90年代发展较为迅速,有A.S.Johnson、P.V.Suryanarayanna、EunRyung Lee等优秀学者在图像特征提取和字符识别上提出了意见。早期国外典型的车牌识别系统有英国的RGUS、新加坡的VLPRS等。我国对此研究起步较晚,典型的有武汉大学的喻晓、李幕龙、张礽婧等人提出的基于车牌颜色和纹理特征定位车牌[1]。北京航空航天大学的胡爱明、周孝宽提出的上下矩比值失配比例加权惩罚模板匹配[2]。
2 图像预处理
由于拍摄的车牌受到光照强弱、泥土遮挡、阴雨天气、相机成像位置等因素影响,对照片进行初步处理,能去除无用信息而保留有效信息,还能提高车牌的定位精确度。
2.1 图像灰度化
摄像头的输出一般是彩色图像,包含丰富的色彩信息,直接处理运行量大又耗时。根据后期需要可转换色彩空间,车牌图像处理一般采用的色彩空间是RGB、HSV和HIS,但通常在RGB空间处理。0代表值最暗,255代表最亮。RGB图像常用灰度化方法[3]如下。
3.3 基于混合特征的车牌定位
混合特征组合主流的是HSV顏色搭配纹理特征。一种做法是利用HSV阈值大致筛选出车牌候选区域,再利用车牌区域的纹理特征筛选确定位置;另外一种做法是先用纹理特征检测出具有车牌纹理特征的区域,再由HSV阈值来筛选。RGB与纹理特征也有人在用,主要是分情况去增加RGB通道,这样就能把具有车牌颜色特性的保留下来,再使用纹理特性也大致能确定位置。
学界上关于混合特征的定位有很多,例如胡峰松、朱浩提出的基于HSI颜色空间和行扫描的车牌定位[18],王枚、王国宏、潘国华提出的融合边缘检测与HSV颜色特征的车牌定位技术[19],杨涛、张森林提出的一种基于HSV颜色空间和SIFT特征的车牌提取算法[20]。
3.4 基于神经网络的车牌定位
此方法首先就要收集各种各样的训练样本,建立神经网络模型训练,假设输出为1则为含有车牌的图像,0为不含车牌的图像,训练完毕后就可以调用此神经网络检测车牌了。使用时,用一个M*N的滑动窗口在预处理图像自左而右、自上而下移动并归一化后送入神经网络输入层,待滑动窗口完全遍历整个图像,就能得到车牌位置。该方法前期需要巨大的训练样本进行训练,拍摄图像影响到滑动窗口的大小,窗口不同运算的速度也不同,很难满足实时性要求,故前期不建议采用此做法。
4 字符分割
字符分割简单来说就是从二值化车牌图像中,分割出长宽相等的单独字符图像。分割时要注意,字符间隔最大的是第二与第三个字符。实际拍摄的车牌存在光照强弱、遮挡、变形、单双层车牌等现象,使分割工作更加困难。
4.1 基于水平投影与垂直投影的方法
这是分割字符最常用的做法,实现方式简单。水平投影是从上到下统计一行中的像素点为1的个数,而垂直投影是从左到右统计列中像素点为1的个数。先后对二值化图像进行水平投影和垂直投影,分别得到切割字符高的起点和终点、宽的起点和终点,接着对每个区域边界进行分割。分割是要注意字符间的距离,若仅从投影来说的话,有可能将汉字切成几份,但考虑上距离就能把将汉字切割完整。[21,22]
4.2 基于连通域分割
逐行逐列扫描二值化图像像素点周围的4个或8个像素点,判断是否都为1,是的话就更改一个值(不同连通域用不同的值)构成该字符部分的连通域。数字和字母形成单一连通域,但首字符是汉字,可能会形成多个连通域。由于切割字符的宽高是一致的,寻找连通域的最小外接矩形,从右往左切割,最后剩下的多连通域的区域即为汉字。
该方法在字符倾斜时,分割效果也好。但由于我们一般进行过倾斜度矫正,此方法的优势也就没体现出来,反而会拖慢总体的速度。[23]
4.3 基于静态边界的方法
车牌的长宽比以及字符间的距离都有规定。在车牌定位十分精确的情况下,将车牌缩放至某个合适的大小,根据此知识,就能判断出每个字符在二值化图像中的哪个位置。
字符经过切割后会得到同样大小的图片,方便下一步对字符进行识别。切割效果如图4所示。
5 字符识别
5.1 基于模板匹配的字符识别
由于VLPR处理的是印刷体,采用模板匹配来识别也是可行的。模板匹配目前流行的是基于灰度值匹配和基于特征提取匹配。基于特征提取的模板匹配方法需要涉及大量的几何和形态学计算,需要复杂的计算,满足不了车牌识别实时性要求,故此方法不推荐使用[24]。基于灰度值的模板匹配方法,计算量虽然相对较小,要求与模板差别不大时才会获得较好的效果,当字符模糊时,成功率会大大降低。
优缺点分析:卷积神经网络的优点在于参数共享,大大简化了运算量,特征的选取不需要手动输入,只要训练好权重,就能得到好的分类效果,但前提是要做好训练的工作,除了需要准备训练样本和测试样本外,还要在训练过程中根据经验不断调参;缺点是输入图像过大或者图像色彩数过多,学习参数量将会非常庞大。
6 结 论
车牌识别环节受到诸多因素的干扰,比如汉字结构、光照、字符的旧损、车牌变形等都令车牌识别有了阻碍,因此车牌识别率仍是研究难点。在整个车牌识别项目中,若用某一步骤的最好处理效果来选方法的话,会加大程序的运算时间,建议是前期的处理能简便的就简便。目前,市场上的车牌识别产品使用神经网络的不多,同时识别时会有触发拍照的条件,对视频中运动车辆的车牌检测还有待进一步研究。
参考文献:
[1] 喻晓,李慕龙,张礽婧,等.复杂车辆图像中的车牌定位 [J].电子设计工程,2010,18(12):120-123.
[2] 胡爱明,周孝宽.车牌图像的快速匹配识别方法 [J].计算机工程与应用,2003(7):90-91+110.
[3] 江进.基于灰度化及边缘检测算法的车牌识别技术研究 [J].现代计算机(专业版),2014(1):38-41.
[4] 李耀辉,劉保军.基于直方图均衡的图像增强 [J].华北科技学院学报,2003(2):65-67.
[5] 李青,王福明.基于傅里叶变换的指纹图像增强算法 [J].计算机时代,2010(2):56-57.
[6] 张威,孙玉秋,赵天玉.一种基于频率域和空间域相结合的图像增强方法 [J].长江大学学报(自科版),2013,10(19):50-52+161.
[7] 葛小凤,陈亚军.经典边缘检测算子及其抗噪性能研究 [J].数字技术与应用,2015(2):107-109.
[8] 贺桂娇.几种经典的图像边缘检测算子分析比较 [J].计算机光盘软件与应用,2014,17(9):182-183.
[9] 李硕明,付仲良,彭彬慧.基于字符行特征的车牌倾斜矫正算法 [J].江汉大学学报(自然科学版),2006(1):35-37.
[10] 路小波,包明,黄卫.基于投影的车牌倾斜检测方法 [J].交通运输工程与信息学报,2004(4):10-15.
[11] 吴一全,丁坚.基于边缘点投影方差最小的车牌倾斜校正方法 [J].系统仿真学报,2008(21):5829-5832.
[12] 黄红燕,叶绿.文字图像的整体倾斜矫正 [J].计算机工程与应用,2006(6):58-61.
[13] 谭司庭,胡志坤.基于HSV色空间的车牌定位综合方法 [J].计算机与应用化学,2011,28(7):903-906.
[14] 张丽静,孙杰,殷晓宇.基于HSV颜色空间的车牌定位方法 [J].微计算机信息,2008(7):247-248.
[15] 常巧红,高满屯.基于HSV色彩空间与数学形态学的车牌定位研究 [J].图学学报,2013,34(4):159-162.
[16] 牛欣,沈兰荪.基于特征的车辆牌照定位算法 [J].交通与计算机,2000(1):31-33.
[17] 蔡钦涛,方水良,任俊.基于边缘生长的车牌定位新方法 [J].公路交通科技,2004(11):110-113.
[18] 胡峰松,朱浩.基于HSI颜色空间和行扫描的车牌定位算法 [J].计算机工程与设计,2015,36(4):977-982.
[19] 王枚,王国宏,潘国华.融合边缘检测与HSV颜色特征的车牌定位技术 [J].计算机应用研究,2007(8):209-211.
[20] 杨涛,张森林.一种基于HSV颜色空间和SIFT特征的车牌提取算法 [J].计算机应用研究,2011,28(10):3937-3939+3976.
[21] 黄文杰.基于投影的车牌字符分割方法 [J].现代计算机(专业版),2009(8):57-60.
[22] 蒋传伟.车牌识别系统中车牌定位与字符分割的研究 [D].武汉:华中科技大学,2006.
[23] 兰伟.验证码字符图像分割技术研究 [J].软件导刊,2014,13(10):130-131.
[24] 李强,张钹.一种基于图像灰度的快速匹配算法 [J].软件学报,2006(2):216-222.
[25] 顾晨勤,葛万成.基于模板匹配算法的字符识别研究 [J].通信技术,2009,42(3):220-222.
[26] 杨海廷.基于纹理特征的车牌识别系统的研究与实现 [D].成都:电子科技大学,2005.
[27] 贾婧,葛万成,陈康力.基于轮廓结构和统计特征的字符识别研究 [J].沈阳师范大学学报(自然科学版),2006(1):43-46.
[28] 吳裔慧.基于卷积神经网络的场景理解方法研究 [D].北京:清华大学,2015.
[29] 陈先昌.基于卷积神经网络的深度学习算法与应用研究 [D].杭州:浙江工商大学,2014.
[30] 何小飞,邹峥嵘,陶超,等.联合显著性和多层卷积神经网络的高分影像场景分类 [J].测绘学报,2016,45(9):1073-1080.
[31] 谢宝剑.基于卷积神经网络的图像分类方法研究 [D].合肥:合肥工业大学,2015.
作者简介:邓嘉诚(1998-),男,汉族,广东湛江人,本科在读,研究方向:AI与机器视觉;通讯作者:魏亚东(1977-),男,汉族,河北武邑人,博士,副教授,研究方向:光电技术及系统、AI与机器视觉与核探测技术等方面。