陶恂 杨敏
(1.上海电机学院,上海 200240;2.上海电气自动化设计研究所有限公司,上海 200023)
车牌识别系统研究
陶恂1杨敏2
(1.上海电机学院,上海 200240;2.上海电气自动化设计研究所有限公司,上海 200023)
车牌识别系统是智能交通系统(ITS)的一个重要组成部分,一个典型的车牌识别系统一般包括图像预处理、车牌定位与提取、字符分割和字符识别等几大模块。根据实际应用情况,对目前使用的车牌识别关键技术、算法进行了简要的总结和详细的分析。
车牌识别 车牌定位 字符分割
随着计算机和视频技术的发展,车牌自动识别系统己成为智能交通系统的重要组成部分,并已广泛应用于车辆追查和跟踪、车辆出入控制、公路收费监控等领域。一个车牌识别系统的组成主要有这几个各部分:图像采集、图像预处理、车牌提取、字符分割、文字识别、结果优化处理[1]。目前国内外已有很多专业人员开展了车牌识别技术的研发和探索,并取得了一定的成果,在不同的处理阶段提出了很多新的技术和改进算法,不断推动着车牌自动识别技术的发展。
一种车牌识别系统的优劣主要从识别速度、识别率和适应性等方面进行判定。车牌识别技术的主要难度在于车身周围环境的不确定性;车牌字迹的模糊、磨损;车牌文字的特殊组成(汉字,字母和数字)等因素。因此车牌识别技术要符合实际环境的要求,在不断的实践运用中积累经验,改进和提高相关技术水平,以适应对车牌高速、准确的识别要求。
车辆识别系统中的车辆图像是通过图像采集卡将运动的车辆抓拍下来,并以位图的格式存放在系统内存中的。为了尽量获取到较清晰的车牌图像画面,摄像头应设置为手动1/1000以上,快门速度太低无法清楚地拍摄运动的物体。在保证图像亮度不是太低,并且图像噪声不高的情况下,快门速度应该尽可能快,这样可以保证高的图画质量。
镜头焦距应设置为手动,调整摄像头的位置,使车牌在图像中尽量水平。镜头光圈应可设置为自动,图像不能太亮,稍微偏暗点对识别有利,镜头的焦距越远识别越好。
将获取的图像按照下面的流程进行传输。
图1 摄像头图片传输流程图
通过雷达(及线圈)的检测,根据车速触发抓拍摄像机连拍,筛选后对清晰度较高的图像进行车牌过滤,识别出的图像保存在计算机及存储介质中。
国内外车牌定位的方法有很多,如基于特征的车牌定位算法;基于变换函数获取车牌的定位算法;基于水平线搜寻的定位方法;基于扫描行的车牌提取方法等等。这些定位方法在不同的环境背景下都存在着一定的局限性和不确定性,不能满足目前复杂背景、多重干扰的场合要求。
通过实践证明改进原有的车牌定位算法,采取该方法后,能够提高车牌定位的准确性。首先对读入的图像进行灰度化、灰度拉伸,选择图像差分的边缘检测,然后采用改进的投影法对图像进行水平定位,在粗定位的基础上进行车牌精确定位,最后采用投影法对图像进行垂直定位,确定车牌区域。
一般情况下,由CCD采集到的图像会有不理想的情况,如光线过强,或者偏弱,这些都会对后续的图像处理产生影响。且车牌位于车身下部,靠近散热片,对比度较差,如果直接对灰度图像进行定位会有较大的困难,为了获得较好处理的灰度图像,在对CCD采集的原始图像进行灰度化后,其灰度要转换。
首先对图像灰度拉伸,使灰度级占据0-255整个区域,这样减少了光线过强,或者偏弱时造成的灰度级过少。直接采用直方图均衡化的方式,处理简单,运算量小,效果较理想。
边缘提取的最大好处就是能够突出边缘区域,并使背景图像中无关的部分暗淡。车牌部分是边缘相对集中的区域,在对其边缘分割后,可看到车牌部分很明显的突现出来。实现方法中,采用了水平差分算法,它利用图像后一列像素减去前一列像素,从而得到边缘图像,再对所得的图像进行二值化处理。实验结果如图2所示。
由图2可见,图像经过差分二值后,车牌区域明显可见。
图2 边缘提取后的图像
车牌由字符、背景和边框组成,提取图像的边缘图像后,字符与背景处形成了较强的边缘。通常车牌位于汽车缓冲器上或附近,靠近整幅图像的下部,再往下便是路面,路面比较光滑,故可在边缘提取时就很有效的将这部分杂质过滤除掉,使干扰图像的噪声处于车牌之上,如车灯,或散热片。由此,采用由下而上的扫描方法,对边缘图像的象素沿水平方向累加产生一个投影图,如图3所示。可以看出有车牌字符的地方,灰度值较高,且处于图像的下部。由此,先进行粗略定位,找寻水平投影图大于3分之2最大值的点,找到该点对应的横坐标的最大值,记录坐标,该点记为车牌的下边界。根据车牌的几何特征(在初始处对图像进行归一化处理统一成1000×800的大小),车牌高度大约占100个像素,考虑到噪声等因素的影响,粗略将上下边界分别定义为最大值-120,最大值+50。在上下界粗定位的基础上进行精细定位,即对图像再进行水平投影,找寻大于三分之二最大值的点,记录该点所对应的横坐标的最大值和最小值,此两点即为车牌的上下边界点,如图4所示。
在定位出上下边界后,再对特征图像进行垂直投影,对投影图进行处理,重复水平定位的理念,找寻大于三分之二最大值的点所对应的横坐标的最大值和最小值,即为车牌的左右边界点,完成定位。为之后方便处理字符识别,可根据找寻的边界点,对该灰度增强后的图进行定位,如图5所示。
图5 垂直投影图
目前,字符识别主要有基于人工神经网络算法和基于模板匹配算法。基于模板匹配算法是先将分割后的字符二值化,将其尺寸大小缩放为字符数据库中的模板大小,然后与所有的模板进行匹配,最后选最佳匹配作为结果。实践运用中得到验证,采用并改进基于模板匹配算法,能较好的识别车牌字符。
前面的车牌定位时已经将二十四位真彩图像转换成八位灰色图像,用一个字节表示一个像素点,即一个字节能表示256种灰度,这对于提取出字符特征,是比较困难的,需要做进一步的变换,将灰色图像转化为黑白二色图像,这个转换过程称作二值转换。常用的车牌图像二值化方法是将各个像素灰度值与一个经验值(常称阈值)相比较,如果该值少于阈值,则灰度值取“0”(即黑色),否则为“255”(即白色)[2]。通常根据该车牌灰色图像的直方图获得最大和最小灰度值,并设定阈值为最小和最大灰度值的平均值,然后通过这二个区域的灰度迭代出最佳阈值[3]。但实际操作中,二值化转换需要分区进行,否则会形成字符笔画加粗和断裂等情况。
在实际操作中采用的转换算法:在8位灰度图像中,一个像素点占用一个字节,即0-255,为区分特征区域(即需要识别的字符)和非特征区域(即字符外的背景区域),需要用阈值区分,大于阈值则为255,小于则为0。在单一的拍摄条件下,取唯一一个阈值即可完成区分特征区域的工作,但是由于光线和色彩对图像的影响,唯一阈值会因图像的整体灰度值太低(比如由于图像太暗造成)或太高而不能完全区分。所以确定这个阈值需根据整个画面的灰度状态来确定,这里使用的是 OTSU自动阈值算法[4]。
OTSU算法具体步骤如下:设图象包含L个灰度级(0,1…,L-1),灰度值为i的象素点数为Ni,图象总的象素点数为N=N0+N1+...+N(L-1)。灰度值为i点的概率为
门限t将整幅图象分为暗区c1和亮区c2两类,则类间方差σ是t的函数:
式中,aj为类cj的面积与图象总面积之比,a1=sum(P(i))i- >t,a2=1-a1;uj为类 cj的均值,u1=sum(i*P(i))/a1 0 ->t,
具体实现的源代码(C语言代码)如下:
图6和图7为不同情况下效果图与原图比较:
经过二值化后的图像仍会有斑点,噪声,可采用融合的方法加以处理。
(1) 先取出大于颗粒的特征,颗粒可取5X5~10X10个像素点,这样可直接过滤小噪声。
(2) 将连续取出的特征合并,成为一个个连续的区域(即图中的小方块),如下图8所示
图8 字符分割示意图1
(3) 将符合条件的区域再次合并,这些区域需要满足重心在平均宽高的区域内,合并需要满足两个区域之间的距离小于10个像素,合并后,如下图9所示:
图9 字符分割示意图2
因扫描得到的图像字符大小存在较大的差异,统一尺寸有助于字符识别的准确性,提高识别率,从而与模板进行匹配。归一化主要包括位置归一化、大小归一化及笔划粗细归一化(常用细化算法)。在此对大小归一化。对不同大小的字符进行变换,使之成为同一尺寸大小的字符,这个过程称为字符大小归一化。归一化后,许多特征就可用于识别不同字号混排的字符[5]。
首先对图像二值化处理(此处的阈值根据大津法得到),然后将字符的外边框按比例线性放大或缩小成为规定尺寸的字符。为了之后模板匹配的处理,对二值化的图像进行反二值化处理(把原来数值为0的点变为255,255的变为0,即黑白颠倒一下),如图10所示。
图10 图像归一化
识别分割后字符的方法主要有以下几种方法[6,7]:
(1)利用字符的结构特征和变换(如Fourier变换、Karhunen-Loeve变换等)进行特征提取。该方法对字符的倾斜、变形都有很高的适应性,但运算量大,对计算机性能的要求较高。
(2)利用字符统计特征进行特征提取。如提取字符的投影特征、网格特征和轮廓特征组成字符特征矢量进行匹配的方法,识别率较高。
(3)基于字符结构分析的识别方法。该方法可识别有较大旋转、变形、缩放的字符图像,但需进行复杂的字符笔划分析和抽取,对字符图像质量要求较高。
(4)模板匹配法。由于车辆牌照字符中只有26个大写英文字母、10个阿拉伯数字和约50个汉字,所以字符集合较小,该方法对于有一定变形、污损或笔画缺损的字符图像有较好的识别效果,总体识别率较高,同时也能满足实时性的要求。
经过实验分析,采用模板匹配算法,将分割出来的字符图像与模板图像相减,差值最小的便是与之匹配的模板,从而识别出字符。
车牌识别系统的关键技术是车牌区域定位和字符识别,本文对这两大模块进行了设计总结。通过实践应用,阐述了这两大技术的要点和改进措施,以及在实践应用中的可行性。为在不同环境下达到更准确、更快速的车牌识别目标提供了一定的参考基础。
[1]陆福宏.车牌识别技术在智能交通系统的应用研究[J].中国科技博览,2010(12):302.
[2]彭健敏.车牌识别中的车牌定位与字符识别技术研究及实现[D].长沙:湖南大学,2006:9-10.
[3]孔平,严广乐,戴秦,等.基于分形维数的车牌识别二值化算法[J].计算机工程与应用,2007,43(30):184 -185,248.
[4] Otsu N.A Threshold Selection Method from Gray-Level Histograms[J].IEEE Transactions,Systems,Man and Cybernetics,1979,9(1):62-66.
[5]李波,曾致远,周建中,等.一种车牌自动识别系统设计方法[J].计算机应用研究,2006(10):156 -158,162.
[6]李孟歆,吴成东.基于分级网络的车牌字符识别算法[J].计算机应用研究,2009(5):1703-1705.
[7]徐应涛,陆福宏,张莹.基于填充函数法训练BP神经网络的车牌字符识别算法[J].计算机工程与科学,2009(5):59-61.
License Plate Recognition System Design and Realization
Tao Xun Yang Min
(1.ShanghaiDianjiUniversity,Shanghai200240,China;2.ShanghaiElectricalAutomationD&RInstituteShanghai200023,China)
license plate recognition system is the important part of the Intelligent Transport System(ITS),a typical license plate recognition system Generally include image preprocessing,license plate location and extraction,character segmentation and character recognition,and othermajormodules.A brief summary of these existing key technologies,a brief summary of the algorithm from this thesis,and analyze their advantages and disadvantages.
License plate recognition license plate loc alization character segmentation
TP391.4
A
1000-3886(2011)04-0077-04
2011-02-14
陶恂,(1967-),女,江苏人,讲师,研究方向:计算机应用和图像处理。 杨敏,(1984-),女,上海人, 研究方向:自劝控制。