史 燕 吕永战 张 帆
摘 要:根据车牌几何形状和纹理的特点,提出了基于图像的特征线确定二值化阈值的方法。为了解决车牌图像倾斜对字符分割与识别带来的不良影响,对一种基于字符间投影距离的倾斜校正方法做了研究。在该方法中,根据倾斜车牌与非倾斜车牌字符的投影距离大小比较来确定车牌图像的倾斜角度,再用基于双线性插值的旋转方法进行矫正。针对该方法的不足之处,提出了该算法的改进算法。试验结果表明,该算法是快速而有效的。
关键词:车牌识别;特征线;二值化;投影间距;倾斜校正
中图分类号:TP391.4文献标识码:B
文章编号:1004-373X(2009)05-149-04
Binary Conversion and Slant Correction Algorithm in Preprocessing of
License Plate Recognition
SHI Yan,LV Yongzhan,ZHANG Fan
(China Airborne Missile Academy,Luoyang,471009,China)
Abstract:According to plate shape and char texture,an algorithm applied to license plate binary conversion of vehicle image based on feature line is introduced.In order to resolve the difficulties in character segmentation and adverse impact to the final recognition rate,a new method is presented based on characters vertical projection distance.The method first analyses the change of distance between two characters which comes from the vertical projection towards lean image and horizontal image,the lean angle of image is found out,and then,a horizontal image is gained by the rotation based on bilinear interpolation.Considering the defects of this method,an optimum algorithm is introduced.Experimental results are provided to demonstrate the performance of the proposed algorithm.
Keywords:license plate recognition;feature line;binary conversion;vertical projection distance;slant correction
0 引 言
车牌识别技术(License Plate Recognition,LPR)是计算机视觉与模式识别技术在智能交通领域应用的重要研究课题,是实现交通管理智能化的重要环节。车牌自动识别系统是对经摄像头拍摄的图片利用图像处理的分析方法,提取出车牌区域,进而对车牌区域进行字符分割和识别。车牌图像的倾斜校正是车牌定位和字符分割间的一个重要处理过程。在图像采集系统中,由于拍摄条件的多样性和实际情况的差异性,采集到的图像质量差别很大,难免会造成了图像的倾斜,这种倾斜会给字符分割带来困难,进而影响到字符识别的准确率。因此为确保系统的识别率,有必要在字符分割前对图像进行倾斜校正。
目前,针对机动车牌图像进行校正的研究已经取得了一定的成果,比如Hough变换法和旋转投影法。Hough变换法是先采用轮廓跟踪的方法去除牌照图像中和校正无关的所有冗余信息,然后对图像进行Hough变换检测出边框直线的倾斜角度,最后对图像进行旋转校正。此方法对于图像中车牌的边框受噪声,污迹等干扰影响较大,又或者由于二值化等原因造成粘连和断裂现象的车牌图像校正效果并不理想。通过旋转车牌图像在坐标轴上的投影求取倾斜角度是一种抗干扰能力较强的方法。但是该方法中的最佳倾斜角的求取是一个寻优过程,要进行多次投影逐步搜寻最佳倾斜角,计算复杂度高。
由于字符是车牌图像中最为明显的特征,因此本文把基于字符间的垂直投影距离比较的方法引入图像倾斜校正中,并且提出了该算法的改进算法。该方法不仅避免了Hough变换法对图像边框的特殊要求,而且减少了Hough变换法和旋转投影法的计算量。实验表明,该算法是快速而有效的。
1 车牌图像的预处理
1.1 图像的二值化
二值化算法又称为阈值算法,其目的就是找出一个合适的阈值,将待研究的区域划分为前景和背景两部分。本文中将字符像素称为目标像素,将非字符像素称为背景像素。针对灰度图像,其二值化过程用公式表示为:
B(i,j)=1,if G(i,j)≥T
0,else
(1)
式中:T为阈值,G(i,j)表示坐标值为(i,j)像素点的灰度值。
图像的二值化关键是阈值的选取。常用的阈值法分为全局阈值法和局部阈值法。全局阈值法是指在二值化过程中只使用一个阈值T的方法,从整个灰度图像的像素分布出发寻找一个最佳的门限值。局部阈值法具体就是首先将图像分解为一系列子图像,然后对每一个子图像计算一个阈值,通过对这些子图像所得的阈值的插值即可得到对整幅图像目标和背景进行分割所需的阈值。全局阈值法优点在于算法简单,但对输入图像存在量化噪声或在不均匀光照等情况下抵抗能力差。局部阈值法相对来说可以获得较好效果,但存在实现速度慢、不能保证图像连通性、以及容易出现伪影现象(即在背景区域受噪声干扰得到图像结果)等问题。
基于车牌图像的几何形状和字符纹理的特点,可以通过提取一条穿过车牌中所有字符的水平线作为特征线,统计该线上的像素点的灰度平均值作为阈值。图1(a)和图1(b)分别为整幅图像的灰度统计直方图和一条特征线上的灰度直方图。通过对比可以看出,在特征线的统计直方图中,目标背景的双峰分布相对平均,且波峰波谷值更为平稳,整幅图像的灰度直方图中波谷值的毛刺现象比较严重。因此可以利用该原理简单的统计平均值方法来确定阈值进行二值化。由于车牌图像的倾斜,特征线有时不能确保穿过所有的字符,为了提高阈值的准确性,可以取多根特征线求取平均值来减小误差。
T=1n∑np=11N∑Nk=1G(J-N,k)
(2)
式中:T为阈值,M,N分别表示图像的行数和列数,G(J-N,k)表示该点的灰度值,n为特征线的数目,通常取J=M/2,围绕J上下取3~5根特征线。其结果见图1(d)。
可见基于特征线的二值化方法相对传统的方法更简单,运算量小且易行可靠,其效果也很好,能够满足后继处理的要求。
1.2 数学形态学处理
由于光照影响、摄像机曝光不足、车牌污损等客观原因的干扰,使所获得的图像在二值化后会有一些缺损或模糊,在图像进行分割识别前需要进行处理。数学形态学是由一组形态学的代数运算子组成,利用形态学进行图像处理的基本思想是:两个运算对象都是集合,假设A为图像集合,B为结构元素,则两个集合不是互相对等的,而是利用结构元素B去探测图像A,看能否将这个结构元素很好地填放到图像内部,同时验证填放结构元素的方法是否有效。数学形态学的基本运算有四个:膨胀(或扩大dilation)、腐蚀(或侵蚀erosion)、开启(open)和闭合(close)。由这四种基本运算可以推导和组成各种数学形态学实用算法。用这些运算子及其组合来进行图像形状和结构的分析及处理,包括图像分割、特征抽取、边界检测、图像滤波、图像增强和恢复等方面的工作。
图1 基于特征线的车牌图像二值化
在对图像进行形态学处理时,通过选择适当的结构元素,开运算具有平滑功能,能够清除毛刺,切断细长搭接而起到分离作用;闭合运算具有过滤功能,可以填平缺口、孔洞和裂缝,搭接短的间断而起到连通作用。在实际应用中,对二值化后的图像采用了开运算,可以根据需求进行多次重复运算,运算后图像的位置和大小形状不变。
2 车牌图像的倾斜校正
2.1 基本原理及算法过程
通常图像的旋转是以图像的中心为原点,旋转一定的角度,若要保持原有图像的大小需要将转出显示区域的图像截除。假设图像围绕坐标轴原点旋转,旋转前坐标表示为:
x=rcos αy=rsin α
(3)
旋转θ后其坐标表示为:
x′=rcos(α-θ)
y′=rsin(α-θ)
(4)
对经过预处理的车牌图像,对其作垂直方向上的投影,对图像上的任意一列白色像素的投影值,如果小于一个自然数,则判断该列属于字符间的距离。可以对每一列的投影值都与该自然数比较,即可计算出相邻字符的间距。 图2,图3所示分别为无倾斜,有倾斜车牌图像及垂直投影图。通过比较分析可以发现:对于没有倾斜的车牌图像,字符间的投影距离是最大的;而对于倾斜的车牌图像,由于字符倾斜使得其投影宽度变大,导致字符间得距离变小。所以对于同一车牌的不同倾斜角度的图像而言,用L1和L2表示两个图像的字符间的投影距离,如果L1>L2,那么图像1的倾斜角度要比图像2的倾斜角度小。
图2 无倾斜车牌图像及其投影
图3 倾斜车牌图像及其投影
在我国,最常见的标准的汽车牌照的长度和宽度是固定的,牌照上的字符个数,单个字符的宽度、高度及字符间的间隔都是统一规定的。因此,对于同一系统采集到的车牌图像中,虽然车牌的大小、位置不固定,但是牌照大小的变化比例是一定的。对于大量的无倾斜车牌图像作归一化处理后,进行垂直投影,可以统计平均出一个字符间的距离作为待识别图像中的最大字符间投影距离。
根据上述原理,可以给出图像倾斜校正的算法过程:
(1) 计算二值图像初始时字符间的投影距离L璳,k=0;
(2) 如果L璳-L<ε,结束;否则将图像顺时针旋转θ角,计算旋转后的图像的字符间投影距离L璳+1;
(3) 如果L璳+1>L璳,k=k+1,θ=θ/2,则返回(2),否则继续执行(4);
(4) 将图像逆时针旋转θ角,计算旋转后的图像的字符间投影距离L璳+1,如果L璳-L<ε,结束;
(5) 如果L璳+1>L璳,k=k+1,θ=θ/2,则返回(4)。
其中:L为统计平均出的最大字符间投影距离,θ角为一个固定较小的角度,ε为一极小的正数。θ,ε都可以根据实际的要求来确定。
2.2 改进算法
从上述的算法可以看出,需要对车牌图像进行多次的旋转。图像的旋转过程实际是坐标变换后进行插值操作的过程。有插值操作就会有一定程度的失真,旋转的次数越多,图像的失真度越大,而且图像旋转时系统花销较大,耗时较长。
通过对上述算法的分析,采用了坐标轴旋转的方法进行改进。该方法不直接旋转图像,而是旋转坐标轴θ角后再进行车牌图像在坐标轴上的投影,然后计算字符间的投影距离,接下来作和上述算法同样的处理,并记录下所有旋转角度的总和,最后对原图旋转一次即可校正角度。
如图4所示,坐标轴x逆时针旋转θ角后为x′。此时图像f(x,y)在x′上的投影通过下式计算:
Rθ(x′)=∫∞-∞f(x′cos θ-y′sin θ,x′sin θ-y′cos θ)dy′
(5)
其中:
x′y′=cos θsin θ
-sin θcos θxy。
采用改进算法后,图像只需旋转一次就可以完成校正,在最大程度上降低了图像的失真度,算法花费的时间也明显减少,为车牌字符的准确分割和识别打下了良好的基础。
图4 坐标轴旋转及图像投影
3 试验仿真
实验算法在Matlab 6.5平台下实现,所用的机器为赛扬1.0 GHz,256 MB SDRAM配置。首
先对现场采集到的100多幅具有不同倾斜角度的车牌图像进行定位,然后对定位后的车牌图像进行图像增强,二值化,形态学运算处理,归一化后再按照上述算法进行校正,均收到了良好的效果。如图5所示。
对图5所示的图像,采用未改进的算法校正的图像整体比较模糊,失真程度比较严重,而采用改进后的算法较之原图像变化不大,失真情况得到很大的改善。
图5 倾斜车牌图像校正结果
4 结 语
本文给出了基于车牌图像特征线的二值化阈值确定的方法和针对车牌图像字符间的投影距离的倾斜校正改进算法。无论从理论上还是试验结果,均表明该方法是行之有效的。与传统的Hough变换法及投影法相
比较,该算法原理简单,计算速度也得到一定程度的提高,为图像的快速倾斜校正提供了一种新方法,新思路。但是该算法对于倾斜角度过大,受噪声污染严重或畸变的车牌图像的校正效果不明显,有待进一步的研究。
参考文献
[1]龚声蓉,刘纯平,王强.数字图像处理与分析[M].北京:清华大学出版社,2006.
[2]张永宜.智能交通系统中多目标检测、识别有关问题的研究.西安:西北大学,2006.
[3]莴挺,沈春林,张金林.车牌识别中倾斜牌照的快速矫正算法[J].计算机工程,2004(7):122-124.
[4]李文举,梁德群.一种新的车牌倾斜校正方法[J].信息与控制,2004,33(2):231-235.
[5]Randen T,Husoy J H.Filtering for Texture Classification:A Comparative Study.IEEE Trans.on Pattern Analysis and Machine Intelligence,1999,21(4):291-310.
[6]张昆,顾国庆.二值图像的一种倾斜调整算法[J].计算机与现代化,1999(2):24-27.
[7]路小波,包明,黄卫.基于投影的车牌倾斜检测方法[J].交通运输工程与信息学报,2004,2(4):10-15.
[8]李硕明,付仲良,彭彬惠.基于字符行特征的车牌倾斜矫正算法[J].江汉大学学报:自然科学版,2006,34(1):35-37.
[9]杨俊,戚飞虎.一种基于形状和纹理特征的车牌定位方法.计算机工程,2006,32(2):200-202.
作者简介 史 燕 1977年出生,硕士研究生。主要研究方向为图像处理与模式识别。