楚 岩,邵 严,陈 亮,巨永锋
(长安大学 电子与控制工程学院,陕西 西安 710064)
一种车牌识别软件系统研究
楚 岩,邵 严,陈 亮,巨永锋
(长安大学 电子与控制工程学院,陕西 西安 710064)
针对现有车牌识别算法中的车牌定位、字符分割和字符识别三个核心模块存在的不足,提出了一种基于边缘两侧颜色检测的车牌定位方法;通过采用动态阈值调整方法,很好的实现了字符分割;对神经网络在字符识别技术中的应用进行了大量的研究和实验,根据汉字和数字、字母特征提取的不同,在对字符信息初识别时将汉字和数字、字母采用不同结构参数设置的神经网络进行识别,并对识别结果中包含的具有形体相近的字符提出了一种“不等权值”的方法。结果证明识别率有了明显提高。
车牌识别;边缘检测;动态阈值调整;神经网络;不等权值
随着我国交通管理自动化的快速发展,车辆牌照识别技术已成为我国实现交通智能化的重要组成部分,被广泛应用于停车场管理、高速公路电子收费系统ETC(Electronic Toll Collection)、违章交通管理系统等方面,对于全面建设智能交通系统ITS(Intelligent Transportation System)具有十分重要的意义[1]。
早在20世纪90年代初国外研究人员就己经开始了对车牌识别系统的研究,应用最多的实现方法就是首先对车牌图像进行图像处理分析、然后进行车牌定位、车牌字符分割和字符识别,最终通过将识别出的单个字符信息进行组合从而得到完整的车牌信息。我国开始对车牌识别系统的研究主要始于90年代中期,在人们对车牌识别系统算法研究的过程中,虽然尝试过各种方法,也提出了许多新的理论和改进方法,但由于车牌自身所包含的特征的复杂性与不确定性,车牌图像信息质量对拍摄角度的严重的依赖性以及车牌本身污染或车牌信息断裂等原因使得车牌识别系统发展缓慢。文中针对现有车牌识别算法中的车牌定位、字符分割和字符识别3个核心模块存在的不足,进行了优化和完善。
通过CCD摄像机得到的车辆图像信息中包含许多颜色分布相近的区域,如果仅以简单的规则来作为连通区域划分标准会产生许多无用的连通区域和干扰信息,从而增加了车牌定位的计算量和降低了准确率。本文通过对我国大量车牌图片进行分析,总结出我国车牌颜色配比固定为深蓝底色配白字字体、白色底色配黑字或红字字体、黑色底色配白字字体和黄色底色配黑字字体的分布特点,一共涉及到6种颜色信息。通过对大量车牌图片实验研究,总结出以上6种颜色在HSV颜色模型中的阈值,例如白颜色在HSV模型中的阈值为V>80,S<0.3,蓝色在HSV模型中的阈值条件为45<H<48,S>0.1等[2]。同时满足这两个条件便可判断出蓝底白字车牌在图片中的边缘分布情况,其他类别车牌边缘判别处理类似。在图像背景非常混乱的情况下,忽略图片中其他类型边缘,只考虑蓝-白、白-黑、黑-白和黄-黑四种颜色的边缘分布。这样,只有极少数的边缘图像被检测到,极大的减少了干扰区域产生的边缘信息对车牌边缘信息提取产生的影响,省去了大量的无用计算过程,提高了车辆牌照区域定位的准确率。
阈值的选取在车牌灰度图像二值化处理过程中显得尤为重要。把值为1的点视为前景区域,值为0的点视为背景区域。如果阈值选择过高,则可能造成车牌区域图像点被划为背景图像,以致无法识别。如果阈值选择过低,则有过多背景图像点被划入车牌区域,与字符信息相粘连,影响识别准确度。所以阈值选区是否合理,直接影响到车牌图像识别系统的整体效果。文中采用了最大类间方差法进行阈值的选取[3]。
最大类间方差法的实现思想是:设图像像素为N,灰度范围为[0,L-1],对应灰度级的像素数为 ni,几率为:
把图像中的像素按灰度值用阈值T分为两类C0和Cl,C0由灰度值在[0,T]之间的像素组成,C1由灰度值在[T+1,L-1]之间的像素组成,对于灰度分布几率,调整图像的均值为:
则C0和C1的均值为:
由上面3式可得:
类间方差定义为:
让T在[0,L-1]范围内依次取值,使 σ2最大的 T值就是最佳阈值。
然而最大类间方差法求出的阈值并不是最合理的,应根据具体情况实时修改,才能使得二值化效果达到最好的效果。
文中实现二值化阈值可调的方法步骤如下:
1)首先将最大类间方差法计算的值作为车牌图像的初始阈值,并以此对图像进行二值化;
2)统计二值化后图像白点的总体数目,如果总数占所有像素点的比例在0.2~0.3之间,则以当前阈值作为二值化阈值,如果白点所占比例大于0.3,则说明阈值过小,应适当增大阈值;若白点所占比例小于0.2,说明阈值过大,应适当减小阈值。
3)运用新阈值重新进行二值化,按照步骤2)再次判定,直到求出最佳二值化效果阈值。
为了避免字符偏离中心位置或大小不一对网格的特征提取产生较大偏差的影响,首先应对字符进行归一化处理。归一化处理就是通过裁剪除字符以外的其他区域,将字符进行填充到统一大小,并将偏离中心位置的待识别字符的中心点统一到相同位置。文中将字符归一化为32×32的尺寸大小。
文中采用粗网格特征提取[4]和线素特征提取相结合[5]的方法,对归一化的待识别字符进行特征提取。粗网格特征又称局部灰度特征,它将通过把归一化之后的字符分为4×4个网格,统计每个网格中白色像素点数目,从而得到16个特征;线素特征提取是统计待识别字符某一行或某一列总像素数字符的局部特征,文中分别在字符水平方向和垂直方向三等分处各做直线穿过整个字符并统计线穿过的白色像素点数从而得到4个特征,如图1所示。在识别阶段,把各个部分特征组合起来作为字符的统计特征。
图1 线素特征提取示意Fig.1 Line element feature extraction
1)训练样本库设计
本文设计的BP神经网络训练样本库由500张字符训练样本组成,该500张训练样本针对我国车牌所包含的26个汉字和34个字母,在复杂环境下拍摄的1000张具有代表性的车牌图像中提取。
2)BP网络结构设计
①输入层节点数
输入层节点数根据待识别字符所提取的特征维数决定,例如本设计中的字母和数字提取了20个局部特征,汉字提取了46个局部特征,因此它们的输入层节点数分别为20和46。
②隐含层个数
虽然隐含层的个数越多网络的非线性越好,学习速度越快,但是计算量也随之成倍增加,容易导致BP网络的归纳能力和逼近能力的下降,所以在达到相同误差目标的情况下,应尽量少使用隐含层。而且根据研究表明,用单隐层的BP函数可以逼近任何在闭区间内连续的函数。因此本设计采用具有单个隐含层的BP网络。
③隐含层神经元数目[6]
隐含层节点数的确定是设计者根据经验确定的。但是隐含层的节点数却非常重要,如果隐含层节点数过少,训练网络时可能会出现误差陷入局部极小点,始终无法收敛。同样,隐含层节点数过多会导致网络计算时间过长、误差增大,从而导致网络性能下降、不能识别未知的样本。公式 (8)是一个可用于选择最佳隐含层节点数的经验公式:
其中,s为隐含层数目,m为输入节点数,n为输出节点数。
④输出层节点数
输出层节点数是由所采用的目标种类表示方法所确定。常用的表示方法有两种:一种是一个输出层节点对应一个目标种类,即目标种类的个数就是输出层节点的个数,这种表示适用于目标种类较小的情况。另一种是采用目标种类的二进制表示,即如果目标种类为N=2M个,输出层节点为M个,这种表示方法适用于目标种类较多的情况。文中训练的汉字子网共有26个汉字,所以采用第一种表示方法,输出层节点数为26,字母数字子网有34个字符,因而输出神经元数目为34。
车牌识别系统的两个神经网络的网络结构和训练参数设置如表1所示。
表1 车牌识别系统的两个神经网络的网络结构和训练参数设置Tab.1 Network structure and training parameter settings of two neural network of license plate recognition system
权值和阈值的初始化。初始权值和阈值直接影响到网络训练的迭代次数、网络是否收敛,所以需要慎重选择。如果所选择的初始权值或阈值过大或过小,都会使激励函数的输出值落入饱和区,导致权值和阈值更新过慢,网络无法收敛。经过多次实验测试,本设计的网络初始权值和阈值取(-1,1)之间的随机数为最佳。
学习函数的确定。学习速率决定每一次循环训练所产生的权值变化量。大的学习速率可能导致系统不稳定,小的学习速率导致较长的训练时间,可能收敛很慢,学习速率选取范围在0.01~0.8之间。
在车牌字符信息中含有一些形体十分相近的字符[7],经大量实验表明,这些相近字符因为模板自身的相似性导致在分类时出现误分类的概率比其他字符约高出20%左右,直接影响到车牌字符的最终识别效果。所以在经过以上字符识别后仍要对识别结果中包含相近形体的字符进行区分识别,从而增加车牌字符识别的准确率。
在对相似字符进行识别时,首先将待识别字符划分为6个不同的子区域, 分别定义为 A11,A12、A21、A22、A31 和A32,如图2所示。
图2 字符子区域划分Fig.2 Character sub-zoning
对于车牌信息中含有的形体相近字符仅有个别区域存在不同,针对这个特点,在构造判别函数时,相应的将这些区域所占的权值增大,减小其余相似部分的权值,在获得待识别字符的特征向量时用该区域提取的特征值与赋予的权值系数做乘法运算,将该结果用以构造判别函数,以达到在识别过程中对不同区域赋予的权重,突出两个字符的不同。通过对实验结果归纳总结得到常见相似字符的子区域权值取值如表2所示。
表2 常见相似字符的子区域权值Tab.2 Sub-area weights of common similar characters
该识别算法与普通识别算法的最大区别在于规定子区域权值,实现了对形体相近字符的精准判别,因此在进行算法比较时采用了两种测试方式,算法的识别效果比较如下:
第一种测试方式:将形近字符校正加入到整个识别算法之中使识别一次完成,以是否加入形近字符校正为区别,参加测试的是所有车牌字符样本未经任何事先选择,识别统计数据如表3。
第二种测试方式:将形近字符校正单独取出进行测试,以使用原识别算法与形近字符校正为区别,参加测试的是车牌字符样本中的相似字,即前述的相似字组合中的任意一个,识别统计数据如表3。
表3 识别统计数据Tab.3 Identifying statistics
文中主要介绍了车牌识别系统的软件设计方案,具体的算法为图像预处理、车牌定位、字符分割和字符识别4部分。现有的车牌识别算法己有很多,但都有自己的缺点,要么识别率低,要么识别速度慢。本设计采用HSV彩色空间对图像做预处理;通过彩色边缘对检测与数学形态学相结合的方法对车牌区域进行定位;在字符分割部分通过采用动态阈值调整方法,很好的实现了字符分割;利用BP神经网络训练了一个字符分类器对分割出的字符进行识别,并对识别结果中包含的具有形体相近的字符提出了一种 “子区域不等权值”的方法进行校对。最后通过实际测试,给出系统的识别率。
[1]刘丽英,潘景山,史永,等.智能交通系统的发展状况研究[J].信息技术与信息化,2005(6):17-18.
LIU Li-ying,PAN Jing-shan,SHI Yong,et al. The development research of intelligent transportation systems[J].Information Technology and Information,2005(6):17-18.
[2]黄信想,刘秉瀚.基于HSV色彩空间的云模型车牌阴影检测[J].福州大学学报:自然科学版,2008,36(6):809-813.
HUANG Xin-xiang,LIU Bing-han.Vehicle shadow detection based on HSV color space and cloud model[J].Journal of Fuzhou University:Natural Science,2008,36(6):809-813.
[3]Dubey P.Heuristic Approach for License Plate Detection[C]//IEEE.Proceedings of IEEE Conference on Advanced Video and Signal Based Surveillance, Italy,2005:366-370.
[4]JIA Wen-jing,ZHANG Huai-feng,HE Xiang-jian.Mean shift for accurate license plate localization[A].IEEE.Proceedings of the 18th International IEEE Conference on Intelligent Transportation Systems, HongKong,2005:566-571.
[5]童剑军,邹明福.车牌字符的一种精判别识别方法[J].计算机工程与应用,2005(2):223-226.
TONG Jian-jun,ZOU Ming-fu.A Method of discerning precisly in plate license character recognition[J].Computer Engineering and Applications,2005(2):223-226.
[6]Hegt H.A.,Khan N.A..A high performance license plate recognition system [C]//IEEE. Proceedings of IEEE Conference on Systems, Alaska,1998:4357-4362.
[7]WANG Shen-zheng,Lee H..Detection and recognition of license plate characters with different appearances[A].IEEE.Proceedings of 2003 IEEE Intelligent Transportation System,Shanghai,2003:979-984.
Study of License plate recognition software system
CHU Yan, SHAO Yan, CHEN Liang, JU Yong-feng
(Electronic&Control Engineering Department,Chang’an University,Xi’an 710064, China)
For the shortcomings of the existing license plate recognition algorithm in three core modules of license plate location, character segmentation and character recognition, proposing a license plate location method based on the edge of both sides of the color detection; The method of dynamic threshold adjustment achieved the character segmentation well;Much research and experiment for neural network applications in character recognition have been done.According to the different of feature extraction of characters, numbers and letters, the different network parameters are set to recognition.For similar character of recognition results,proposing a method of differ-weights.The results show that the recognition rate has been markedly improved.
license plate recognition; edge detection; dynamic threshold adjustment; neural network; differ-weights
TP31
A
1674-6236(2013)04-0149-03
2012-11-16稿件编号201211128
楚 岩(1962—),女,河南荥阳人,副教授。研究方向:电子技术应用。