基于复合特征BP神经网络算法的车牌识别技术研究

2012-02-15 20:34磊,吕
唐山师范学院学报 2012年2期
关键词:隐层车牌识别率

郭 磊,吕 鑫

(安阳师范学院 计算机与信息工程学院,河南 安阳 455000)

基于复合特征BP神经网络算法的车牌识别技术研究

郭 磊,吕 鑫

(安阳师范学院 计算机与信息工程学院,河南 安阳 455000)

传统的模板匹配算法对车牌图像的伸缩、倾斜及背景干扰比较敏感,识别效果不理想。提出将对字符进行归一化处理后所提取的点特征与重心特征进行复合,作为BP神经网络算法的输入特征,大大提高了识别率与识别速度。

BP神经网络;神经元;点特征与重心特征;权值

车牌识别系统工作在室外环境,拍摄的图像易出现变形失真,且分辨率低、易受各种因素干扰。车牌字符识别的典型方法是基于模板匹配的识别方法,但模板匹配法对车牌图像的伸缩、倾斜及背景干扰比较敏感,识别效果不理想。本文提出,将对字符进行归一化处理后所提取的点特征与重心特征进行复合,作为BP神经网络算法的输入特征。大大提高了识别率与识别速度。

1 BP神经网络结构的设计

BP(Back Propagation,前向反馈)神经网络通常是指基于误差反向传播算法的多层前向神经网络。BP网络由输入层、隐层和输出层三层构成,相邻层之间的神经元全部连通,但,同一层中的神经元不连通。如图1所示。

图1结构为典型的只有一个隐层的三层BP神经网络。其中输入层神经元(Input Layer Neuron,ILN)为N个,对应输入为X0、X1…XN-1;输出层神经元(Output Layer Neuron,OLN)为M个,对应输出为Y0、Y1…YM-1;隐层神经元(Hidden Layer Neuron,HLN)为L个。输入层神经元到隐层神经元的权值为Vij(0≤i<N,0≤j<L);隐层到输出层神经元的权值为Wij(0≤i<L,0≤j<M)。

进行神经网络设计的首要任务就是网络结构的确定,一般情况下,网络结构的设计包括:I/O神经元个数、隐层个数、隐含层中神经元数目以及每层传递函数的确定。

1.1 I/O神经元个数的确定

输入层神经元个数根据待识别字符所提取的特征向量维数所确定。在本研究实验中,车牌字符归一化为32× 16点阵大小,以每一个字符像素点为一个网格,根据提取出的点特征及重心特征基础数据,得到一个568维的特征向量,所以,输入层神经元个数取568个。

神经网络输出层神经元个数由设计网络时所采用的输出表示和决策规则所确定。在理论上,对于一个K类分类问题,对K个不同类的整个输入空间,我们需要K个输出表示所有可能的分类决策,当设计神经网络作为模式分类器时,典型的方法是以模式样本和它的类别标记做训练,从而采用“K中取1”的方式来表示目标向量。因此,神经网络输出层神经元的数目就是待识别的类别数K,神经网络输出层的每一个神经元就代表一个目标种类。由于车牌中所含字符分为字母与数字两类,所以,本车牌识别BP神经网络也分为两类:数字网络、字母网络。由于数字网络中只涉及到0-9十个数字,所以,数字网络的输出层神经元为10个;而由于字母网络中只涉及到A-Z,这26个大写字母,所以,字母网络的输出层神经元个数为26。

1.2 隐层数的确定

虽然具有多个隐层的前向神经网络更易于学习,在处理模式识别领域的问题时更能适应平移、旋转或其它变换的不变性,但由于存在着较多的神经元节点和连接权值,因而需要更多的调整与运算,计算量较大,并且划分空间过细容易导致网络的归纳与泛化能力下降。实验证明具有多个隐层的网络更易于陷入局部极小值中。并且,Kolmogorov定理[1]表明,具有单隐层的三层神经网络足够执行任意复杂的函数映射。因此,一般在没有特定的理由要求使用多个隐层时,仅仅使用一个隐层进行处理是最简单的。而本实验的两个神经网络所处理的都是小类别的分类问题,基于此,本设计采用具有一个隐层的三层BP神经网络结构。

1.3 隐层神经元个数的确定

从理论上讲,隐层神经元数量越多,网络越能精确地逼近给定的函数[2]。但随着隐层神经元的数目增加达到一定程度时,计算的复杂度增加,网络训练的收敛速度将降低。太少的神经元数目,在训练网络时可能会陷入局部极小点[3];太多的神经元数目,又会使网络的训练时间过长,而且效果也不好。目前对多层前馈神经网络的隐层神经元数目的确定并没有一个公认或统一的理论作指导[4]。在实际的设计过程中,只有根据以往的经验及实际问题情况,对大量的试验结果进行分析、比较,才可能找到一个较好的确定解。经过大量实验并参考其他学者的研究结果,本实验采用了公式(1)所得到的隐层神经元个数较符合要求:式中,HLN表示隐层神经元个数,ILN表示输入层神经元的个数,OLN表示输出层神经元的个数。根据2.1所述,输入层神经元个数为ILN=568,数字网络输出层神经元个数OLN =10,字母网络输出层神经元个数ONL=26。由此计算出,数字网络的隐层神经元个数HLN=79,字母网络的隐层神经元个数HLN=124。

2 BP神经网络的训练

BP神经网络是采用误差反向传播算法对网络权值进行训练的多层前向网络,其最大特点就是网络的权值是通过使网络输出和样本输出之间的误差平方和达到期望值而不断调整训练出来的。

2.1 能量函数及权值修正公式

神经网络的误差反向传播过程即它的权值修正过程,通过调整权值和阈值,使当能量达到最小时,网络趋于稳定状态。根据BP神经网络算法原理[5],确定出网络能量函数,即误差函数为

其中,Ep表示样本p的输出误差,dp表示样本p的期望输出,op表示输出层神经元的实际输出。则,N个样本的总误差为

根据能量最小原则,推导出权值修正公式为

2.2 训练过程

对于BP神经网络,按照上述的权值修正公式来进行调整网络的权值进行学习训练,当系统的能量达到最小时,网络趋于稳定状态,学习结束[6]。

(1)初始化。将权值、阈值初始化为0到1之间的随机值;

(2)样本输入与期望输出。从样本组中取出输入向量X=(x0,x1,…,xN-1)输入网络,指定期望输出向量为D=(d0,d1,…,dM-1);

(3)计算中间层输出与实际输出。中间层输出向量为H=(h0,h1,…,hL-1)和网络实际输出向量为Y=(y0,y1,…,yM-1);

(4)计算实际输出与期望输出的误差:

(5)计算中间层误差:

(6)调整权值,其中,η为学习因子:

以上过程,就是一次完整的训练过程。用所有样本反复训练网络,多次迭代,直到权值达到稳定。实际训练时,定义出反映实际输出与期望输出误差平方和的价值函数,如公式(2)所示。再定义收敛规则:

其中,p为训练样本数,ε为给定误差范围,当E<ε时,结束训练。经过训练的BP神经网络就可以工作了,对某一个输入可以让它认知,达到识别的效果。

3 实验结果

本次实验主要是对以下两种情况进行了对比:

(1)根据粗网格特征提取的基础数据,使用BP神经网络进行的车牌字符识别情况(简称粗网络BP)。

(2)根据点特征及重心特征提取出的基础数据,使用BP神经网络进行的车牌字符识别情况(简称复合BP)。

本实验所使用的字符样本分别为:字母E和数字3。各取样本300幅。部分识别情况如表1和表2所示。

在字母E的300幅样本中,如果是采用粗网格特征作为特征向量输入BP神经网络,识别正确幅数为236,识别错误64幅,识别率为78.67%;若是采用点特征与重心特征作为特征向量输入BP神经网络,识别正确幅数为259,识别错误41幅,识别率为86.33%。如表3所示。

在数字3的300幅样本中,若是采用粗网格特征作为特征向量输入BP神经网络,识别正确幅数为254,识别错误46幅,识别率为84.67%;如果是采用点特征与重心特征作为特征向量输入BP神经网络,识别正确幅数为273,识别错误27幅,识别率为91.00%。如表3所示。

4 结论

采用点特征与重心特征的复合特征作为特征向量输入BP神经网络对车牌字符进行识别时,具有比较高的识别率。其局限性的在于,对于待识别字符比较多及对汉字的识别结果并不令人满意。

[1] 蔡义发.神经网络计算机系统及其现状[J].计算机科学, 1990(2):30-32.

[2] 雷鸣,朱心飚,尹申明,杨叔子.自构形神经网络及其应用[J].计算机科学,1994(1):52-54.

[3] 孟祥武,程虎.优化神经网络结构[J].计算机研究与发展,1997(8):594-598.

[4] 刘建英,徐爱萍.自组织神经网络在模糊聚类中的应用研究[J].微机发展,2005(12):81-84.

[5] 孙功星,戴贵亮.神经网络设计的特征空间序贯划分算法[J].计算机科学,2003(11):36-37.

[6] 王明会,潘新安,钟义信.用分组神经网络识别手写体数字[J].北京邮电大学学报,1993(4):12-15.

(责任编辑、校对:田敬军)

Study on Vehicle License Plate Recognition Based on Hybrid Feature BP Neural Network Algorithm

GUO Lei, LV Xin

(School of Computer and Information Engineering, Anyang Normal University, Anyang 455000, China)

The traditional template matching algorithm is sensitive to the stretching, tilt and background interference of vehicle license plate images, but the recognition result is not satisfactory. In this paper, through normalization processing of characteristics, the point feature and barycenter feature extracted are composted, as the input feature of BP neural network algorithm. The method greatly improved the recognition rate and recognition speed.

BP neural network; neurons; point feature; barycenter feature; weight

TP399

A

1009-9115(2012)02-0056-03

2011-09-19

郭磊(1976-),男,河南安阳人,硕士,讲师,研究方向为数据库与数据仓库、决策支持系统。

猜你喜欢
隐层车牌识别率
基于RTD可编程逻辑门的n变量函数实现算法
一种自适应确定隐层节点数的增量半监督超限学习机算法
数字图像处理技术在车牌识别系统中的应用
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
基于RDPSO结构优化的三隐层BP神经网络水质预测模型及应用
提升高速公路MTC二次抓拍车牌识别率方案研究
代价敏感正则化有限记忆多隐层在线序列极限学习机及图像识别应用
第一张车牌
基于MATLAB 的车牌识别系统研究