田秋红,孙政荣
(浙江理工大学 信息电子学院,浙江 杭州310018)
条码技术是信息数据自动识别和输入的重要方法。在条码技术中,条码识别是条码技术应用的关键技术。目前流行的条形码在外观上有明显区别:一维码是纵向黑白条纹相间且条纹的粗细不同,通常条纹下还有英文字母或阿拉伯数字。二维码通常为方形点阵形式,由横向和纵向的条码组成,且码区内还会有多边形的图案;应用侧重点也不同:一维条码是对物品类型等基本信息进行标识,不能提供商品的详细信息,要调用更多的信息,需要配合数据库完成。二维条码则是对物品进行描述,可显示更详细的商品内容,识别时不需要配合数据库,操作简单方便。二维条码比一维条码包含的信息容量大,图像结构复杂[1-2],故二维条码被广泛应用到社会、经济、军事和科技等领域。
目前,对于条形码的识别,学者们己经进行了大量的研究。其中边缘检测是简单有效的条形码识别技术,王文豪等人根据QR码图形结构的特点提出了一种基于边缘检测和QR码图形特征的快速检测算法[2],该方法综合运用了图像灰度化、二值化、去噪、边缘检测、图像旋转等多种图像处理方法实现条码图像的预处理、条码定位、条码分割和数据提取。实验表明:此方法大大提高了识读的灵活性和可靠性。余芳等人提出了适合手机组成结构的PDF417二维条形码图像识别算法,在极为有限的手机处理器资源下,针对手机摄像模组普遍存在的光学退化特性提出了图像复原的方法,针对手机应用处理器的特性设计了计算量小、内存开销少的条形码图像识别算法。实测表明,对中小规模的PDF417条形码图像的识别速度和准确度完全达到实用的水平。唐琎等人则提出了对PDF417二维码进行解码时,将二维条码的单元模块宽度的求取和二维码码字的提取分割开来进行,在同等条件下,可以比较精确地提取出图像码字,实验证明此方法具有较高的检测精度。
随着智能手机技术的发展,利用智能手机作为条形码的扫描输入端的应用场合越来越多,并利用手机的通信功能,可以使条形码识别应用于地域分散、数据集中、移动性强的领域。由于在使用手机CMOS摄像头获取条形码图像时,很难保证摄像头位置和被拍图像位置完全相同,故由手机CMOS摄像头抓拍的条形码图像存在旋转、缩放和平移等几何失真现象,或条形码图像在拍摄获取前可能存在磨损或噪声等干扰[3],这些干扰都会影响条形码识别的准确率。
针对以上问题,本文提出了一种基于Hu不变矩和BP神经网络的条形码识别方法。该方法具有实现简单,准确率高,应用范围广等优点。
基于不变矩和BP网络条形码图像识别系统结构如图1所示。由具有2×1GHz双核处理器和500万像素的摄像头的Moto ATRIXTMME860手机对不同条形码拍照,获得不同真彩色条形码图像,由于每次拍摄时,摄像头位置的远近不能保证完全一致,所拍图像存在大小差异,故先对彩色条形码图像进行剪裁完成大小归一化处理,然后对归一化的真彩色图像进行灰度化得到条形码的灰度图像,条形码灰度图像的边缘信息在条形码图像定位与提取中是关键因素,故本文选择了中值滤波[4]对图像进行去噪,去噪处理可以在有效地去除噪声的同时,比较好的保留图像边缘细节,而且图像也不会变模糊,对滤波后条形码图像进行二值化处理得到训练样本,计算原始图像和存在各类几何失真图像的Hu不变矩特征值,输入BP网络进行训练,在不断训练中调整权值、学习因子等参数,使BP网络趋向稳定状态,最后利用训练好的BP网络对各类条形码图像进行分类识别。
图1 条形码图像识别系统
Hu矩是1962年Hu最早提出的二维不变矩理论[5],是提取图像大小、旋转情况等形态特征的方法。由于Hu不变矩概念简单、识别率稳定,具有缩放、平移和旋转不变性,故被广泛的应用在图像识别的特征提取中。基于此本文选择Hu不变矩作为BP网络的特征输入向量。设f(x,y)是图像点 (x,y)的灰度值,则整幅图像的 (p+q)阶矩为[6-7]
为了使上述阶矩在图像平移、缩放和旋转时保持不变性,求其中心矩,定义为[6-7]
其中,x0=m10/m0[60-7],y0=m01/m0[60-7],即整幅图像的重心坐标,(x0,y0)是目标图像区域的灰度质心。显然,中心矩upq是图像平移的不变量。
对上述中心矩规范化,可得到具有图像平移与缩放不变的矩
应用代数不变矩理论,对f(x,y)的 (p+q)阶中心矩归一化后,并进行线性组合[8-9]如下式
这7个不变矩具有图像平移、缩放和旋转不变性,但由于这7个不变矩变化范围很大,可能出现负值,因此实际采用的 不变矩为[10-11]
在实际应用中图像不仅存在位置和旋转差别,而且还有可能存在尺度、对比度上的差别。对式 (5)中不变矩进行组合运算得到式 (6)的各不变矩具有尺度、位置和旋转不变性[10-11]。
本文将式 (6)中的β1,β2,β3,β4,β5,β6作为条形码图像的不变性特征,具有平移、缩放和旋转不变形。
1986年,Kumelhart等人提出的一种按误差逆传播算法训练的多层前馈网络,简称BP网络 (back propagation),是目前应用最广泛的神经网络模型之一。其模型拓扑结构包括输入层、隐层和输出层,具体结构如图2[12]所示。
图2 BP神经网络模型结构
BP算法其实质上是把一组样本输入和输出问题转化为一个非线性优化问题,理论证明,具有非线性Sigmoid函数的三层神经网络可以以任意精度逼近任何连续函数。而实践中由于BP网络存在以下一些缺陷:训练学习的速度非常慢、BP学习算法存在陷入局部极小点的问题等,制约着BP网络的训练速度和识别精度。但BP网络无论在理论上还是实用上都已经相当成熟,故被广泛的应用在模式识别领域,本文选择典型的三层BP网络作为工具,对文中的提取的图像6个不变矩进行训练识别。BP网络结构设置如下:
(1)输入层与输出层节点:BP网络的输入层[12-13]神经元的个数由图像特征值决定,本文以改进的6个不变矩作为图像特征值,故输入层节点数为6;BP网络的输出层节点数的确定是根据所要分的类别数来确定。实验中是针对3类条形码图像进行识别,所以输出层[14]的节点数为3个;输出模式即如果输入为第j类标志,则输出矢量Y= [y0y1…yn-1]中的第j个分量为0.9,其余为0;当第j个分量小于0.5,或实际输出节点同时存在多个较大值时,则拒识别。
(2)隐含层节点:隐含层神经元[12]的个数由式 (7)来确定
式中:n1、m、n——BP神经网络的隐含层、输入层、输出层的节点数。α为1~10之间的整数。
(3)学习因子:BP网络中影响收敛速度的关键因素之一是学习因子α[15]。学习因子大容易使网络产生振荡,学习因子小收敛速度慢、误差大。所以可以采用变步长法对α自适应调整
式中:c——学习次数。
实验时先由具有2×1GHz双核处理器和500万像素的摄像头的Moto ATRIXTMME860手机获得3类不同的真彩色条形码图像,对其分别进行大小归一化处理、灰度化处理、中值去噪处理和二值化处理,以bmp文件格式存储,图像为150×130像素大小,如图3所示。识别中对其灰度图像进行Hu不变矩特征值提取。
图3 灰度一维和二维条形码灰度原始图像
实验对上述三类图像进行了训练和分类识别。分别对三类条形码图像进行旋转、缩放和平移共得到45幅图像,对其提取Hu不便矩特征作为BP网络的训练样本。图4、图5和图6给出条形码用于网络训练的部分图像。
图4 训练的一维条形码旋转部分图像
实验中先分别计算了45幅图像的Hu不变矩特征值,表1和表2分别给出了提取不同失真条件下条形码图像的Hu不变矩特征值的部分结果。从表1中可得,三类条形码图像的6个不变矩特征值存在差别,可以作为分类识别的依据;在表2中,行表示一幅条形码图像的6个不变矩特征值,列表示同一幅条形码图像在不同失真情况下的同一个不变矩特征,对于同幅图像的不同失真情况下的同一个不变矩特征值差别很小,如此可得不变矩具有良好的不变性。图7给出pdf417二维条形码图像发生旋转20度、缩小0.9、放大1.1和下移等几何失真时与原始图像的Hu不变矩的对比结果,从图7可以看到:产生几何失真的Pdf417条形码图像与原始图像的Hu不变矩误差较小,由此可证明Hu不变矩具有很强的抗干扰能力,和平移、缩放和旋转等不变性能好。
表3给出训练次数相同的情况下,隐含层神经元个数不同对最小均方差的影响,从表中可得隐含层神经元节点个数的多少对最小均方差的影响,当隐含层节点个数为13个时,得到的最小均方误差最小;而表4给出隐含层节点个数都为13个时,不同训练次数得到的对应的最小均方差,从表4中可得在隐含层神经元个数相同情况下,学习次数对最小均方误差的影响趋势,可得当训练次数为15000时,训练最小均方误差最小。因此,实验中构建BP时选取隐含层节点个数为13个,训练次数为15000次。BP网络训练收敛后,再通过旋转、平移和缩放增加30幅图像,加上已有的样本共75个测试样本,分别用获得的神经网络分类器进行识别。
表1 三类条形码不变矩特征提取结果
表2 Pdf417二维条形码不变矩特征提取结果
图7 原始图与产生几何失真图像的Hu不变矩的对比
表3 隐含层神经元个数对BP网络收敛的影响
表4 训练次数对BP网络收敛的影响
表5中给出了基于Hu不变矩和BP网络的识别算法对三类条形码图像的识别精度,从中可以看出在相同的学习次数和训练误差基础下,由于一维条形码图像结构简单,信息量少,所以识别效果优于结构复杂、信息量大的二维条形码;但即使Pdf417和QR Code等二维条形码结构复杂、信息量大,应用此算法的识别效果良好,准确率较高。
表5 对三类条形码的识别精度对比
本文利用Hu不变矩作为条形码的特征向量,用神经网络分类器对提取的特征向量作为输入节点,进行分类识别。实验结果表明,以不变矩代替图像灰度作为BP网络的输入,大大简化了BP网络的规模,提高了网络的训练速度,具有良好的分类能力,并且对一维条形码和二维条形码可进行同时识别处理,并且纠正了条形码图像的旋转、缩放和平移等几何失真,识别效果良好,实现简单;对用智能手机作为条形码识别的实现提供了有力的支持和实际的指导意义。
[1]YU Fang,LIU Ping,YUAN Haolei.To realize two-dimension barcode in the smart phone [J].Microcomputer Information,2010,26 (3-1):199-201 (in Chinese). [余芳,刘萍,袁豪磊.在智能手机上实现二维条形码识别 [J].微计算机信息,2010,26 (3-1):199-201.]
[2]WANG Wenhao,ZHANG Yahong,ZHU Quanyin,et al.Image recognition in 2-D bar code based on QR-Code [J].Computer Technology and Development,2009,19 (10):123-126(in Chinese)[王文豪,张亚红,朱全银,等.QR Code二维条形码的图像识别 [J].计算机技术与发展,2009,19(10):123-126.].
[3]TANG Jin,DU Zhijun.Novel algorithm for PDF417 2-D bar code recognition [J].Chinese Journal of Liquid Crystals and Displays,2008,23 (5):625-628 (in Chinese).[唐琎,杜志俊.一种新的PDF417二维条形码识别算法 [J].液晶与显示,2008,23 (5):625-628.]
[4]Taubman D,Ordentlich E.Embedded block coding in JPEG[J].Signal Processing:Image Communication,2002,17(1):49-72.
[5]XU Xueqiang,WANG Bo,YU Jiacheng,et al.Application of a new invariant moments on image recognition [J].Optical Technique,2007,33 (4):580-583 (in Chinese). [徐学强,汪渤,于家城,等.一种新型不变矩在图像识别中的应用[J].光学技术,2007,33 (4):580-583.]
[6]SUN Honghui,WANG Hongxia,TIAN Tao.The recognition method of objects based on moment invariant and BP neural network [J].Microelectronics &Computer,2011,28 (3):63-69(in Chinese).[孙红辉,王红霞,田涛.一种基于不变矩和BP网络的目标识别方法 [J].微电子学与计算机,2011,28 (3):63-69.]
[7]WANG Kunming,XU Zhongren.Study on method of traffic signs recognition based on neural network and invariant moments[J].Application Research of Computers,2004,21(3):254-260 (in Chinese).[王坤明,许忠仁.基于不变矩和神经网络的交通标志识别方法研究 [J].计算机应用研究,2004,21 (3):254-260.]
[8]LI Guoxiang,ZHANG Xianquan, QIN Fangyuan.Paper cut-out patterns recognition based on moment invariants and BPneural network [J].Computer Engineering and Applications,2010,46 (29):158-169 (in Chinese).[李国祥,张显全,秦芳远.基于不变矩和BP神经网络的剪纸纹样识别 [J].计算机工程与应用,2010,46 (29):158-169.]
[9]TIAN Hua,SHI Shengyu,ZONG Xiaoping.Pattern recognition based on moment invariant feature and BP neural network for image[J].Journal of Hebei University (Natural Science Edition),2008,28 (2):214-217 (in Chinese). [田华,石圣羽,宗晓萍.基于不变矩特征及BP神经网络的图像模式识别 [J].河北大学学报(自然科学版),2008,28 (2):214-217.]
[10]QIN Zhong.Vehicle classification based on image moment invariant feature and BP neural network [J].Journal of South China University of Technology (Natural Science Edition),2009,37 (2):87-91 (in Chinese).[秦钟.基于图像不变矩特征和BP神经网络的车型分类 [J].华南理工大学学报 (自然科学版),2009,37 (2):87-91.]
[11]XU Sheng,PENG Qicong.Three dimensional object recognition based combined moment invariants and neural network[J].Computer Engineering and Applications,2008,44(31):78-80 (in Chinese).[徐胜,彭启琮.基于组合不变矩和神经网络的三维物体识别 [J].计算机工程与应用,2008,44 (31):78-80.]
[12]YANG Fei,WANG Kunming,MA Xin,et al.Application of BP neural net work classifier for road traffic sign recognition[J].Computer Engineering,2003,29 (10):120-121 (in Chinese).[杨斐,王坤明,马欣,等.应用BP神经网络分类器识别交通标志 [J].计算机工程,2003,29 (10):120-121.]
[13]LI Huimin,ZHANG Renjin.Research of vehicle license plate recognition based on BP neural network [J].Computer Engineering and Design,2010,31 (3):619-621 (in Chinese).[李会民,张仁津.基于改进BP网络的车牌字符识别方法研究 [J].计算机工程与设计,2010,31 (3):619-621.]
[14]YANG Wangli,MA Ruimin,XU Shaohu,et al.Palm print identification method based on Zernike moment and neural network [J].Journal of Northeast Forestry University,2009,37 (8):118-120 (in Chinese). [杨王黎,马瑞民,许少华,等.基于Zernike矩及神经网络的掌纹识别方法 [J].东北林业大学学报,2009,37 (8):118-120.]
[15]ZHU Shuangdong.Neural network application [M].Shenyang:North-eastern University Press,2000 (in Chinese). [朱双东.神经网络应用基础 [M].沈阳:东北大学出版社,2000.]