应用于方阵式DM码定位的图像分割技术研究

2020-06-24 05:47康三顺
现代信息科技 2020年22期
关键词:图像分割二维码

摘  要:文章所研究的图像分割过程主要分为预处理、粗定位、精定位三部分;预处理的目的主要是减少图像信息量和提升图像质量;粗定位主要分图像分块、候选区域标记、区域生长;候选区域标记通过Scharr边缘检测算子计算DM码梯度方向和梯度幅值,通过梯度方向和梯度幅值进行统计直方图计算,确定候选区域;区域生成将在候选区域进行种子生长,完成粗定位;精定位部分结合由外向里,由里向外进行扫描完成DM更精确的定位。

关键词:二维码;DM码;图像分割

中图分类号:TP391.41       文献标识码:A 文章编号:2096-4706(2020)22-0091-04

Research on Image Segmentation Technology Applied to

Square Matrix DM Code Location

KANG Sanshun

(Beijing Hanyuan Pharmaceutical Technology Co.,Ltd.,Beijing  100176,China)

Abstract:The image segmentation process studied in this paper is mainly divided into three parts:preprocessing,coarse positioning and fine positioning;the main purpose of preprocessing is to reduce the amount of image information and improve the image quality;the coarse positioning is mainly divided into image segmentation,candidate region labeling and region growing;the candidate region labeling calculated the DM code gradient direction and gradient amplitude by Scharr edge detection operator,and the candidate region is determined by statistical histogram calculation of gradient direction and gradient amplitude;in the region generation,seed growth will be carried out in the candidate region to complete the coarse positioning;in the fine positioning part,scanning from the outside in and from the inside out will be combined to complete the more accurate positioning of DM.

Keywords:QR code;DM code;image segmentation

0  引  言

Data Matrix(DM)碼是一种矩阵式二维条码,是由美国国际资料公司(International Data Matrix)于1989年发明。每个DM符号是由规则排列的方形或点阵模块构成的数据区组成。在较大的ECC200符号中,数据区由校正图形分隔。数据区的四周由定位图形包围,定位图形的四周则由空白区包围。DM码最大特点是尺寸小、储存信息量大,其最小尺寸是目前所有条码中最小的码,所以其特别适用于小零件标识,或者直接印刷在实体上。DM码采用了复杂的纠错技术,使得其具有超强的抗干扰能力。当前许多手机零部件信息标识均使用DM码。根据纠错方式不同,DM码可分为两种:ECC200和ECC000-140。ECC200通过Reed-Solomon进行纠错,ECC000-140具有五种不同等级的卷积纠错功能,包括ECC000、ECC050、ECC080、ECC100和ECC140。ECC000-140只能用于一个单独的部门同时控制产品和条码符号的识别,并负责整个系统运行的情况,目前ECC200的应用更为广泛。DM码从模块形状上来说,分为方阵式和点阵式,一般以方阵式为主。在DM码图像的应用过程中,要使用图像分割定位技术将图像中的DM码从整个图像及背景中分割出来。

目前DM码定位的方法主要有:利用条码区域边缘角度分布特征,评价图像子区域是否为条码区域;利用灰度信息矩形区域粗定位,利用灰度方差信息、边缘和定位模式进行求精;将非连续的定位模式处理成为连续的,通过图像锐化方法去除低频和高频成分的差异,使用移动窗口的方法平滑锐化图像;查找类马鞍点结构的方法;找出点集之间对应关系,计算坐标变换,使用坐标变换对实时图像进行矫正。

笔者长期致力于图像处理、人工智能等领域的算法研究及计算机软件开发,本文研究的二维码定位技术可有效应用于DM码的实际需求中。本文通过利用梯度方向和梯度值信息定位对方阵性DM进行了研究,最终给出了另外一种实现方阵型DM定位的具体过程,并在实验部分通过手机零部件生产线上的图像集进行了实验及验证,本文方法的适用场景为:

(1)类型:支持连续和有间隔两种格式;

(2)极性:支持Light-on-dark、Dark-on-light;

(3)旋转和缩放:支持任意角度旋转;

(4)投影畸变:支持投影畸变下的DM图像定位。

1  定位过程

1.1  预处理

预处理的主要目的有两个:

(1)减少图像数据量;

(2)改善图像质量,比如去噪、对比度增強或形态学等操作。

如果需要下采样,则首先对搜索区域内图像进行下采样操作;如果图像DM码部分质量不好,还需进行预处理改善图像质量,主要的预处理手段包括以下两种:

(1)对比度增强:针对DM码区域对比度较低导致候选区域无法标记的情况;

(2)形态学处理:针对DM码模块太小导致粗定位或扫描被滤除的情况。

1.2  粗定位

粗定位在已处理图像上进行。粗定位的目的是得到可能包含DM码的区域。粗定位主要分为三个阶段——图像分块、候选区域标记和区域增长。

1.2.1  图像分块

分块类型一共有四种,在原始分辨率策略下为30×30(常规)、15×15(小尺寸)和10×10(极小尺寸),在下采样分辨率策略下为15×15(常规)、7×7(小尺寸)和5×5(极小尺寸)。对大部分情况下的图像,分块选择下采样策略的常规分块就可以保证得到标记后的条码区域。

1.2.2  候选区域标记

候选区域标记要确定每一分块是否可能为DM码的一部分,因此用于评价每一分块是否为候选区域的依据应体现DM码特性。DM码区域的边缘信息丰富,并且呈现正交性,这里采用边缘梯度幅值和边缘方向角度信息判断每一分块是否可能属于DM码区域。算法中采用3×3大小的Scharr边缘检测算子,计算整幅图像的边缘梯度幅值和边缘方向角度,并根据边缘方向角度统计边缘方向角度直方图,确定是否有满足条件的主方向,进而确定该区域是否为候选条码区域。

因为DM码很多情况下是蚀刻在金属表面,金属表面的纹理会对DM码的边缘信息有所影响,导致方形DM码计算出的主方向并不是理想的正交情况。因此,这给出方阵DM码候选区域标记规则。

DM码候选区域标记主要包括Scharr边缘检测、滤除低幅值边缘点、统计边缘方向角度直方图、角度峰值检测、确定候选条码区域。

(1)Scharr边缘检测:采用3×3大小的Scharr算子对图像进行边缘检测,得到边缘梯度幅值和边缘方向角度,Scharr的内核大小为3,其内核为:

梯度计算:在两个方向求导,假设被作用图像为I。

水平变化:将I与一个奇数大小的内核Gx进行卷积。Gx的计算结果为:

垂直变化:将I与一个奇数大小的内核Gy进行卷积。Gy的计算结果为:

在图像的每一像素上,结合以上两个结果求出近似梯度:

梯度的方向角为:a(x,y)=arctan();

(2)统计角度直方图。为了滤除分块中只有极少数峰值点的情况,在统计边缘方向角度直方图之前,首先考虑分块内峰值点个数是否达到阈值,若不满足要求,认为这个区域峰值点数太少,不属于条码区域,否则继续处理;

(3)角度峰值检测。分析直方图分布是否有明显的峰值,并且峰值是否有近似平行(同向)或正交(垂直)性。对峰值阈值的选取原则为保证真正的峰值不被滤掉,因为上一步峰值点数阈值根据不同模块类型、分块类型和分辨率搜索策略取值不同,这里峰值阈值也需做相应调整。考虑分块内两段边缘的情况,这里峰值阈值一般不大于对应参数下的峰值点数阈值;

(4)确定候选条码区域。对所有满足峰值阈值的角度按峰值递减排序,峰值最大的角度为该分块主方向的可能性大,判断所有峰值主角度是否满足平行或正交性,对满足条件的峰值角度进行合并,统计其峰值和,若达到一定条件(峰值和阈值),进而认为该分块为候选条码区域。输入图1DM码样例原图,即可得图2候选区域标记效果图。

1.2.3  区域增长

区域生长流程图如图3所示。

区域增长的目的是在标记的候选条码区域中,将具有相似特征的分块生长到一起,得到完整可能包含DM码的区域。基于DM码整个区域的强方向性和其边界的静音区,我们采用的两个生长准则为:相邻分块主方向一致性或正交性和相邻分块的容忍对比度变化。

从候选条码区域中选取一个分块(分块行列隔行隔列选取)作为种子区域,考虑其8邻域分块是否满足生长准则,若满足则将邻域分块加入当前生长区域,并以此邻域分块为中心,继续判断其8邻域分块是否满足生长准则,直至都不满足准则或者图像遍历完,此次生长停止。若还有其他分块未遍历,则以之作为新的种子进行区域生长得到新的区域。

具体生长准则为:

(1)相邻分块与种子分块的主方向同向或正交方向差异不超过30度(考虑DM码有倾斜和畸变的情况,DM码两个主方向可能不是正交,因此将主方向角度差距设置为30度,可适应DM码的大部分畸变情况);

(2)相邻分块的对比度差异不超过10个灰度(既容忍DM码内部有一定的对比度渐变,也能在DM码周围对比度有明显差异时避免生长过多无效分块)。

区域增长后效果图如图4所示。

1.3  精定位

图像扫描分为以下步骤:仿射采样;二值化;由外向里滤除近似全白或全黑的行或列和有效像素变化次数较少的行或列;由里向外滤除有效像素变化较少的行或列;滤除具有两段连续的静音区但极性相反的外侧区域(L边的干扰)。

1.3.1  仿射采样与二值化

为了保证仿射采样后子图包含完整的DM码,将投影得到的仿射矩形区域长宽各伸展至原来的1.1倍。

为了便于精定位,先对已处理图像进行仿射采样并二值化处理,作为扫描部分的输入图像,其中图像宽度为Width,图像高度为Height。

因为对比度变化图像因DM码区域灰度变化导致使用全局阈值效果很差,因此二值化有两种策略:对于DM码部分,有对比度变化时使用局部自适应阈值,否则使用全局阈值。

1.3.2  滤除具有两段连续的静音区但极性相反的外侧区域(L边干扰)

首先找到区域内黑白像素变化最大的行和列。然后再从变化最大的行或列开始,分别向上下或左右扫描,直到行或列中黑白像素的突变次数很小,则统计当前行或列中像素的灰度值累计和,以此判断当前行或列的极性。

对于得到的DM码区域,有可能周围有多余的静音区,因此再进行一次滤除全黑全白的行和列,得到最终扫描的DM码四条边界。对确定的上下左右4条边界两两求交点,即可确定DM码区域的位置。

精定位后效果图如图5所示。

2  实验分析

硬件测试机配置为处理器:Inter(R)Core(TM)i7-8550U CPU@1.80 GHz 1.99 GHz,内存(RAM)为8.00 GB,系统类型为64位操作系统,基于x64的处理器。

将现有一千余张测试图像分成多个图像集对文中算法实现进行了测试,以两种数据集的测试结果为例:

(1)Light-on-dark:图像原图如图6(a)所示,定位结果如图6(b)所示,用时为5 ms;

(2)Dark-on-light:图像原图如图7(a)所示,定位结果如图7(b)所示,用时为5 ms。

实验验证本文算法实现符合预期对各种图像的定位,定位用时基本可以控制在10 ms内,相较于其他算法的实现方案,文中所实现算法在定位精度高的情况下也能较快定位,可应用在大多DM码定位的实际环境中。对于图像质量极其差的情况,可在进行预处理后,再用此算法定位

3  结  论

针对DM码实际使用过程中的定位问题,利用方阵式DM码明显的梯度幅值和梯度方向的统计直方图性质,实现算法并通过实验验证,能够较好较快地应用在方阵式DM码的定位过程中。本文在计算梯度幅值和梯度方向时采用了Scharr算法,将得到的梯度方向和梯度幅值进行直方图统计后,再经过类似于种子填充算法的区域增长策略得到了方阵式DM码的大致位置,最后再通过扫描算法实现了方阵式DM码的精确定位。但在实际应用时候,本文提及方法尚存在部分不足:

(1)在DM码静音区周围有明显干扰时,DM码静音区的大小需要大于一个模块长度;

(2)当DM码与背景对比度较低时,需要进行预处理后才能进行定位;

(3)尚没有兼容点阵式DM码的定位。

这三个方面也是本人在后续优化过程中优先考虑的方向。

参考文献:

[1] 张宁.基于摄像方式的二维条码识别算法的研究 [D].南京:南京理工大学,2013.

[2] 于英政.QR二维码相关技术的研究 [D].北京:北京交通大学,2014.

[3] 刘美,薛新松,刘广文,等.对比度增强的彩色图像灰度化算法 [J].长春理工大学学报(自然科学版),2018,41(5):70-74.

[4] 王娟,王萍.直接零件标志条码区域定位算法 [J].计算机辅助设计与图形学学报,2014,26(7):1159-1166.

[5] 王伟,何卫平,雷蕾,等.污染及多视角下DataMatrix码精确定位 [J].计算机辅助设计与图形学学报,2013,25(9):1345-1353.

[6] ZHANG C N,MA L,MAO D. A 2D Barcode Recognition System Based on Image Processing [C]//The 2011 International Conference on Electric and Electronics(EEIC 2011).Springer,2011:670-675.

作者簡介:康三顺(1986.02—),男,汉族,甘肃天水人,高级算法工程师,本科,研究方向:图像识别、人工智能、计算机应用。

猜你喜欢
图像分割二维码
二维码
银联发布二维码支付标准
银联发布二维码支付标准
计算机定量金相分析系统的软件开发与图像处理方法
一种改进的分水岭图像分割算法研究
一种图像超像素的快速生成算法
基于鲁棒性的广义FCM图像分割算法
二维码,别想一扫了之
极具创意的二维码