一种改进的激光打印图像预处理方法

2016-12-23 11:18全庆霄
电子设计工程 2016年24期
关键词:印记形态学灰度

董 春,孙 力,全庆霄

(1.江南大学 物联网工程学院,江苏 无锡214122;2.江阴苏阳电子股份有限公司 江苏 江阴214421)

一种改进的激光打印图像预处理方法

董 春1,孙 力1,全庆霄2

(1.江南大学 物联网工程学院,江苏 无锡214122;2.江阴苏阳电子股份有限公司 江苏 江阴214421)

针对激光打印图像字符不够鲜明、噪声太多的特点,提出了一种基于新型组合滤波算法与改进的Niblack法结合的激光打印图像预处理方法。传统的Niblack法,较好地保留了字符特征,但是出现了过多噪音杂点,效果不理想。该方法首先用Niblack法对图像二值化,同时应用自适应中值滤波模糊噪声和非噪声点对应的形态学滤波设计一种新型组合滤波器,建立恰当滤波窗口,保护更多的图像细节,增强图像边缘。实验结果表明该方法可有效地过滤激光打印图像中的噪声,获得了较好的二值化图像,具有一定的实用价值。

预处理;Niblack法;自适应中值滤波;形态学滤波

印记自动识别系统是集成电路行业实现自动化生产管理模式的重要环节之一。印记是高能激光束汽化塑封料表面形成的标记,属于激光打印图像。由于印记形成环境复杂,以及在采集传输过程中会受到各种因素的影响,如系统噪声、光照不均等。这些使激光打印图像不可避免地受到不同程度的脉冲噪声污染,严重影响了图像的质量。激光打印图像预处理方法的优劣直接影响到后期印记的识别。因此对激光打印图像预处理方法的研究就显得十分重要。

图像的预处理包括图像灰度化、图像二值化以及图像平滑去噪等过程,而激光打印图像中含有多种不同程度的噪声,这使得激光打印图像的预处理工作增加了难度。特别是如何确定激光打印图像二值化的阈值以及噪声滤波器。近年来,国内外研究者对图像预处理方法做了大量的研究工作,其中包括研究图像的二值化[1-3]、噪声滤除[4-6]以及图像增强[7]等工作,但是仍没有人研究出一种适用于激光打印图像的预处理方法。

针对激光打印图像的特殊性,需要寻找一种特殊的预处理方法,通过大量仿真实验及定量评价指标对比,本文提出了一种基于新型组合滤波算法与Niblack法结合的激光打印图像预处理方法。该方法通过设计一种新型组合滤波器与Niblack法相结合,以有效提高滤波器滤除噪声和保留图像细节信息的能力,预处理效果明显。

1 新型组合滤波器与Niblack法

到目前为止,还没有一种专门针对激光打印图像的二值化方法。寻找更好的激光打印图像二值化方法,仍然是印记识别研究领域的目标之一。二值化方法可分为全局阈值法和局部阈值法[8]。全局阈值法对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,但对光照不均匀、噪声干扰较大的图像,二值化效果明显变差。典型的局部阈值法有均值分割法、Bernsen法、Niblack法等。局部阈值法较全局阈值法有更广泛的应用,但缺点也较为明显,比如速度慢、容易出现伪影现象和笔画断裂现象。Niblack法容易产生大量背景噪声的缺点,但对于低对比度的印记图像有更好的适应性[9]。3种常用的二值化方法效果如图1所示。

图1 3种常用的二值化方法效果图

激光打印图像含有大量复杂的噪声,通常在二值化之前需要进行滤波处理。一般地,常用的滤波方法包括三类[10]:一类是经典滤波算法及在此基础上的改进和提升算法,例如中值滤波、自适应中值滤波、开关中值滤波等;另一类是以严密数学理论为基础的滤波算法,如偏微分方程滤波、形态学滤波、小波去噪等;第三类是通过将现有的滤波算法进行不同程度的组合,充分发挥各自的滤波优势,实现对噪声的多级滤除。针对激光打印图像噪声的降噪问题,借鉴组合滤波算法基本思想,尝试将改进的自适应中值滤波与形态学滤波相结合实现对印记图像噪声的逐级滤除。

自适应中值滤波[11]是根据噪声密度大小来确定滤波窗口尺寸,改善了去噪效果,但其细节保护能力较弱,容易造成图像模糊。形态学滤波是一种非线性的滤波运算,基本的形态学运算是开运算和闭运算,是数学形态学腐蚀和膨胀基本运算的二级运算。因此,可根据需要选择不同形式的滤波运算来消除或者抑制噪声。形态学运算处理图像的效果与结构元素形状、大小的选取有直接关系,这还需要根据目标图像的特征具体研究与分析[12]。特别是处理激光打印图像时,图像中聚集了大量的噪声点,噪声点周围也往往全是噪声点。这时,对噪声点进行滤波处理,如果只采用一种滤波算法,滤噪效果不明显,并且还会损失印记图像细节。

2 文中激光打印图像预处理方法

在实际环境下,由于各种客观原因,如采集时的光照、机器、塑封料的模糊等,都使得原始激光打印图像需要经过一系列的处理才能进行下一步的印记识别。这些处理包括图像的灰度变换、二值化、去噪、滤波、图像增强等。文中采用灰度变换、自适应中值滤波、二值化和形态学方法相结合的预处理方法,如图2所示。由于激光打印图像的种类较多,不利于图像处理,因此文中首先将激光打印图像转换为灰度图像;然后采用自适应中值滤波对图像进行滤波处理,使图像明暗更加清晰,减少边缘模糊;再选用Niblack法对图像进行二值化处理,使图像变为只有黑白二色的二值图像,把印记特征更加清晰地突显出来;最后选择数学形态学方法对二值后的图像进一步处理,滤除散落的噪音杂点以及增强图像边缘。

图2 本文预处理方法流程图

3 预处理方法实现

3.1 极值法噪声检测

经过灰度变换后的激光打印图像,其对比度比较低,若直接对图像用Niblack法二值化,二值化图像模糊,印记边缘不清晰。为了后面能更好地提取图像特征,这里需要对灰度化图像进行噪声滤除工作。首先对印记图像进行噪声点检测,如果中心像素是信号则保留,如果中心像素为噪声则需对图像进行滤波处理。一般印记图像在显示时,噪声点会随机分布地表现为黑色或白色,而且出现的概率相等,其灰度值为极小值或极大值(0或255)。

设激光打印图像G尺寸为N×N,其噪声概率为p0,而g(i,j),f(i,j)分别为原始图像和噪声图像的灰度值函数[13]。现依据激光打印图像噪声特点,选取噪声图像的灰度值函数的数学模型为:

其中i,j=1,2,…,N,p(g(i,j))表示当像素点(i,j)的灰度值为g(i,j)时,该点受到噪声污染的概率。

从上述模型明显可以看出,图像中共有N2×p0个噪声点,而且受污染的像素点(i,j)的灰度值f(i,j)与其相邻像素点的灰度值互不影响。因此,基于这一思想,文中采用极值法检测激光打印图像的噪声,即若某个像素点(i,j)的灰度值g(i,j)为0或255,则可认为该像素点可能为噪声,并对检测出的噪声点进行滤除,而非噪声点直接保留即可。

3.2 自适应中值滤波

对于激光打印图像高密度噪声污染而言,噪声滤除的效果受窗口大小影响,若采用较小邻域作为滤波窗口,则可能窗口内完全不存在非噪声点,还会将噪声扩散;若将滤波窗口扩大,则在滤波窗口内部会引入离中心像素较远的非噪声点,从而出现新的误差,造成滤波图像模糊不清。为避免上述一些缺陷,通常对极值法检测出的每个噪声点建立恰当滤波窗口,以便在窗口内找到非噪声点的同时,又不会引入新的偏差。

为了充分利用滤波窗口滤除噪声,通过迭代扩大窗口来选取恰当滤波窗口尺寸,直到窗口中包含非噪声点为止。一般地,在边心距为1的3×3邻域内,极值法检测出的噪声点个数为nun(i,j),根据nun(i,j)的值来确定滤波窗口大小。滤波窗口的大小K(i,j)根据nun(i,j)自适应地确定,确定规则如下[14]:

在激光打印图像G中为了更好的保留图像细节,文中采用极值法检测噪声,并对其建立恰当滤波窗口,利用中值滤波思想设计了如下滤波器。首先采用极值法检测激光打印图像所受到的噪声,并且将像素点分为噪声点和非噪声点。为了减少其算法的复杂程度,我们只对噪声点进行滤除,对非噪声点直接保留其灰度值。其次,以每个噪声点为中心建立边心距为1的3×3滤波窗口,并在窗口内检测周围的其他像素点中是否还存在非噪声点,若存在,则采用3×3滤波窗口;若不存在,则扩大为边心距为2的5×5滤波窗口,进而继续去检测窗口内的非噪声点,反复进行直到找到窗口内的所有非噪声点为止。此时,滤波窗口不再被扩大,因此可对每个噪声点创建恰当的滤波窗口。

3.3 Niblack法二值化

下面对经过自适应中值滤波处理后的激光打印图像,进一步应用图像二值化处理技术将印记的特征与背景信息进行分离,提取印记字符的几何特性,以便后续进行印记字符识别。为了可以在尽可能多地保留激光打印图像印记信息的基础上去除亢余信息,选择一个合理的阈值就显得至关重要。文中选用对低对比度的印记图像有更好适应性的Niblack法进行二值化。Niblack法是一种常见且有效的局部阈值算法,它的基本思想是对图像中的每一个点,在它的R×R邻域内,计算邻域中像素点的均值和方差,然后用下面的公式计算阈值进行二值化[15]:

式中:T(x,y)是像素点(x,y)处的阈值;n(x,y)是该点R× R邻域内所有像素点的均值;s(x,y)是该点R×R邻域内所有像素点的标准方差;k为修正系数,确定选取多大的字符目标边界来作为给定目标的一部分。当K的取值不断增大,噪声几乎完全消除,但是字符笔画越来越细,越来越模糊不清。

选取适当的邻域大小和K值对算法的结果是至关重要的。在本文中邻域的大小是根据上文自适应滤波窗口的大小来选取,因此本文Niblack法邻域大小的选取是基于激光打印图像噪声点分布情况决定的,也是自适应的调整邻域大小。而K值的选择和激光打印图像本身的灰度值有关。假设选取30×30这一固定邻域的情况下,不同K值的二值化效果如图3所示。由图中可以看出:当K=0时,图像有较多噪 值化效果已经很好,K值的增加仅仅是使印记字符变细。因此在本文改进的Niblack法中,采用K值为-0.2,保留了字符特征的同时,尽量减少噪声。

图3 不同K值的二值化效果图

3.4 形态学滤波

激光打印图像用上述方法处理后,噪声不均匀等现象有了很大的改善,如图4(b)所示,该图像含有一些干扰点和小区域,但是却包含了原始激光打印图像印记的绝大部分特征,表明改进的Niblack法能成功对图像二值化,为了改善图像的视觉效果,得到清楚的二值化图像,必须对图像进一步滤除杂点,同时对部分断裂的字符进行图像增强,这就需要用到形态学滤波方法,它既能有效去除噪声,又可增强图像、保留图像原有的细节信息。

由于文中二值化算法是基于Niblack法,根据Niblack法的特点,二值化的图像不仅存在散落的噪音杂点而且还会有部分印记字符断裂。因此,还需对处理后的激光打印图像进行形态学运算。形态学运算是物体形状集合与结构元素之间的相互作用,能抑制噪声和增强图像。图像增强是在原始图像上增强图像中的有用信息,将原来不清晰、断裂的图像变得清晰或者加强某些特征,扩大图像中不同物体特征之间的差别,从而改善图像质量、丰富图像的信息量,加强图像的识别效果。

文中形态学运算包括开运算和闭运算,开运算是用结构元素B先对待处理的图像A进行腐蚀,然后进行膨胀;闭运算是用结构元素B先对待处理的图像A进行膨胀,然后进行腐蚀。如图4所示,图4(b)是待处理的图像A,B选用十字型3×3结构元素,首先用B对A先进行开运算,清除背景中得小结构,滤除孤立的噪声杂点;然后用B对A进行闭运算,实现对背景中不包含结构元素的部分填充,连接断裂的字符。图4(a)是最大灰度值为255的源图像。图4(b)为经过自适应中值滤波后又用Niblack法二值化得到的图像,图4(c)为图4(b)经过形态学运算后的图像。

4 实验结果与分析

为了证实该预处理方法的有效性,随机采集了3张不同的印记图像,他们的亮度、对比度、噪声程度等各不相同。本文预处理方法效果如图5所示:克服了激光打印图像容易受到噪声污染,对比度低的缺点,没有出现印记字符断裂和大量聚集噪音现象,预处理效果理想,为后续的印记分割、识别等工作做好了充分的准备。

另外,文中采集了300张激光打印图像,将每100张随机作为一个实验样本,经过文中预处理方法处理后,统计分析其预处理效果,统计结果如表1所示。表1数据客观地表明了文中预处理方法有很好的预处理性能,3个实验样本预处理质量均达到92%以上,其中预处理结果图包含了原始印记图像的绝大部分信息,噪声滤除明显,细节保留丰富,预处理效果好,用时少。

图4 预处理过程中产生的图像

图5 本文预处理方法效果对比

表1 预处理结果统计表

5 结 论

文中在自适应中值滤波的原理及算法的基础上再结合形态学,得到一种基于新型组合滤波算法与改进的Niblack法结合的激光打印图像预处理方法,该预处理方法有效克服了激光打印图像质量差的缺点,改进的Niblack法二值化效果要优于Otsu等常用的二值化方法,优化了二值化过程,减少了算法的计算量,成功实现了激光打印图像的二值化效果,而且预处理后的图像噪声滤除明显,印记细节信息保留丰富。在同类的集成电路封装产品印记识别领域都有一定的应用价值。实验结果表明,该方法在实际应用中对印记自动识别率是有用的,且优于传统预处理方法。

[1]童立靖,张艳,舒巍.几种文本图像二值化方法的对比分析[J].北方工业大学学报,2011(1):25-33.

[2]申森,李艾华,姚良,等.基于小波包和Niblack法的枪号图像二值化算法[J].光子学报,2013,42(3):354-358.

[3]孙少林,马志强,汤伟.灰度图像二值化算法研究[J].价值工程,2010,29(5):142-143.

[4]刘国宏,郭文明.改进的中值滤波去噪算法应用分析[J].计算机工程与应用,2010,46(10):187-189.

[5]Zhu Youlian,Huang Cheng.An improved median filtering algorithm for image noise reduction [J].Physics Procedia,2012,25:609-616.

[6]张成斌,王开福.基于形态开闭算子的高浓度椒盐噪声去除方法[J].计算机工程,2015,41(2):199-202.

[7]段先知,丁亚军,钱盛友,等.改进型快速ICA算法与数学形态学结合的图像分割方法[J].微电子学与计算机,2015,32(2):80-84.

[8]章毓晋.图像工程(上册)-图像处理[M].2版.北京:清华大学出版社,2006.

[9]Niblack W.An Introduction to Image Processing[M]. Prentice-Hall,Inc,1986:115-116.

[10]姚宏.一种基于椒盐噪声新型组合滤波算法仿真研究[J].电视技术,2015,38(1):39-42.

[11]孙海英,李锋,商慧亮.改进的变分自适应中值滤波算法[J].电子与信息学报,2011,33(7):1743-1747.

[12]Soille P.形态学图像分析原理与应用[M].2版.王小鹏,译.北京:清华大学出版社,2008.

[13]王贵君,杨永强.基于高概率椒盐噪声的模糊滤波器在图像恢复中的算法设计[J].电子学报,2015(1):24-29.

[14]段群,吴粉侠,刘小豫.基于CUDA的椒盐噪声自适应中值滤波算法[J].航空计算技术,2013,43(2):60-63.

[15]卜飞宇.一种改进的文本图像二值化方法[J].电脑知识与技术,2014,10(12):2822-2824.

An improved preprocessing method of laser printing image

DONG Chun1,SUN Li1,QUAN Qing-xiao2
(1.School of Internet of Things,Jiangnan University,Wuxi 214122,China;2.Jiangyin Sunny Crient Technology Co,Ltd,Jiangyin 214421,China)

Aiming at the characteristics of the laser printing image that characters are not bright enough and too much noise,a preprocessing method based on combination of the new combination filtering and the improved niblack algorithm is proposed. Traditional Niblack algorithm can be better to retain the characteristics of the characters,but appear too noisy miscellaneous points,the used result is not satisfactory.This method can establish appropriate filtering window,protect more image details,and enhance image edges,that the image is binarized for by Niblack algorithm,and designed a new type of composite filter by combining with the adaptive median filtering to fuzzy noise and the morphological filtering for the non noise points.The experimental results demonstate that this method can effectively filter the noise in the laser printing image,obtain the better binary image,and it has a certain practical value.

preprocessing;Niblack algorithm;the adaptive median filtering;the Morphological filtering

TN249

A

1674-6236(2016)24-0176-04

2016-01-11 稿件编号:201601066

董 春(1990—),女,山东肥城人,硕士研究生。研究方向:图像识别技术。

猜你喜欢
印记形态学灰度
采用改进导重法的拓扑结构灰度单元过滤技术
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
过去一年,国家立法的深刻印记
30年印记
幸福印记
基于最大加权投影求解的彩色图像灰度化对比度保留算法
医学微观形态学在教学改革中的应用分析
基于像素重排比对的灰度图彩色化算法研究
数学形态学滤波器在转子失衡识别中的应用
巨核细胞数量及形态学改变在四种类型MPN中的诊断价值