王涛,徐娅萍,亢海龙,等
图像二值化是应用最广泛的图象分割技术,在自动目标识别、图象分析、文本增强以及OCR等图像处理中得到广泛应用。现有的二值化方法大多属于阈值化方法,主要有全局阈值法、局部阈值法及动态阈值法[1]。
(1) 全局阈值法 是指整个图像采用单一阈值(全局阈值)T进行图像二值化。一般由图像的直方图或灰度的空间分布,确定一个全局阈值T,将图像的每个像素的灰度值与T进行比较。若大于T,则取为前景色;否则,取为背景色。
(2) 局部阈值法 由当前像素灰度值与该像素周围点局部灰度特征来确定像素的阈值。局部阈值选取,一般将图像划分为若干子像,在每个子图像区域上使用整体阈值法,从而可以构成整幅图像的局部阈值法。
(3) 动态阈值法 当光照不均匀、或者背景灰度变化较大等情况时,必须根据像素的坐标位置关系,自动确定不同阈值,实施动态的阈值确定。该法的阈值选择,不仅取决于该像素及周围像素的灰度值,而且还与该像素的坐标位置有关。
通常来说,全局阈值化方法实现简单,对于具有明显双峰直方图的图像效果明显,但对于低对比度和光照不均匀的图像效果不佳,因而应用范围受到极大限制。局部阈值法则能够适应较为复杂的情况,比全局阈值法有更为广泛的应用。但它往往忽略了图像的边界特征信息,使得原图像中的一些不同区域在二值化后变成了一块大区域,造成二值化结果图像某些重要信息的丢失。动态阈值法充分考虑了像元的邻域特征,能够根据图像的不同背景情况自适应地改变阈值,可较精确地提取出二值图像,但它过渡地夸大了像元的邻域灰度的变化,会把不均匀灰度分布的背景分割到目标中去,带来许多不应出现的假目标。
对于低对比度、不均匀光照图像来说,图像中目标物体轮廓可能是模糊的,但还可分辨出来,用边缘检测器还可检测出来,此时用普通的阈值化方法可能会丢失目标的细节信息,因此本文使用了一种新的二值化图像方法 - 基于边缘特征的二值化方法。
本文所提出的图像二值化算法,关键之一在于图像边缘的提取。常用的几种用于边缘检测的算子,有Roberts,Sobel,Prewitt,LoG和Laplacian等。这些算子的主要缺点是对噪声敏感,而在实际图像中噪声是难以避免的。
Canny边缘提取方法是由John Canny在1986年首先提出的[2],之后迅速成为边缘提取的一种重要方法。Canny算子充分反映了最优边缘检测器的数学特性,是对信噪比与定位能力的最优化逼近算子,广泛应用于图像处理和模式识别问题中。Lee等人[3],将Canny算子用于人脸识别中,成功地实现了人脸下额区域同颈部的分离;Ali等人[4]将canny算子用于远程传感图像的去噪声和特征提取上;这些研究表明,Canny算子用于边缘提取可取得较好的效果。
Canny算子的边缘检测最优性与以下标准有关:
(1) 好的信噪比, 即非边缘点判为边缘点或将边缘点判为非边缘点的概率低; 信噪比的数学表达式为:
若信噪比越大,则边缘提取质量越好。
(2) 好的定位性能, 即检测出的边缘点要尽可能在实际边缘的中心; 定位精度的表达式为:
Location的值越大,则定位精度就越大。
(3) 对单一边缘具有唯一响应, 并且对虚假边缘响应应得到最大抑制。
本文利用钥匙齿边图像(如图1所示)对以上算子进行了对比实验分析:
(1) Roberts算子。实验结果。Roberts算子利用局部差分算子寻找边缘,边缘定位精度较高,但容易丢失一部分边缘,同时由于没经过图像平滑计算,因此不能抑制噪声。该算子对具有陡峭的低噪声图像响应最好。如图2所示
图1 钥匙齿边图像
图2 Roberts算子边缘提取图像
(2) Sobel算子和Prewitt算子。实验结果如图3,4所示。两者都是对图像进行差分和滤波运算,差别只是平滑部分的权值有些差异,因此对噪声具有一定的抑制能力,但不能完全排除检测结果中出现伪边缘。同时这2个算子边缘定位比较准确和完整,但容易出现边缘多像素宽。该类算子对灰度渐变和具有噪声的图像处理得较好。
图3 Sobel算子边缘提取图像
图4 Prewitt算子边缘提取图像
(3) Laplacian算子。实验结果如图5所示。为二阶微分算子,对图像中的阶跃型边缘点定位准确,且具有旋转不变性即无方向性,但是该算子容易丢失一部分边缘的方向信息,造成一些不连续的检测边缘,同时抗噪声能力比较差。该算子比较适用于屋顶型边缘的检测。
图5 Laplacian算子边缘提取图像
(4) LoG算子。实验结果如图6所示。该算子首先通过高斯函数对图像作平滑处理,因此对噪声的抑制作用比较明显,但同时也可能将原有的边缘也平滑了,造成某些边缘无法检测到。
图6 LoG算子边缘提取图像
(5) Canny算子。实验结果如图7所示。该算子同样采用高斯函数对图像作平滑处理,因此具有较强的去噪声能力,但同样存在容易平滑掉一些边缘信息。同时其后所采用的一阶微分算子的方向性较LoG算子要好,因此边缘定位准确性较高。
图7 Canny算子边缘提取图像
通过实验可以看出,Canny算子是传统边缘算子中效果最好的算子之一,可以准确检测出图像目标边缘。
本文算法结合了全局阈值法和局部阈值方法。全局阈值方法主要有:P-tile方法、大津法[5]等等。大津法(又称类间差法)是基于整幅图像的统计特性,实现阈值的选取。其原理是:把图像直方图用某一灰度值分割成2组,当被分割成的2组方差最大时,此灰度值就作为图像二值化处理的阈值。局部阈值方法主要有邻域均值法。若考虑到二值图像扫描中目标边缘的灰度值,总是小于其局部背景的灰度值(邻域灰度的变化特征),则可以采用类似于 Musavi的局部自适应二值化方法[6]。该方法利用各象素的n×n邻域(n为奇数,为减少运算量,一般取n=3或5),对该象素的邻域灰度进行统计
其中,α为0~1之间的常数,由图像的质量确定(当图像质量较好时,α取较小的值);M为某一象素邻域内各象素的灰度平均值;S为该邻域内象素灰度的标准差。T为考虑邻域的局部自适应阈值,该值用来对局部图像进行二值化处理。本文研究中采用该方法,取得了较好的效果。
本文算法的基本思路是:先用边缘检测算子检测获得图像的边缘特征(灰度变化剧烈的地方),然后根据边缘像素点的空间位置关系,实现不同像素点的二值化处理。如果图像点是非边界像素点,则用全局阈值法确定出最佳全局阈值,进行二值化处理;如果图像点是边界像素点,则采用局部阈值法来确定阈值。
算法的基本过程描述如下:(1)图像预处理 由于摄像机的扰动或其它原因,原始图像中会含有噪声,所以要先对原始图像做低通滤波处理或其他处理,以降低噪声的影响;(2)最佳全局阈值确定 用 Ostu算法计算出整幅图像的最佳全局阈值,用于边缘以外的其他像素点的二值化处理;(3)边缘检测 采用Canny算子确定出较为准确的、符合实际的图像边界信息;(4)二值化处理 这步是本算法的关键,依据第3步,某像素若是边缘点,则进行Musavi局部自适应二值化方法,进行局部阈值自适应计算,并进行相应的二值化处理,而对非边缘点则做Ostu法处理。
经过上述处理,适当的综合了全局阈值和局部阈值方法的优点,整体上降低了各自的缺陷。
根据基于边缘信息的图像二值化算法的基本原理和边缘检测算子的实验分析,我们进行了基于 Canny算子的二值化处理。在实际的研究当中,选取了图1所示图像作为研究的对象。图8为大津法获取的二值图像,图9为结合边缘信息的自适应算法得到的二值图像,图10为局部阈值自适应二值化图像。
图8 大津法二值化图像
图9 本文二值化方法图像
图10 局部阈值二值图像
比较以上几幅图可知,用本文的方法可更好的保留图像的细节信息,同时避免了采用单独局部阈值法的虚假信息太多、抗噪声能力低和时空复杂度高的缺陷。本文提出的基于边缘信息的自适应二值化方法,它能使二值化的过程中尽量保留图像中的细节信息,同时抗干扰性也比较好。
[1] 陈强,朱立新,夏德深. 结合Canny算子的图像二值化[J] .计算机辅助设计与图形学学报,2005,17(6):1302-306.
[2] Canny J. A Computational Approach to Edge Detection[J] .IEEE Transactions on Pattern Analysis and Machine Intelligence,1986,8(6):679-698.
[3] Lee K K,Cham W K,Chen Q R. Chin Contour Estimation Using Modified Canny Edge Detector[C] // Proceedings of the 7th International Conference on Control,Automation,Robotics and Vision(ICARCV)2002:770-775.
[4] Ali M,Clausi D. Using the Canny Edge Detector for Feature Extraction and Enhancement of Remote Sensing Images[J] . International Geoscience and Remote Sensing SymPosium,2001, 5:2298-2300.
[5] 唐良瑞, 马全明, 景晓军. 图像处理实用技术[M] .北京:化学工业出版社,2002:94-105.
[6] 杨治平. 基于自适应多阈值变换编码的图像二值化处理[J] . 重庆师范学院学报:自然科学版,2001,18(3):77-80.
[7] 郑浩,张洪涛,叶声华. 基于目标边缘的图像二值化方法研究[J] . 计量技术,2002, (4):3-5.
[8] 张庆英,岳卫宏,肖维红,等. 基于边界特征的图像二值化方法应用研究[J] . 武汉理工大学学报,2005,27(2):55-57.
[9] 李国平. 基于莫尔技术的标牌凹凸字符图像获取与识别研究[D] .山东大学博士论文, 2007:5.