黄毅凯
摘要:文本图像分割是文本识别等重要技术的基础,而文本图像分割又常常因为光照不均匀、字迹模糊等原因导致分割效果差、自适应差;本文针对目前存在的几种全局阈值图像分割法进行分析其存在的缺陷;并分析一种基于局部分割的自适应阈值分割法,该方法将图像划分成小区域,通过小区域内单个像素点计算的阈值再对小区域进行阈值分割,可以实现较好的分割效果。
关键词:文本图像分割;自适应阈值
1引言
图像分割是指通过简化或者改变图片的表达形式,将数字图像分割成若干个特定的图像子区域(像素的集合),使图像更容易理解。图像分割是计算机视觉、文字识别、图像识别和视频检索等技术中的基础。
文本图像在进行阈值分割时存在由于非均匀光照导致灰度直方图亮部和暗部的背景和文本波峰的混淆、图像采集中存在的图像噪声对文本分割造成的干扰、文本图像由于纸张、墨汁或者其他因素的影响导致字迹模糊等现象、文本分割算法自适应差,对参数依赖性高,分割效果合并差。
图像分割技术是利用图像中的某些特征信息(如亮度、梯度、颜色、纹理等),遵循一定的相似度准则,将图像划分为若干内部一致而特征不同的同质连通区域,即该区域内部各像素点在灰度、颜色、梯度、纹理等特征上具有高度相似度,而不同区域各像素点之间有显著差异。目前,常用的图像分割算法通常采用阈值进行分割,阈值分割又存在OTSU分割法、双峰直方图分割法、最大熵法、迭代阈值法等全局分割算法,存在各自的局限性,本文将对这几种方法进行分析,并分析一种根据局部分割进行的自适应阈值分割法。
2常见阈值图像分割方法
2.1 OTSU阈值分割法
OTSU阈值算法的关键是找到合适的阈值将图像划分为特定目标和剩余背景两部分。假设一幅红外图像的总点数为N,灰度级为L(L=256),灰度值为i的像素個数为Ni,先计算i出现的概率,再通过单阈值可以把目标图像分为C0和C1两部分,计算两个区域的概率w0和w1,然后计算C0和C1两个区域的均值分别为μ0+μ1,那么红外图像的总均值T可以为w0μ0+w1μ1,得到C0和C1两部分的类间方差为σ(t)。
当两个类间方差达到最大时,即(t)为最大值,那么此时的t即为最佳阈值。将OTSU单阈值扩充到多阈值分割,当一幅图像被分为M层时,其中阈值为t1,t2,…,tM(0<t1<t2<…M-1)可以表示此时M层的类间方差可以表示为:
当( t1,t2,…,tM-1)取得最大值时,t1,t2,…,t M-1即为最佳阈值。
2.2 双峰直方图阈值分割
文本图像的灰度直方图通常为双峰分布,表明图像的内容大致分为两个部分,其灰度分别为灰度分布的两个山峰附近对应的值。谷底对应的阈值就是将目标与背景分割的最佳阈值。选择阈值为两峰间的谷底点对应的灰度值,把图像分割成两部分,可以使文本图像分割错分概率最低。
2.3 最大熵阈值分割法
进行图像阈值分割,将图像分为两类,可以用熵作为分类的标准:两类的平均熵之和为最大时,可以从图像中获取最大信息量,此时分类采用的阈值为最佳阈值。
对于数字图像,假设阈值为T时,先计算目标与背景两个区域的熵H0(T)与HB(T),再计算评价用的熵函数J(T)=H0(T)+HB(T),当熵函数取最大值时,对应的阈值T就是所求的最佳阈值。
2.4迭代阈值法
迭代法求取阈值进行图像分割,图像分割后的A、B两部分的均值和基本保持稳定。也就是说,随着迭代的进行,取 [mean(A)+mean(B)]/2 最终的收敛值作为分割阈值。先通过选取一个初始阈值T;再利用阈值T把给定图像分割成两组图像,计算这两组图像均值μ1和μ2;再选择新的阈值T,令T=(μ1+μ2)/2;重复上诉步骤,直到连续两次T的差值小于一个设定的预设值。
2.5阈值分割算法结果分析
在阈值分割时,往往采取将彩色图像转化为灰度图像进行阈值分割,对预处理后的目标图像进行单阈值分割,按照上述几种阈值分割进行实验,得到的分割图像如图2-1所示。
经过OTSU单阈值处理后的图像文字与背景部分融为一体,无法辨认,分割失败,显然是达不到预期目标效果;双峰直方图阈值分割法由于在非均匀光照下的文本图像背景与目标区别较小,难以找到很好的谷底位置,导致分割结果失败;最大熵函数法也难以达到图像分割想要的标准,文本丢失更多;迭代阈值分割得到的结果,也达不到理想的效果。综上分析可知全局阈值分割法并不能完成对非均匀光照下的图像分割。
3 局部自适应阈值分割方法
自适应阈值法可以根据图像不同区域亮度分布,计算小区域局部阈值,所以对于图像不同区域,能够自适应计算不同的阈值,从而对图像进行小区域的分割。
自适应阈值化先为每一个像素点单独计算的阈值(每个像素点的阈值不同),再将每个像素点周围固定区域内的像素加权平均,然后减去一个常数,从而得到该点的阈值。用来计算区域阈值的邻域块大小是固定的,通常选择为3、5、7......等;减去的常数是一个和自适应阈值算法相关的参数,是一个从均值或加权均值提取的常数。局部阈值分割的详细流程图如图3-1(a)所示。分割结果如图3-1(b)所示。
4 结束语
从图像分析结果来看,无论是OTSU、双峰直方图阈值分割、最大熵法、迭代阈值等全局这些分割算法,对于非均匀光照条件下文本,都不能够将文本信息完整的分割出来,分割失败;而经过局部阈值分割后,图像背景与文本信息能够很好的被区分开来,效果很好,满足分割的要求;全局分割结果都未取得成功的主要原因是图像的像素低,非均匀性光照下的文本信息,背景与目标灰度值非常接近,因而在全局分割过程中,就会出现上面分割失败;采取局部阈值分割,根据各个小区域的像素值,进行局部的调整,就能在全局避免分割效果不佳的结果。
参考文献
[1]黄莅辰. 非均匀光照下文本图像分割算法研究[D].湖南科技大学,2015.
[2]冈萨雷斯, R.C.), 伍兹,等. 数字图像处理:英文版[M]// 数字图像处理:英文版. 电子工业出版社, 2010.
[3]王小彬. 基于机器视觉的SMT焊点自动光学检测系统研究[D].苏州大学,2009.
[4]杨帆, 王志陶, 张华. 精通图像处理经典算法:MATLAB版[M]. 北京航空航天大学出版社, 2014.
[5]Bhandarkar S M , Zhang H . Image segmentation using evolutionary computation[J]. IEEE Transactions on Evolutionary Computation, 1999, 3(1):1-21.