基于二项分布的双窗OTSU的矿石分割模型

2019-06-20 02:44:58许文祥张国英陈路豪
有色金属(矿山部分) 2019年3期
关键词:二项分布二值方差

许文祥 , 张国英,蒋 焱,陈路豪

(中国矿业大学(北京) 机电与信息工程学院,北京 100083)

图像分割[1-3]提取出图像中有意义的部分,作为图像识别和分析的基础[4]。阈值分割是图像分割中一类最早被研究和使用的方法,其具有物理意义明确、效果明显、易于实现、实时性良好的特点[5]。在诸多的分割方法中,门限法[6]通过选择一个或几个最佳灰度阈值,将原图像中的目标和背景分开,最大熵法[7-9]和最大类间方差法(OTSU)[10-16]等是优化的阈值方法。破碎矿石图像[17-18],具有个体粘连堆积、表面光照不匀、对比度差、形态杂乱无章,特别是边缘模糊不清等特点,使得分割变得更加困难[19]。

针对此类问题,张国英等人提出的双窗OTSU阈值法[20]是一种将双窗[21]与最大类间方差法[3]结合起来的自适应阈值[22]改进方法,适用于复杂、凌乱的矿石图像。所提算法克服了单独用一维最大熵或者双窗自适应的缺点和不足。针对多尺度、光照不均、堆积粘连的复杂矿石图像,效果显著,能去除较多的噪声,更多的边被保留了下来。其中存在两个问题:其一,类间方差判别准则仅仅将此类问题作为简单的离散型随机事件的方差求解问题,认为最佳阈值求解是一个多峰问题,该方法进行多次冗余迭代计算,算法的时间性能大大降低;其二,得到的两个阈值取极值作为中心像素二值化的最佳门限,针对大小相似的矿石图像时等同于损失了一个窗口的阈值信息。

本文验证窗口内像素分布满足二项分布[23]规律,提出了一种二项分布优化的双窗OTSU算法。通过二项分布的方差函数的性质证明双窗OTSU阈值分布是单峰分布,可以表达为类似二次函数,均值求解过程通过爬坡方法优化。以窗体尺寸加权的方式从双窗求取像素阈值,充分保留了两个窗口的阈值信息,提高了二值分类精度。

1 双窗OTSU二值化方法

双窗OTSU算法将双邻域与OTSU的方法[5]相结合进行图像像素分类,OTSU方法根据邻域内像素二分类的最大类间方差确定窗口阈值。每个中心像素根据图像目标特征选择了像素的两个邻域窗口[24]。每个局部窗口应用OTSU方法计算最优阈值[25],得到的两个阈值取最值作为中心像素二值化的最佳门限。该方法能有效地从背景中提取出目标区域,算法如下:

2)计算窗口最佳阈值: (ω1(t),M1(t))、(ω2(t),M2(t))表示组A和组B的像素数量和平均灰度值,图像f(x,y)中的平均灰度值为:

(1)

(2)

fb(x,y)=

(3)

其中1是对象像素的值,0是背景像素。

2 基于二项分布的双窗OTSU分类模型

类间方差将二分类问题视为简单的离散型随机事件的方差求解问题,判别准则是从灰度分布t∈[0,255]依次求取方差,方差的最大值对应的t值作为最佳阈值。该方法计算复杂度高,算法的时间性能大大降低。像素的阈值由两个窗口的极值计算,没有考虑邻域窗口的像素分布,导致阈值分类误差。本文提出了基于二项分布的双窗OTSU分类模型,只需在窗口中寻找方差峰值,并且后续像素阈值在前序像素的优化阈值附近查找。

2.1 图像窗口像素的二项分布规律

定义1: 二项分布即为n次独立的伯努利试验,每次试验只有两种结果,两种结果发生与否互相对立且相互独立,各次试验结果无关。事件发生的概率在每次独立试验中保持不变,则这一系列试验总称为n重伯努利试验。从而能够以概率论的二项分布的角度分析此类问题。

证明:将窗口内所有像素的灰度值分为大于t与小于t两类事件,其结果必然是互相对立的。事件的独立性是指:一个事件的发生不影响另一个事件的发生。因为像素值的分布是随机的,所以前一个像素的分类结果不能影响下一个像素的分类结果。各次试验结果无关,事件发生的概率在每次独立试验中保持不变,则像素的分布规律满足二项分布。又根据图1的方差分布可以再次证明该理论的准确性。

其中N(t)为窗口内灰度值大于t的像素点个数,灰度值小于t的像素点个数为N-N(t)(其中N为窗口内像素点总个数),即方差可以表示为:

(4)

因为N(t)是关于t的连续非减函数,即N(t)

随着t的增大而增大或者不变。方差是一个符合y=-x2+cx(其中c为常数)的二次函数,所以方差存在峰值。N(t)的分布导致方差峰值处的t值可能是多个连续的值。在最小的t值左侧,方差是关于t的非减函数;在最大的t值右侧,方差是关于t的非增函数,即方差随着t的增大而减小或者不变。

图1 任意窗口的方差分布图Fig.1 Variance distribution map of any window

2.2 基于二项分布的单窗口OTSU阈值模型

1)窗口增减区间判断

2)单窗口减区间迭代阈值

判断当σB(t)<σB(t+1)时,停止迭代,得到最佳阈值的左边界l=t+1,然后比较是否σB(l)=σB(l+1)成立,直到等式不成立时得到最佳阈值的右边界L=l+n,然后执行步骤4)。

3)单窗口增区间迭代阈值

当σB(t)>σB(t-1)时,停止迭代,得到最佳阈值的右边界l=t,然后比较是否σB(l)=σB(l-1)成立,直到等式不成立时得到最佳阈值的左边界L=l-n,然后执行步骤4)。

4)单窗口阈值确定

基于二项分布的单个窗口阈值模型的算法流程图如图2所示。

2.3 基于二项分布的双窗口OTSU图像分类模型

双窗口最优阈值求解,通过上述二项分布函数的窗口OTSU阈值模型求取两个窗口各自的最优阈值,通过窗口像素数量加权求和获得双窗口最优阈值。

1)使用canny算子求取彩色图像的边缘信息;

2)求取最大目标和最小目标的粒径作为邻域窗口的尺寸m和n。

图2 算法流程图Fig.2 Algorithm flow chart

(5)

本文中以窗体尺寸加权求取像素阈值,其权值由各自窗口内像素点个数占两个窗口像素点个数总和的比例所决定。充分保留了两个窗口的阈值信息,提高了二值效果,减少误分类,增强边界信息。最后,我们可以得到所有指标x和y的二进制图fb(x,y):

(6)

其中1是对象像素的值,0是背景像素。

3 试验及结果分析

3.1 试验指标及结果

对于目标图像的分类,算法所选取的窗口尺寸及输入图像尺寸的详情见表1。双窗OTSU和本文改进算法的处理时间及像素分类正确率两个指标对比及两种算法优化百分比的结果见表1。其中像素分类正确率是通过对矿石样本图像进行手工分割得到的准确二值图像,然后得到算法生成的二值图像的像素分类准确比。

表1 图像阈值化的处理时间及准确率对比表

图3中原图从左到右是混合土石料、粒级混配石料、光照不匀石料和粒径均匀石料图像。分别使用双窗OTSU和本文模型分类出上述图像中的石料与背景,结果见图3(b、c、d)。

图3 二值化结果对比图Fig.3 Comparison diagram of binarization results

3.2 试验分析

3.2.1 时间分析

表1为原双窗OTSU阈值求解算法和本文改进的算法时间对比。通过表中双窗OTSU方法与本文方法的试验结果比较,可以看出本文算法大大提升了时间效率。由表中时间优化百分比的数据得到算法的时间性能提升了50%~80%。如图3所示,其中对于土石混合石料的二值化时间效率提升最高,为75.7%,因为其目标与背景十分相似,像素值分布范围小,所以本文算法迭代次数最少;对于大小均匀石料的二值时间效率提升最小,为48.6%,因为其为光照不均匀图像,且目标之间像素差异较大,导致图像像素值分布范围较广,迭代的次数多。

3.2.2 分类精度分析

观察图3(b)和图3(d)为使用不同的双窗阈值的确定方法得到的最终结果,原来的二值方法选取双窗各自最佳阈值中的最小值作为像素二值的阈值,它增加了背景像素,但是在较大石块表面有大量的孔洞噪声。特别在目标大小不一的图像中,原方法等同于损失了一个窗口的阈值信息,导致部分像素误分类。基于多次试验取平均值能有效地减小试验误差,本文提出双窗各自阈值以一定比例相结合共同决定像素最终的二值化,充分保留了两个窗口的阈值信息,提高了二值效果,降低了误分类的概率。从图3(d)中可以发现本文方法得到的二值结果图中矿石内部噪声远小于原双窗OTSU方法得到的结果图中的噪声,从表1中的前景像素比中可以看出,本文方法得到的二值结果更精确,由表中数据分析得到对于图3(a)中土石混合石料的目标与背景相似度高,难以分类的图像,分类的精度提升最高,为13.78%;对于图3(a)中混合粒径石料图像,分类的精度提升次之;对于图3(a)中大小均匀且目标较大的石料图像,其目标易于分割,原方法已有较好的分类精度,所以分类精度提升最小,为5.83%。说明本文方法对于复杂难以分类的图像相比于双窗OTSU有更好的分类效果。

4 结论

针对光照不均的低对比度、噪声严重的低信噪比矿石图像,具有分类精度不理想、时间效率过高、窗口尺寸选取需要人工干预等缺点。本文在证明邻域窗口中的像素灰度值满足二项分布的基础上提出了基于二项分布的双窗口OTSU图像分类模型。通过二项分布方差的规律优化像素最佳阈值的求取过程,大大减少了迭代的次数,使得算法提升了50%~80%的时间性能;通过canny算子提取目标边缘和统计其中最大目标和最小目标作为双窗口尺寸,大大提高了算法的智能性;通过双窗各自阈值以一定比例相结合共同决定像素最终的二值化,充分地保留了两个窗口的阈值信息,降低了误分类的概率,提高6%~13%的分类精准度。试验结果表明,本文所提算法更具备智能性,抗干扰性更强,二值分割效果更好,时间效率更高,具有较强的实用价值。

猜你喜欢
二项分布二值方差
方差怎么算
二项分布与超几何分布的区别与联系
混沌伪随机二值序列的性能分析方法研究综述
深度剖析超几何分布和二项分布
概率与统计(2)——离散型随机变量的期望与方差
概率与统计(1)——二项分布与超几何分布
支持CNN与LSTM的二值权重神经网络芯片
高技术通讯(2021年2期)2021-04-13 01:09:46
计算方差用哪个公式
基于二值形态学算子的轨道图像分割新算法
测控技术(2018年10期)2018-11-25 09:35:28
方差生活秀