(南京林业大学机械电子工程学院,江苏 南京 210037)
木材缺陷是木材中影响木材质量和使用价值的各种缺陷,木材天然缺陷大致可分为节子、变色、腐朽、裂纹、树干形状缺陷、木材构造缺陷、伤疤等种类。而木材节子是其中对原木质量等级影响最大的缺陷,节子又有活节和死节之分。活节由树木活枝条形成,与周围木材紧密连生,质地坚硬,构造正常;而死节由树木死枝条形成,与周围木材局部或全部脱离,质地坚硬或松软。在板材加工中,木材死节容易脱落形成空洞,需要避让加工。木材缺陷检测的目的就是找出隐藏在木材中各种原因所造成的缺陷,提前做好应对措施,减少木材浪费。
目前对于木材节子缺陷图像分割的方法较多[1-5],但并不是每种方法都适合任何节子。本文提出一种木材节子缺陷图像分割方法比较研究,通过人工判别和jaccard、dice、bfscore三种判断方法来实现木材节子缺陷检测方法的比较、分类和选取。
本文通过比较8种木材节子缺陷图像分割方法来进行数据处理,从而针对不同的木材节子实行最佳的图像分割算法,算法流程框图如图1所示。首先,输入木材死节缺陷RGB彩图进行灰度化,并将灰度图分别通过8种算法依次得到每种算法的分割图,流程框图中将8种算法放入同一个方框中,与此同时将RGB彩图进行人工分割,得到人工分割图;然后,对每种方法得到的分割图像分别进行jaccard、
图1 算法流程框图
dice、bfscore三种标准分割评价的算法处理,分别得到各方法的3种判断结果,通过数据对比选取每一张图片最佳的图像分割方法;最后,对不同节子进行图像分割方法的整理归类,选取最佳木材节子缺陷图像分割的方法。
1.2.1 GM算法
GM算法即连续最大流算法[6],将图片看作一个Ω的闭区域,s和t分别表示流的源点和汇点。任何在这个区域的一个点记作x,则经过x的空间流为p(x),按照流向可以分成两种情况:ps(x)为源点s流向x,pt(x)为x流向汇点t。C(x)为空间流p(x)的容量限制,其也分成两种情况:Cs(x)为源流的容量限制,Ct(x)为汇流的容量限制。
(1)
(2)
1.2.2 Cross entropy算法
Cross entropy算法即交叉熵法[7]。交叉熵测量两个分布P和Q之间的信息理论距离,其定义如下:
(3)
设原图像为f(x,y),分割后的图像为g(x,y),则经过交叉熵分割法后重构图像表示为:
(4)
g(x,y)具体形式可由3个未知的参数决定:
(5)
式中:N1和N2分别为两个区域内的像素点个数。联合式(3)、式(4)和式(5)得:
(6)
1.2.3 ISO算法
ISO算法即迭代选择方法[8]。将图像的初始阈值估计值设置为T(0),将所有灰度值大于T(0)的像素点记为AT(k),表示目标区域,所有灰度值低于T(0)的像素点记为BT(k),表示背景区域。然后分别计算目标和背景区域内像素的灰度平均值μ(AT(k))和μ(BT(k))。最后计算新的阈值:
(7)
重复以上步骤,直至得到的阈值归一化到一个事先定义的[i,1]范围内。
1.2.4 Max entropy算法
Max entropy算法即最大熵分割法[9]。设p(x)是随机变量x的概率密度函数,用H表示熵:
(8)
设pi为灰度级i出现的概率,N×N为图像总的像素数,ni为灰度级为i的像素数,L为图像总的灰度级数。
(9)
对图像而言,区域为图像灰度直方图中灰度级低于像素点构成的区域,区域为图像灰度直方图中灰度级高于像素点构成的区域,两者的熵分析定义为:
(10)
1.2.5 OTSU算法
OTSU算法即最大类间方差法[10-11]。原图像的大小为M×N,目标和背景分割阈值为T。则图像中像素的灰度值小于阈值T的像素个数用N1表示,大于阈值T的像素个数用N2表示。目标的像素点数占图像所有像素点数的比例为ω1,其平均灰度为μ1;背景像素点数占图像所有像素点数的比例为ω2,其平均灰度为μ2。图像总平均灰度为μ,类间方差为g:
(11)
1.2.6 EM算法
EM算法即期望最大化算法[12],其是根据已有的数据来递归函数,从图像的一个轮廓开始,然后根据期望值p(C|φ)来估算出新轮廓的位置,最后根据提前设定好的阈值来检测迭代是否终止。
(12)
1.2.7 K-means算法
K-means算法[13]是指将一个含有n个数据的数据集划分成k个聚类。在图像分割中,首先将彩图从RGB转化到L*a*b*空间,然后再进行K-means聚类得到最后的各个分割区域。
(13)
式中:N1和N2分别为区域R1和R2中的像素;D(pi,pj)为两个像素pi和pj在Lab颜色空间中的距离度量;Rx为图像中任意一个不同于Rn的区域;m为图像通过K-means算法分割得到的区域数量。
1.2.8 Soft算法
Soft算法即模糊阈值法[14],其是以数学模型方法为基准,将图像转化为模糊阵列的形式。设图像大小为M×N,且有L级灰度{0,1,K,L-1},v(x)是定义在l级灰度上的隶属函数,h(i)为图像中灰度值是i的像素个数,则图像的模糊率可以表示为:
(14)
(15)
针对木材死节缺陷图像进行不同分割方法的比较研究[15-19],主要包括8种图像分割算法和3种标准判断检测法。本文选取木材死节缺陷150张图片,将木材缺陷死节缺陷、活节缺陷和空洞缺陷分成3类。每一种木材缺陷都挑选出一张最具代表性和综合性的图像作为示例来进行详细说明。图2所示为3种木材缺陷的样本图(原始图像),其中(a)为死节缺陷、(b)为活节缺陷、(c)为空洞缺陷。然后通过8种分割算法分别对样本图进行图像分割,最后得到的分割图如图3所示。为了便于显示,作了数值比例缩放处理。
图2 样本图
图3 分割图
为了准确评价图像分割的质量,采用最具客观的评价方法,即采取人工分割方法来提取理想的目标,如图4所示,并将此作为评价基准。Jaccard相似系数作为数值标量或数值向量返回[20-22],其值在范围内,主要用于计算符号度量或布尔值度量样本间的相似度。给定两个集合,用jaccard相似系数来判断两个集合的交集在并集元素中所占有的比例。Dice相似系数作为数值标量或数值向量返回,其值也在范围内。bfscore算法用于计算预测分割的边界和真正分割基础事实的轮廓匹配分数。预报和基础事实可以是用于二进制分割的一对逻辑数组,或者是用于多类分割的一对标签或分类数组。
将8种分割算法的分割图片和人工分割出来的图片进行对比,不难看出连续最大流算法(GM算法)是8种图像分割算法中分割效果最好的一种算法;最大熵分割算法(Max entropy算法)是8种图像分割算法中分割效果最差的一种算法。
图4 标准分割图
此外,还可以通过Matlab的3种标准评价算法来验证分割效果,数据已经转化成箱型图的形式。箱型图中列依次为GM算法、Cross entropy算法、ISO算法、Max entropy算法、OTSU算法、EM算法、K-means算法和Soft算法,如图5所示。
图5 评价指标值
GM算法的3种标准评价算法的数值都比其他算法高,在0.7左右。可见其不论对木材死节、活节缺陷图像,还是木材空洞缺陷图像,都具有很好的分割效果。
Max entropy算法的3种标准评价算法的数值都最低。是8种图像分割算法中分割效果最差的一种,容易受到木材纹理颜色的干扰。
Cross entropy算法对于木材空洞缺陷图像有着很好的分割效果,由此可见此算法不能作为对一些目标区域和背景区域没有明确分界线图像的分割方法。
ISO算法、OTSU算法、K-means算法、Soft算法和EM算法对于木材活节缺陷图像的效果较差,难以清楚地分辨出目标与背景的界限,存在木材颜色干扰。
(1)利用GM算法即连续最大流算法可实现图像分割,提取木材死节缺陷目标,具有较强的目标定位能力,且适用于各种类型的木材缺陷。
(2)试验结果表明,在jaccard标准评价方法中,MG算法的平均值达到0.8,且与其他七种方法的差距较大,因此可以通过将MG算法用于图像分割、jaccard算法作为判断标准的方法来分割木材节子缺陷的图像,以达到最佳分割效果。
(3)在150张不同种类木材缺陷分割图、8种分割算法和3种标准评价方法的基础上,通过分析对比,找到了最佳木材节子缺陷的分割方法。