程昱之 钟丽辉 何鑫 王远 李朝兰
摘 要:针对管孔随机分布且大小不一导致管孔分割鲁棒性不高,及木纤维、木射线和轴向薄壁组织等噪声对管孔分割效果影响较大的问题,本研究提出一种改进K-Means聚类与水平集的木材横截面管孔分割算法。采用改进K- Means聚类对管孔区域进行粗分割,有效地区分管孔区域与木纤维、木射线以及轴向薄壁组织等噪声区域。再对粗分割结果采用水平集算法进行精分割。实验结果表明,平均每张木材横截面微观图像有98.8%的管孔被准确有效地分割出来,且分割出的管孔与实际管孔基本吻合。相比之下,本研究提出的改进分割算法较其他算法,每张木材微观图像的平均管孔分割准确率提高了1.7%。该算法有效地解决传统K-Means聚类算法在图像分割时噪声影响大和初始聚类中心的随机性问题,在针对大小不一且随机分布的管孔分割过程中鲁棒性更高,具有良好的分割性能。
关键词:改进K-means聚类算法;水平集;木材横截面;管孔;图像分割
中图分类号:S781 文献标识码:A 文章编号:1006-8023(2022)01-0042-10
Segmentation of Wood Cross-section Pore Based on
Improved K-Means Clustering and Level-set
CHENG Yuzhi1, ZHONG Lihui2*, HE Xin2, WANG Yuan1, LI Chaolan1
(1.School of Machinery and Transportation, Southwest Forestry University, Kunming 650224, China;
2.College of Big Data and Intelligent Engineering, Southwest Forestry University, Kunming 650224, China)
Abstract:Aiming at the problem that the pores are randomly distributed and have different sizes, which leads to low robustness of pore segmentation, and the noise such as wood fiber, wood ray and axial parenchyma has great influence on the pore segmentation effect, this study proposes an improved K-Means clustering and level-set algorithm for wood cross-section pore segmentation. The improved K-means clustering was used to segment the pore area coarsely, which effectively distinguished the pore area from noise areas such as wood fiber, wood ray and axial parenchyma. Then, the improved level-set algorithm was used for fine segmentation of the coarse segmentation results. The experimental results showed that 98.8% of the pores were segmented accurately and effectively in each microscopic image of wood cross-section, and the segmented pores were basically consistent with the actual pores. In contrast, compared with other algorithms, the improved algorithm proposed in this study improved the average segmentation accuracy of each wood microscopic image by 1.7%. This algorithm can effectively solve the problems of noise influence and randomness of the initial clustering center of traditional K-means clustering algorithm in image segmentation, and has higher robustness and good segmentation performance in the segmentation process of pores with different sizes and random distribution.
Keywords:Improved K-means clustering; level-set; wood cross-section; pore; image segmentation
0 引言
在闊叶材横截面微观图像中能够观察到管孔、木射线、生长轮、木纤维和轴向薄壁组织等木材微观结构,其中管孔是木材研究领域最重要的特征之一[1-2]。管孔不仅能够作为分析木材蒸腾作用与木材解剖特征之间联系的研究要素[3],而且也是研究环境气候变化对木材生长和木材解剖特征具体影响的参考依据[4],此外管孔分割是微观木材图像中提取管孔特征量和进行木材树种自动识别的关键步骤[5-7]。因此,微观木材图像中的管孔分割有着重要的研究意义。
近些年来应用于管孔分割的算法主要有数学形态学、区域生长和聚类算法等[8-11]。Qi等[9]运用开闭运算等数学形态学算法对管孔进行分割,该算法分割出了大多数管孔,但出现了图像边缘细节丢失,如较小的管孔被当作噪声去除或是较大的管孔部分组织缺失。在此之后,Roncancio等[10]通过结合多尺度模型的形态学处理和模糊C均值算法分割木材图像,虽然考虑相同类别的2个像素在给定尺度下的灰度差随着尺度的增加而减小来改善分割效果,但该算法无法去除木材图像中的大部分噪声。Espinosa等[11]运用形态学处理,并根据灰度共生矩阵(Gray-Level Co-occurrence Matrix ,GLCM)提取的木材图像灰度特征对木材图像实现K-Means聚类进行管孔分割,该算法分割出的管孔较为饱满,但存在部分管孔的漏分和管孔组织缺失。Shen 等[12]通过检测闭合区域的平均面积得出最适合的结构元素,并运用形态学算法对管孔进行分割,但还是会出现小孔漏分、大孔误分的情况。由于木材横截面微观图像中管孔数量较多,形态各异且分布不均匀,此外木纤维和轴向薄壁组织从横截面看去也是一个个相对较小的孔洞,从而对管孔进行分割较为困难。综上所述,现阶段对于微观木材图像中管孔的分割依然是研究的热点和难点。
针对管孔漏分、误分,去除木纤维、木射线以及轴向薄壁组织等噪声和传统K-Means聚类初始聚类中心随机性的问题,本研究提出了一种基于改进K-Means聚类与水平集的管孔分割算法。首先,绘制木材图像的RGB(红(red,R),绿(green,G),蓝(blue,B))分量绘制颜色直方图,其次,根据颜色直方图上对应峰值和波谷的中心点确定3类目标区域的初始聚类中心点,第1类为轴向薄壁组织和木纤维,第2类为管孔,第3类为生长轮和木射线。再次,根据初始聚类中心点进行K-Means初始聚类,迭代结束后将3类区域颜色编码,最后应用水平集算法分割管孔区域。实验结果表明,本研究提出的改进算法很好地解决了管孔漏分、误分和噪声去除的问题,同时有效地分割出了管孔区域。
1 材料与方法
1.1 实验环境
硬件设备:CPU为Inter Core i5-7300HQ,显卡为NVIDIA GTX 1050 2G,内存为DDR4 12GB;软件环境,操作系统为Windows 10,Python 3.7,OpenCV 4.4.0.44;数据来源为日本森林数据库(https://db.ffpri.go.jp/WoodDB/JWDB/home.php)。该数据库成立于1928年,现有木材标本29 000余号,隶属270科,2 050属,8 500种;切片标本约90 000号[13]。表1为本研究所用到的木材树种信息表。
1.2 传统的K-Means聚类算法
传统的K-Means聚类算法以距离作为相似性的评价指标,其基本思想是按照距离将样本聚成不同的簇,簇中各点距簇类中心距离越近,相似度就越大,以得到紧凑且独立的簇作为聚类目标。该算法能够快速有效地对目标分类,当聚类目标较为理想,即簇是密集的或簇与簇之间区别明显时,该算法的聚类效果很好。综上所述,由于木材微观图像中各管孔之间的颜色梯度差异较小,管孔便能够作为理想聚类目标,所以本研究采用K-Means聚类算法对木材横截面微观图像进行管孔的粗分割[14]。
首先定义簇类数K的值,根据木材横截面原图的颜色特征,本研究的目标簇类可分为3类,第1类为轴向薄壁组织和木纤维,第2类为管孔,第3类为生长轮和木射线,所以K为3。其次基于彩色木材图像的R、G、B 3个通道分别为x、y、z轴建立空间直角坐标系,即x轴表示红色通道,y轴表示绿色通道,z轴表示蓝色通道,那么木材图像上的每个像素点与该空间直角坐标系就建立了一一映射的关系。再次从空间直角坐标系中随机取出3个点,作为3个簇各自的簇类中心,即{μ1,μ2,μ3}。计算所有像素点到3个簇类中心的距离,其中,距离定义为欧氏距离Ds,r、g、b分别表示红绿蓝三通道,(rn,gn,bn)为彩色图片中某像素点,(r0,g0,b0)∈{μ1,μ2,μ3}表示某簇类的簇类中心[15]。
Ds=(rn-r0)2+(gn-g0)2+(bn-b0)2。(1)
然后将所有像素点划分至与其距离最小的簇類,确定像素点Xn的簇标记λn∈{1,2,3}, n为图像的像素点数目,argmin表示求目标函数的最小值,C为簇划分。
λn=argmini∈{1,2,3}Ds。(2)
Cλn=Cλn∪{Xn}。(3)
最后求出新形成的簇类中心μi′并重复上述过程,
μi′=1Ci∑Xn∈CiXn。(4)
直到簇心不再变化,即μi′=μi自此聚类完成。
C={C1,C2,C3}。(5)
1.3 改进的K-Means聚类算法
虽然将样本映射到RGB颜色特征空间,构造了新的映射关系,打破了聚类的形状一般只能是球状的限制。但聚类中心的选择会较大程度上影响分类效果,尤其是当聚类中心的取值全部位于管孔以外时,管孔区域会被整体归为噪声。此外,由于初始聚类中心的随机生成,可能会导致分类结果不一致或将木纤维或轴向薄壁组织被整体分割出来。基于此,针对以上问题进行算法改进。