于月娜 梁光明 刘任任
1(湘潭大学信息工程学院 湖南 湘潭 411100)2(国防科技大学电子科学与工程学院 湖南 长沙 410000)
宫颈癌是一种发病率很高的妇科恶性肿瘤疾病,已经严重影响到了妇女的健康[1],目前在国内外病理学研究领域中都很重视对于该疾病的研究。宫颈细胞形态学研究是为了准确检测宫颈细胞的数量、形态种类、分布密度,为宫颈癌前病变检测提供有力的依据。其中,在宫颈细胞形态学研究中细胞分割效果的好坏在很大程度上影响特征的提取和分类的准确性。
目前已提出许多的宫颈细胞分割算法,如用支持向量机方法分割[2],采用可变形模板的分割[3],分水岭分割算法[4]、GVF Snake[5]与粗糙集[6]方法分割等。这些方法都在一定程度上改善了宫颈细胞图像的分割效果,但是还存在细胞分割不完整、准确率不高等缺陷,特别是在复杂背景下对于重叠细胞和粘连细胞的分割没有得到有效解决,并且效率不高,不能满足实际应用。
本文主要研究如何提高宫颈细胞分割的准确率和分割效率,满足实际应用,提出了一种基于图割的分层次高效宫颈细胞分割方法。对获取宫颈细胞图像进行灰度变化处理求得灰度直方图,对直方图结合OTSU求解最佳分割阈值,根据最佳分割阈值对图像进行初次分割去除背景,可以得到单个细胞目标;而对粘连、重叠、较为复杂的细胞图像再利用图割算法进行二次分割获取单个目标细胞。实验结果表明,本文所提出的算法不仅有较好的分割效果而且效率也很高。
在图像分割领域,首次谈到图割的概念和基本理论是在20世纪80年代末的文献[7]中。基于图割的分割是通过文献[8-9]的交互式分割方式进行的,具体理论是把图像分割问题转换成为图论方法中加权图的切割问题,分割的过程是求解能量最小化的过程,进而达到图像最理想的分割效果。图割算法对于彩色图像具有良好的分割效果,但是其速度相对较慢,对于采集的宫颈细胞图像直接用图割算法对其进行分割,效率低下,不能满足实际应用的需求。
本文提出一种基于图割的分层次高效分割方法,首先对一整张宫颈细胞图像做去背景处理,直接得到单个简单的宫颈细胞,然后利用图割算法重点分割粘连、重叠的宫颈细胞,这样在保证分割准确率的前提下可以大大提高宫颈细胞图像整体的分割效率。基于图割算法的分层次高效分割宫颈细胞方法的流程为:
Step1输入图像I,用直方图结合OTSU算法分割I,去除I背景,输出图像M;
Step2输入图像M,用形态学算法对M进行开闭运算,输出图像G;
Step3输入图像G,对G用图割算法进行二次分割,输出单个细胞。
2.1.1 灰度直方图处理
基于灰度直方图的图像分割方法[10-11]是图像分割中很直观、应用较为普遍的图像分割方法,其原理就是利用灰度直方图分析计算得到图像阈值从而进行分割的方法,如图1所示。直方图就是一个图像灰度级的函数,灰度级是图像中的横坐标,图像中该灰度级概率密度是纵坐标。当图像的灰度值直方图包含有双波峰、单波谷时,只需要确定波谷的灰度值T,就能够将背景与物体区分开来。
图1 基于直方图分割原理
在宫颈细胞图像中目标与背景有明显的差异,其灰度直方图呈现典型的前景背景双峰情形,可选取直方图的波谷为阈值可以分割背景与前景。但当图像受到噪声或者其他的干扰时,直方图就会出现两个或者多个波谷,这样选取波谷为阈值进行分割会造成分割不准确,影响分割效果。为了得到更精确的分割结果,本文在研究直方图分割算法的基础上,提出了直方图结合OTSU新的分割方法,对全局阈值分割法进行了改进,避免分割的不准确。
2.1.2 OTSU求解最佳阈值
最大类间方差法[12]简称OTSU,是日本大津(Nobuyuki Otsu)提出的一种自适合于双峰情况的自动求取阈值的方法。该方法存在主要缺陷是需要通过遍历灰度范围内所有像素点来计算求解类间方差,再进行比较,得到最大的类间方差和图像分割的最佳阈值,其计算量很大,效率较低,难以满足实际应用的需求。
对此,本文结合直方图处理对算法进行了改进。根据灰度直方图求出波谷处像素值,依次求出各波谷处像素值对应的最大类间方差值,对应类间方差最大的波谷处像素值即为最佳分割阈值K,这样在避免了误分割的同时提高了分割准确度与效率。
根据最佳分割阈值K对图像进行分割,设目标细胞的像素值为C,分割表示为:
(1)
这样处理后就可以去掉图像中的背景。
2.1.3 形态学后处理
形态学处理是较为常用的图像分割定位方法;形态学[13]处理主要方法有膨胀和腐蚀以及开运算和闭运算,假设A和B都是Z2中的集合。
B对A的开运算:
A∘B=(AΘB)⊕B
(2)
B对A的闭运算:
A·B=(A⊕B)ΘB
(3)
由于噪声的影响,宫颈细胞图像在阈值化后所得到的边界通常都很不平滑,细胞区域具有一些噪声孔,而背景区域上会出现一些小的噪声点。本文对去除背景后的图像用4×4的椭圆结构元素进行先闭运算后开运算,可以去除细小的点,平滑边界区域,得到更好的分割效果。
经过对图割分割基本原理[14]的学习与研究,分析讨论得出基于图割的宫颈细胞图像的二次分割算法流程,如图2所示。
图2 基于图割的宫颈细胞图像分割算法流程图
在此分割算法中,最基本也是最重要的是通过建立数学模型构造一个能量函数,将分割问题转换成数学寻优问题,进而应用数学方法求解该能量函数的最优解。在求解能量函数最优解的同时也是能量最小化的求解过程,通过能量函数最小来满足全局能量的最小化,从而实现图像最优分割结果。
在宫颈细胞图像二次分割中,能量函数为:
(4)
利用图割算法对去背景的宫颈细胞图像进行二次分割,主要对粘连在一起的宫颈细胞进行分割,能够将图像目标形状和灰度、纹理相融合,这样可以更好地分割目标细胞,得到更好的分割效果。
本文对158幅宫颈细胞图像进行了分割实验。图3-图5列出了本文算法和分水岭算法以及GVF Snake模型对其中一幅宫颈细胞图像的分割效果图。通过效果图可以看出本文提出的算法对于宫颈细胞的分割有很好的分割效果。
图3 本文算法分割效果
图4 分水岭分割算法分割效果
图5 GVF Snake算法分割效果
分水岭分割算法其基本思想为:首先对需要分割的图像进行坐标和灰度级变换处理,使其以数学描述的方式呈现出来;然后根据距离变换原理进行图像变换;最后找到不同区域间的分界线也就是分水岭线。在具体分割过程中主要是通过找到分割线完成对图像的分割。分水岭算法存在明显的缺点是极其容易受到噪声的影响造成分割轮廓的偏移,同时还会有过分割的现象出现。
GVF Snake模型基本思想是:把梯度场向图像边缘通过迭代的方式进行扩算形成GVF力场;然后定义动态轮廓能量函数,通过求解能量函数的局部最小值来实现动态轮廓逐步接近图像真实轮廓。但是GVF Snake模型存在着明显的不足是无法检测到凹型轮廓或具有较高曲率的凸型轮廓和物体内部轮廓;同时,整个运算过程较为复杂,涉及的参数也难以确定。
本文算法在速度和准确率上也有较大的提高。定义准确率为:R=N/M,N是分割后检测的宫颈细胞像素点,M是实际宫颈细胞像素点,R值越小,表示算法分割准确率越高。本文对158幅图像分割结果进行了统计,其准确率为95.24%,分割时间平均为0.89秒。同时统计了前人研究的支持向量机方法分割[2]、分水岭算法分割[4]、GVF Snake模型[5]、距离变换方法[15]等对本文158幅宫颈细胞图像分割的准确率与分割时间,其与本文算法的对比柱状分布图如图6所示。
(a) 不同算法分割时间对比柱状图
(b) 不同算法分割准确率对比柱状图图6 不同算法分割时间与准确率对比柱状图
通过对比分析,发现本文算法在速度和准确率上均有较大的提高。
本文提出一种新的基于图割算法的分层次高效分割宫颈细胞方法。对获取宫颈细胞图像进行灰度变化处理求得灰度直方图,对直方图结合OTSU求解最佳分割阈值,根据最佳分割阈值对图像进行初次分割去除背景,可以得到单个细胞目标;而对粘连、重叠、较为复杂的细胞图像再利用图割算法进行二次分割获取单个目标细胞。该算法分割准确率高速度快,非常适合在实际应用中分割复杂的宫颈细胞图像。