夏剑峰
(上海理工大学 光电信息与计算机工程学院,上海 200093)
基于数学形态学的癌细胞的分割与识别
夏剑峰
(上海理工大学 光电信息与计算机工程学院,上海 200093)
要判断一幅测得的细胞图像中是否存在癌细胞,如果仅凭经验去判断,不仅工作量大,而且准确率相对较低。文中介绍了一种基于形态学的对一幅细胞图像进行分割和识别的算法。即先对图像进行膨胀或腐蚀预处理,然后通过设置圆度阈值,计算出每一个细胞的圆度来与阈值进行比较,并提取出可疑的癌细胞。实验表明,该算法不仅大幅降低了医务人员的工作量,而且显著提高了癌细胞识别的准确率。最终检测结果的正确率达到了95%以上。
形态学;分割;识别;圆度;细胞
XIA Jianfeng
(School of Optical-Electrical and Computer Engineering, University of Shanghai for Science and Technology,Shanghai 200093, China)
目前的图像诊断系统,多是采用数学形态学、灰度特征和色度学,并结合专家系统,对癌细胞进行分析和诊断。[1-4]
本文介绍了一种基于数学形态学的癌细胞的检测与识别系统。在形态学上识别癌细胞的主要依据是:与正常细胞相比细胞核发生改变、核体积增大、癌细胞核常呈不规则的叶状。在分割后的二值图像中,细胞核的边缘更加光滑,规则形状近似于圆,因此应用形态特征学特征可以更好的来识别癌细胞。基于癌细胞相对于正常细胞更接近于圆,因此该系统通过检查一幅图像中细胞的圆度,来判别其中是否有癌细胞并将其提取出来。
1.1 阈值分割
为了能有效地检测出癌细胞,先对图像进行二值化处理。为消除或减少图像中噪声对灰度门限值的影响,本文采用迭代算法来求得图像分割的最佳阈值。
设有一幅图像g(x,y)由原始图像f(x,y)和混入其中的噪声e(x,y)叠加而成,即
g(x,y)=f(x,y)+e(x,y)
(1)
这里假设各点的噪声是互不相关,且具有零均值,标准差为ε。通过阈值分割将图像分割成两部分,由于噪声是随机作用于图像的像素点上,则可以认为在分割出目标g1和背景g2图像中的噪声仍为e(x,y),即
g1(x,y)=f1(x,y)+e1(x,y)
(2)
g2(x,y)=f2(x,y)+e2(x,y)
(3)
在迭代算法中,需要对分割出的图像分别求其灰度值,则
E{g1(x,y)}=E{f1(x,y)+e1(x,y)}=E{f1(x,y)}
(4)
E{g2(x,y)}=E{f2(x,y)+e2(x,y)}=E{f2(x,y)}
(5)
上式说明,随着迭代次数的增加,平均灰度值将趋于真值。因此,用迭代算法求得的阈值将不受噪声的干扰[1]。从而大幅提高了图像阈值分割的准确性。
1.2 膨胀与腐蚀
在通过阈值分割获得的二值分割图像中,由于在细胞内部可能存在小洞,在其周边存在凹坑和凸刺,使得形态学特征的获取受到影响。[5-7]因此,本文算法在提取细胞形态特征之前,对其进行了适当的腐蚀和膨胀处理,以消除这些噪声的影响。本文采用了闭运算,即先膨胀再腐蚀。闭运算可以平滑图像的轮廓,融合窄的缺口和细长的弯口,能填补图像的裂缝及破洞[2]。实验表明,形态学闭运算提高了细胞形态学特征提取的准确性,从而提高了可疑癌细胞的识别准确率。
基于癌细胞相对于正常细胞更接近于圆,因此该系统通过检查一幅图像中细胞的圆度,来判别其中是否有癌细胞并将其提取出来。[8-9]首先给出圆度的定义如下
C=4πA/L2
(6)
式中,L为目标的周长;A为目标的面积;C描述了目标形状与圆形的接近程度。C≤1,C越接近1,目标形状越接近于圆,C=1时,则为圆形[10-12]。
考虑到既要计算图像中细胞的面积又要计算细胞轮廓的周长,而如果已知目标区域轮廓的链码表示,则面积和周长将很容易计算出来。又链码具有简单、节省存储空间、便于计算,以及平移不变性等特点[4,13],使得对于封闭区域特征参数的统计变得简单易行。因此,本文将使用链码来计算细胞的周长和面积。
设方向链码为{a1a2a3…an},定义ai在X轴上的分量为aix,在Y轴上的分量为aiy,则
ai=0时,aix=1,aiy=0;ai=1时,aix=1,aiy=1;ai=2时,aix=0,aiy=1;ai=3时,aix=-1,aiy=1;ai=4时,aix=-1,aiy=0;ai=5时,aix=-1,aiy=-1;ai=6时,aix=0,aiy=-1;ai=7时,aix=1,aiy=-1。
(1) 链码周长
(7)
(2) 链码所包围的区域的面积
(8)
(9)
其中,y0为起始点的坐标。
根据式(7)~式(9)即可将每一个细胞区域的周长和面积准确地计算出来。代入式(6),即可得到细胞的圆度。
图1为提取癌细胞的流程图。
图1 算法流程图
具体算法分为以下5个步骤:
步骤1 迭代阈值处理,将图像二值化,分割出图像中的所有细胞。
迭代法步骤如下:
(1)求出图像中的最小和最大灰度值Zl和Zk的阈值初值
T0=(Zl+Zk)/2
(10)
(2)根据阈值Tk将图像分割成目标和背景两部分,求出两部分的平均灰度值Z0和ZB,由式(11)和式(12)求得
(11)
(12)
(3)求出新阈值Tk+1
Tk+1=(Z0+ZB)/2
(13)
(4)若Tk=Tk+1,则结束。否则,k+1→k,转第(2)步。
第(4)步结束后,Tk即为最佳阈值。
步骤2 对预处理后的每一个细胞区域进行标志;
步骤3 分别计算每一个细胞区域的面积和周长,求出圆度;
步骤4 设置圆度阈值;
步骤5 将每个细胞区域计算出来的圆度与设置的阈值进行比较,小于阈值的从图像中删除,大于阈值的在原图中标识,从而筛选出可疑的癌细胞。
接下来对某一癌细胞图像利用本文算法在Matlab R2010中进行处理,处理过程和结果如图2~图7所示,最终将可疑的癌细胞在原图像中标志记出来。
利用上文提到的阈值迭代算法和相关的预处理,将每个细胞区域分割了出来,结果如图5所示。能够准确地分割出每个细胞区域对提高癌细胞的识别率会有较大帮助。设置阈值后,分割出的可疑癌细胞如图6所示,可疑的癌细胞被较好地分割了出来。
利用以上算法,进行了大量的形态学分割实验,从最终实验结果得出准确率达到95%以上,处理一幅图像平均用时约2 s。从实验结果可以看出,癌细胞的识别率远高于非癌细胞的识别率,即绝大数的癌细胞被正确的找出,而有少许的非癌细胞被错误误认为癌细胞。实验表明,这主要取决于圆度阈值的设定。因此,本文算法选择阈值的原则为在保证癌细胞识别率最大的前提下,使非癌细胞误识别率最小。这将通过大量的实验来获得最佳阈值。
图2 原始图像
图3 二值化图像
图4 去除无关背景
图5 预处理后图像
图6 提出的可疑癌细胞图像
图7 标志出的癌细胞
及早发现癌变,以达到准确地早期诊断和治疗是迫切需要解决的问题。要从大量的细胞中检测出是否存在可疑的癌细胞,对于人工判读来说工作量巨大,本文提出的基于形态学癌细胞的检测大幅降低了工作量,提高了诊断的准确性与效率。
[1] 胡小锋,叶庆泰,戴星.一种精确检测细胞真实边缘的算法[J].光学技术,2003(5):595-598.
[2] 冈萨雷斯. 数字图像处理[M]. 3版.北京:电子工业出版社,2003.
[3] 杨万扣,任明武,杨静宇.数字图像中基于链码的目标面积计算方法[J].计算机工程,2008(1):30-33.
[4] 任洪娥,徐海涛.一种基于链码技术的图像目标物体面积统计新方法[J].计算机应用研究,2008(1):303-305.
[5] 王芳.肿瘤细胞图像预处理及特征提取[D].呼和浩特: 内蒙古师范大学,2008.
[6] 李宇卓.肿瘤细胞图像分割算法研究[D].郑州: 郑州大学,2007.[7] 杨万扣.基于链码的部分算法研究[D].南京: 南京理工大学,2004
[8] 熊晨.一种能有效辨别癌细胞的图像处理方法[J].中国科技财富,2008(10):128.
[9] 张佳佳.基于图像分割的淋巴癌细胞提取方法研究[D].武汉: 武汉理工大学,2013.
[10] 艾星芳. 圆度图像测试技术及应用研究[D].广州: 广东工业大学,2012.
[11] 罗炳伟,余沪涛,江晓. 细胞图像分割的新方法[J].电子科技大学学报,1990(1):54-59.
[12] Wang Jiwei,Liu Wen.An energy conduction model for cell image segmentation[J].Chinese Science Bulletin,2011,56(1):1049-1055.
[13] Ma Jingfeng, Chen Shanglian.A new level set model for cell image segmentation[J].Chinese Physics B, 2011(2):572-578.
Segmentation and Recognition of Cancer Cells Based on Mathematical Morphology
Judging only by experience whether a measured picture contains cancer cells is a huge task is relatively low in accuracy. This paper introduces a cell image segmentation and recognition algorithm based on the morphology. The image is pretreated by expansion or corrosion, and then the roundness threshold is set to be compared with the calculated roundness of each cell to find suspicious cancer cells. Experiments show that the algorithm greatly reduces the workload of medical staff, and significantly improves the accuracy of cancer cells recognition to more than 95%.
morphology; image segmentation; recognition; roundness; cell
2015- 12- 29
夏剑峰(1991-),男,硕士研究生。研究方向:信号与信息处理。
10.16180/j.cnki.issn1007-7820.2016.10.011
TP391.41
A
1007-7820(2016)10-036-04