汪传忠 黎志金 武海燕2(南昌航空大学信息工程学院,南昌 330063)
2(南昌航空大学经济管理学院,南昌 330063)
标本质量评估是Bethesda系统[1-3]中最重要的单项质量保证内容。2001年Bethesda系统废除了“尚可”的级别,提出了更明确的标本质量评估意见。现在确定分为“满意”或“不满意”两个级别。这是判读液基宫颈细胞涂片满意度的唯一标准[4-5]。
目前,国外自动判读系统价格昂贵,使得我国部分地区还没开展此项检查技术,而且我国的宫颈细胞学诊断水平处于落后状态,具体表现在取材的不确定性、判断证据的片面性及依赖诊断者的经验[6]。技术人员只能通过人眼进行临床细胞学诊断,致使大量不规范的报告出现,甚至出现错误诊断无人复检的现象,会造成临床上的过处理及医疗事故的发生。因此提出一种科学、有效、快速的判读液基宫颈细胞制片的方法[7],这是智能诊断宫颈细胞学的基础。
要想达到自动判读液基宫颈细胞制片图像的目的,须解决以下几个问题:(1)炎症细胞覆盖问题;(2)计算液基宫颈细胞的个数问题;(3)杂质去除问题;(4)处理时间问题。
为了解决以上问题,提出一种基于颜色空间的检测方法,将两种目标颜色检测出来。文中应用Canny边缘算子检测细胞边缘[8],将核边缘提取出来,根据炎症细胞覆盖模型统计细胞核的个数,再结合上皮细胞快速检测方法,实现自动快速评价液基宫颈细胞制片的满意度。实验结果表明该方法准确性较高,在工程应用上是可行的。
判读为满意样本:同时描述有或无子宫颈管或移行区成分,以及液基宫颈细胞制片至少应有5 000个形态清晰完整的鳞状上皮细胞[9]。表1所示的是在不同显微镜视野下达到这一标准的最少细胞量。
判读为不满意样本:1.人为因素或样本条件受限而无法判读,血液或炎细胞覆盖过多,超过75%的鳞状上皮细胞被遮盖判读为不满意样本;2.鳞状细胞数量过少。
表1表示的是在不同显微镜视野下液基宫颈细胞制片数量的最低标准,该表在制片直径20 mm,面积314.2 m2的情况下制定。
表1 不同显微镜视野下的平均细胞量Tab.1 Different microscope field of the average cells
1.2.1 炎症细胞覆盖模型的建立方法
由于细胞与细胞之间有可能重叠、夹杂着炎症细胞,而且炎症细胞通过染色后,细胞质颜色非常浅,基本上只能看到细胞核,会出现一个细胞有两个细胞核的情况;另外,细胞之间的边缘非常微弱,因此,直接分割出两个细胞相当困难,使得准确度不高、效率差,可能造成误判。
为了解决以上的问题,建立炎症细胞覆盖模型,如图1所示,其判读依据是炎症细胞覆盖超过75%的鳞状上皮细胞则被判读为不满意样本。根据一个细胞只有一个细胞核的原则,当两个细胞核大于某一阈值的时候,则判断为两个细胞。反之,则认为被炎症细胞覆盖,或者是两个细胞出现重叠的现象,还需进一步增加处理条件。
两核之间的距离计算公式为
式中,(x1,y1)和(x2,y2)为细胞核质心。
式中,N表示细胞核的个数,r表示细胞的半径。
对图2(a)进行处理,通过建立的炎症细胞覆盖模型,得到图2(c)的结果。
1.2.2 基于颜色空间的上皮细胞检测方法[10]
图1 炎症细胞覆盖模型。(a)判别为两个细胞;(b)判别为一个细胞Fig.1 Model of inflammatory cell covery.(a)Recognized as two cells;(b)Recognized as one cell
图2 炎症细胞覆盖结果。(a)待处理图像;(b)分割结果;(c)覆盖模型结果Fig.2 Result of imflammatory cell covery.(a)Pendingimage;(b)Segmentationresult;(c)Covery-model result
由于染色带来的影响,会将细胞染成不同的颜色。利用HSB颜色空间检测出上皮细胞的方法优于利用普通灰度图像分割方法。
根据正常宫颈细胞的颜色特点,中层细胞的胞浆呈淡蓝色或粉色。因此,利用颜色空间来进行检测上皮细胞,将RGB空间转换到HSB空间。
步骤1:通过线性变换得到rg和yb分量;
步骤2:分别对其进行归一化处理
步骤3:利用最大类间方差法进行二值化得到如图3所示的图像。通过对比可以看出,利用基于颜色空间的检测方法可以将目标提取出来,而且效果较好,准确度较高。
1.2.3 上皮细胞快速检测的方法
时间复杂度是衡量算法执行的时间长短[11],其中一个衡量标准是根据时间频度。一个算法中的语句执行次数称为语句频度或时间频度。记为T(n)。
对图4中(a)和(b)中目标进行形态学处理—闭运算,即先膨胀后腐蚀。其主要的目的用来填充物体内细小空洞、连接邻近物体、平滑其边界的同时并不明显改变其面积。
图3 基于HSB颜色空间实验结果。(a)原图;(b)yb分量下结果;(c)rg分量下结果Fig.3 Experiment results based on HSB color space.(a)Original image;(b)Result of yb component;(c)Result of rg component
利用膨胀算法是将结构元素B去扫描图像A的每一个像素,对图4中(a)和(b)分别计算它们的时间复杂度。假设图4(a)中的图像宽度为w,高度为h,图4(b)中的图像宽度为w',高度为h',其中w'<w,h'<h;
for(i=1;i<h;i++)
for(j=1;j<w;j++)
{D=B⊕A;}
其中,B表示结构元素,A表示图像。
因此其频度可以通过求和公式求得:
所以图4(a)算法的时间复杂度为
依据同样的方法计算出图4(b)算法的时间复杂度为
由于w'<w,h'<h,因此 O(wh)≪ O(w'h')。
因此,图4(b)的时间复杂度更小,达到快速检测的目的。其实现方式是:根据图4(a)找到目标的水平、垂直方向上的最大、最小值。再提取出目标,如图4(b)。
图4 时间复杂度模型。(a)全区域;(b)目标区域Fig.4 Model of the time complexity.(a)Whole area;(b)Target area
表2是对在FN20目镜/10×物镜下采集到的100幅宫颈细胞图像利用Matlab编程进行图像处理实验所得到的结果。时间的统计是在计算机内存2 GB,Window 7操作系统下完成的。其自动判读结果满意的最低标准查看表1所示的数据,在最低标准以下的则被判读为不满意。
表2 实验结果Tab.2 The result of experiment
从表2可以看出,自动判读的统计时间都在500 ms以内,对100幅宫颈细胞图像实验中,有85幅判读为满意,准确率最低为93.6%,准确率最高为96.6%,平均准确率为95.2%。
图5是对表2图像序号4的处理过程,通过建立炎症细胞覆盖模型统计宫颈上皮细胞核个数,并得到统计细胞个数的结果。
图5 统计细胞群中细胞数量结果。(a)灰度图像;(b)边缘提取图像;(c)去除外边缘;(d)填充图像;(e)去除杂质;(f)计数结果Fig.5 Results of counting the number of cells in cell groups.(a)Grayscale image;(b)Edge extraction image;(c)Removingoutsideedge;(d)Padding image;(e)Removing impurities;(f)Count result
从实验结果来看,本算法通过对采集到的标准液基宫颈细胞制片进行统计其细胞个数,并通过炎症细胞覆盖模型,筛选出符合要求的细胞,来判读液基宫颈细胞制片满意度,取得较好的效果。
宫颈细胞满意度评价的准确与否将对以后宫颈癌诊断产生直接的影响,若判读失误,将会产生严重的后果。因此,宫颈细胞满意度评价在早期诊断起着重要的作用。本研究提出的一种宫颈细胞图像满意度的自动快速评价方法,不仅对目前国内仅靠人工或半自动判读机制作了改进,也为以后更多的研究人员能够在此基础上提出更准确、更快速的评价方法。
从实验结果来看,由于制片带来的影响,采集到的图像会出现亮度不均,利用普通的分割方法很难去除;由于细胞染色的作用,使目标出现了蓝、红等颜色,利用HSB空间分割,背景对分割结果不会产生影响,这样很容易就将目标分割出来。对目标进行细胞数的统计,利用炎症细胞覆盖模型统计细胞核的个数来确定细胞数。统计完细胞数之后,根据Bethesda 2001会议制定的评判标准作出判读。由于细胞的细胞核大小与炎症细胞的大小十分接近,因此对于统计细胞数有可能会造成一定的误差,但是假如对判读结果没有影响,则可以忽略。通过以上的分析可以得知,构造炎症细胞覆盖模型是统计细胞数的关键,也是对宫颈细胞满意度自动评价的重要步骤。完成宫颈细胞满意度的自动快速评价,为以后的宫颈细胞检查学提供依据。
本研究提出一种基于HSB颜色空间,并通过建立炎症细胞覆盖模型统计宫颈上皮细胞核个数,达到计算宫颈上皮细胞个数来实现对其满意度进行准确判读的方法。实验结果表明,该方法具有自动快速判读宫颈细胞制片的满意度,准确性较高,而且效率也较高。对判读不满意的液基宫颈细胞制片的干扰因素的判读,需要作进一步的分析研究。
[1]Rober JK,Diane S.The Bethesda system for reporting cervical Pvaginal cytologic diagnoses[M].New York:Spinger 2 Verlag,1993:1-18.
[2]黄受方,张长淮,余小蒙,译.子宫颈细胞学 Bethesda报告系统定义、标准和注释(第2版)[M].北京:人民军医出版社,2009:1-22.
[3]曹跃华,杨敏,陈隆文,等.细胞病理学诊断图谱及实验技术[M].北京:北京科学技术出版社,2009:72-78.
[4]Haroon S,Samayoa L,et al.Reproducibility of cervicovaginal ThinPrep cellularity assessment[J]. Diagnostic Cytolpathol,2002,26(1):19 -21.
[5]Spires SE.Assessment of cervicovaginal smear adequacy.The Bethesda system guidelines and reproducibility[J].Am J Clin Path,1994,102(3):354 -359.
[6]马博文.液基薄层细胞制片技术与宫颈细胞学诊断[J].诊断病理学杂志,2006,13(1):1-7.
[7]Nieminen P, Kotaniemi-Talonen L, Hakama M, etal.Randomized evaluation trial on automation-assisted screening for cervical ancer:results after 777,000 invitations[J].J Med Screen,2007,14(1):23-28.
[8]秦襄培.MATLAB图像处理与界面编程宝典[M].北京:电子工业出版社,2009:441-446.
[9]Biscotti CV,Dawson AE,Dziura B,et al.Assisted primary screening using the automated ThinPrep Imaging System[J].Am J Clin Pathol,2005,12(3):281 - 287.
[10]章毓晋.图像工程(上册)图像处理(第2版)[M].北京:清华大学出版社,2006:171-172.
[11]刘怀愚,朱昌杰,李璟.时间复杂度的几种计算方法[D].电脑知识与技术,2011,7(1):4636-4638.