基于细胞面积估计的蓝藻细胞计数

2015-01-15 05:54胡洋洋
服装学报 2015年5期
关键词:像素点灰度预处理

胡洋洋, 王 鑫

(江南大学 教育部轻工过程先进控制重点实验室,江苏 无锡214122)

环境问题是我国可持续发展面临的重大问题,水污染是环境问题中的重点之一。太湖水污染导致蓝藻水华爆发,造成严重的后果。因此,淡水水体中的蓝藻细胞浓度的测量十分重要。目前,测量细胞浓度的方法主要有:细胞计数仪法、菌落计数器法、库尔特计数器法、分光光度测定法[1]和荧光法、流式细胞仪法、细胞计数传感器法[2]与图像处理法[3]。

调研与实验表明,在基于图像处理的细胞计数[4]中,主流方法是先图像分割,再进行隔离标记计数,该方法对细胞图像的前期分割处理要求很高,而且对细胞较多或细胞粘连程度较大的图片进行计数的结果误差很大;而常用的基于细胞核定位的计数方法对原核细胞的蓝藻细胞而言也是不适用的;已有的基于面积的红细胞计数方法[5]则没有经过细胞预分割环节,直接根据每个不连通区域的大小判断该区域代表的细胞数目,再进行统计计数,该方法对于平均细胞面积获取的先验性很差,而且最终计数结果误差较大。

针对以上问题,文中提出了基于细胞面积估计的细胞计数法(简称“面积法”)。特别地,为了改善细胞面积估计的精度,将二值化后的细胞图像中的细胞面积作为一个随机变量,并借助基于核平滑的概率密度估计找到了单个细胞面积最可能的值。

1 理论分析

细胞计数的图像处理法,是将原始显微细胞图像进行二值化,预分割以后再进行细胞计数。

1.1 图像预处理

在用显微镜获取细胞溶液的图片后,首先要进行图像预处理。图像预处理包括对输入图像进行特征提取、分割以及匹配前所进行的处理。图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性,最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性。预处理的方法有很多,在细胞计数中主要应用到的是二值化[6]和形态学运算[7-8]。

二值化是图像分割的一种方法。在二值化图像时把大于某个临界灰度值的像素灰度设为灰度极大值,把小于这个值的像素灰度设为灰度极小值,从而实现二值化。临界灰度值也称阈值。根据阈值的选取准则不同,二值化的算法分为固定阈值和自适应阈值。比较常用的二值化阈值选取算法有:双峰法、P 参数法、迭代法与OTSU 法[9]等。文中二值化域值选取的是OTSU 法。它是一种基于灰度直方图的阈值选取方法。它选取使类间方差最大的灰度级作为分割阈值。

距离变换是对二值图像的一种操作运算,它将一幅二值图像转化为一幅灰度图像,在这幅灰度图像中,每个像素的灰度级是该像素与距其最近的背景间的距离。从理论上讲,要计算一个像素点到背景像素点的最短距离,需要对图像进行全局操作运算,即计算此像素点与所有背景像素点的距离,再取最小值。除非这幅数字图像的尺寸非常小,否则这种全局操作的计算量是非常大的。实际运用中的距离变换实现算法是从邻近像素点入手,每次只计算其与局部相邻的几个像素点距离的最小值,根据全局距离是局部距离按比例叠加而成的原理,对图像进行前后两次扫描,最终得到近似的距离。图像基于上述原理,实践中用倒角算法进行距离变换,简单快速,其计算出的距离合理逼近于真实的欧氏几何距离。

分水岭算法[10]最早是由Vincent L 和Soille P提出来的。分水岭算法是模拟一个水面浸没地形的过程。在分水岭算法中,图像中每一点像素的灰度值表示该点的海拔高度,每一个局部极小值及其影响区域称为集水盆,而集水盆的边界则形成分水岭。最后得到的分水岭边界将原图像粘连细胞切割开。

1.2 基于细胞面积估计的细胞计数

在完成以上的图像预处理后,即可进行细胞计数。通常基于隔离标记计数法的细胞计数是对二值化后的图像各个分离区域进行标记并累加计数,从而得到图片中细胞的数目。这种方法的一个基本假定是一个隔离区域代表一个细胞,但在高度粘连(部分区域粘连呈块状)的细胞图像中,经过预分割后仍然会出现多个细胞粘连的单个分离区域,隔离标记计数法对于这种情况的计数仍然为1,并没有反映真实情况。

文中假定经过预分割的细胞图像中还存在重叠细胞,且重叠细胞是少数。在此前提下,将图片中分离的细胞区域的面积作为一个随机变量,通过核平滑对其进行概率密度估计,得到它的概率密度函数曲线。假设重叠细胞较少,该曲线的极大值对应的细胞区域面积即为单个细胞面积最可能的值,即前述随机变量的众数。用图像中细胞区域的总面积除以前面得到的单个细胞面积最可能的值,即可算出图像中的细胞总数。

之所以使用众数而不是均值作为细胞面积最可能的值,是因为藻液中的细胞生长速度不一定一样,有各个生长阶段的细胞导致细胞大小参差不齐。

特别地,细胞面积估计中用到的基于核平滑的概率密度估计[11]是概率论中用以估计随机变量的概率函数密度的方法之一。它采用平滑的峰值函数(“核”)[12]拟合观察到的数据点,从而对真实的概率分布曲线进行模拟。在一定程度上其性质比直方图更好,可以替代直方图精确展示数据总体的概率分布。

2 实验设计

2.1 细胞图像来源

文中实验采用的细胞图像均来自业界权威的细胞计数标准样本图像网站(www.broad.mit.edu/bbbc)。

2.2 图像预处理

首先读取RGB 格式的原始图片,将彩色图像通过加权平均法转化为灰度图像,再采用OTSU 方法将图像二值化,然后采用形态学闭运算填充细胞内空隙。该方法处理以后的细胞图像,能平滑细胞区域边界并可以最大程度地保持细胞区域面积不变,图像信息完整。

2.3 距离变换分水岭分割

将得到的二值化细胞图像进行欧氏距离变换并采用分水岭算法进行初步预分割,将粘连程度不大的细胞区域分割开,便于后续操作。

该算法原理是:首先利用距离变换将细胞像素点不同的位置信息转化为不同的灰度信息,再利用分水岭算法区分不同性质的像素点,然后将边界点标出,边界即可将细胞群分开为单个的细胞。

2.4 “面积法”细胞计数

使用高斯核作为概率密度估计[13-14]的平滑核函数,并限定概率密度函数的取值范围为非负实数集,对分离的细胞区域面积进行概率密度估计,得到单个细胞面积最可能的值。最后,图像中细胞区域的总面积除以单个细胞面积最可能的值,得到图像中的细胞总数。

3 实验结果分析

图1 为预分割粘连细胞区域图像。其中,图1(a)与图2(b)是两张实验用的细胞图像经过图像预处理后的一部分,对它们进行距离变换以及分水岭算法分割后得到图1(c)和图1(d)的效果。

由图1 可以看出,经过预分割后的细胞图像,粘连程度低的细胞区域被分割开。预分割后的细胞图像中,单个细胞的数量占大多数。再对预分割后的图像中细胞区域面积进行高斯核密度估计,具体结果如图2 所示。其中,* 所对应X 轴的值就是估计出的细胞平均面积S。

最后,用整个细胞图中的细胞区域的总面积Sum除以各自的单个细胞面积最可能的值S,得到图像中细胞的总数。经过计算统计得到最终结果(见表1)。本实验选取轻度粘连和高度粘连两种程度的图像,每种粘连程度取10 张样本图像,计数结果是10 个样本的平均值,并进行了四舍五入的处理。所有的样本图像均含有300 个细胞。显微图像放大倍数为1 000 倍。

图1 预分割粘连细胞区域图像Fig.1 Area image the pre-segmentation adhesion cell

图2 核密度估计的细胞平均面积Fig.2 Cell average area of the kernel density estimation

表1 实验结果Tab.1 Experimental results

由表1 可以看出,不连通区域标记法虽然能较好地处理含细胞较少或粘连度较小的图片,但是对含细胞较多特别是粘连程度较大的图片进行计数所得出的细胞数结论误差较大。而“面积法”在这两种不利情况下得出的结论都有较高的准确度,不仅能对细胞数较少粘连程度低的图片准确计数,还能对粘连程度大的细胞图片进行精确的细胞计数。

4 结 语

文中使用图像处理技术对蓝藻细胞的显微镜图像进行细胞计数。提出的“面积法”克服了不连通区域标记法对分割后的细胞图像进行细胞计数不能有效处理细胞数较多或细胞粘连程度较大情况,有效地解决了复杂情况下的细胞计数问题。实验结果显示,“面积法”对于细胞高粘度图像的计数优势明显,计数精度达97%,而普通不连通区域计数法的计数精度只有72%,表明“面积法”的计数准确度与稳定性远高于隔离标记计数法。此外,由于概率方法的引入,“面积法”本质上对图像中的不确定因素不敏感,故对图像的质量及图像预处理的要求较低。

[1]袁方,李鑫,余君萍,等.分光光度法测定叶绿素含量及其比值问题的探讨[J].植物生理学通讯,2009,45(1):63-66.

YUAN Fang,LI Xin,YU Junping,et al.Methodological study on determination of chlorophyll contents and ratio of Chl a/Chl b by spectrophotometry[J].Plant Physiology Communications,2009,45(1):63-66.(in Chinese)

[2]刘青君,胡宁,叶伟伟,等.细胞计数分析传感器芯片的研究[J].传感技术学报,2010,123(6):753-756.

LIU Qingjun,HU Ning,YE Weiwei,et al. Sensor chip for cell counting and analyzing[J]. Chinese Journal of Sensors and Actuators,2010,123(6):753-756.

[3]Phukpattaranont P,Boonyaphiphat P.An automatic cell counting method for a microscopic tissue image from breast cancer[J].IFMBE Proceedings,2007,15:241-244.

[4]郭晓敏.基于显微图像的颗粒计数方法研究[D].杭州:浙江大学,2014.

[5]蒋洁,樊德宁,陈旺,等.血液显微图像中红细胞计数系统的研究与实现[J].医学信息,2009(1):8-10.

JIANG Jie,FAN Dening,CHEN Wang,et al.Erythrocyte counting system based on blood micrograph[J]. Medical Information,2009(1):8-10.(in Chinese)

[6]吴辰夏.二值化图像特征及其应用[D].杭州:浙江大学,2013.

[7]赵慧.基于数学形态学的图像边缘检测方法研究[D].大连:大连理工大学,2010.

[8]毛玲,孙即祥,张国敏.基于形态学运算和自适应阈值的心电信号消噪[J].信号处理,2009(1):6-10.

MAO Ling,SUN Jixiang,ZHANG Guomin.ECG signal de-noising based on morphological operations and adaptive threshold[J].Signal Processing,2009(1):6-10.(in Chinese)

[9]倪麟.基于OTSU 理论的图像分割算法的研究[D].重庆:重庆大学,2013.

[10]Vincent L,Soille P.Watersheds in digital spaces:an efficient algorithm based on immersion simulations[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1991,13(6):583-598.

[11]Bowman A W,Azzalini A.Applied Smoothing Techniques for Data Analysis:The Kernel Approach with S-Plus Illustrations:The Kernel Approach with S-Plus Illustrations[M].Bxford:Oxford University Press,1997.

[12]李俊林,符红光.改进的基于核密度估计的数据分类算法[J].控制与决策,2010(4):507-514.

LI Junlin,FU Hongguang.Improved KDE-based data classification algorithm[J].Control and Decision,2010(4):507-514. (in Chinese)

[13]胡闽,刘纯平,崔志明,等.聚类差分图像核密度估计前景目标检测[J].中国图像图形学报,2009,14(10):2127-2130.

HU Min,LIU Chunping,CUI Zhiming,et al.Clustering difference image kernel density estimation for foreground object detection[J].Journal of Image and Graphics,2009,14(10):2127-2130.(in Chinese)

[14]徐东彬,黄磊,刘昌平.自适应核密度估计运动检测方法[J].自动化学报,2009,35(4):379-385.

XU Dongbin,HUANG Lei,LIU Changping.Adaptive kernel density estimation for motion detection[J].Acta Automatica Sinica,2009,35(4):379-385.(in Chinese)

猜你喜欢
像素点灰度预处理
采用改进导重法的拓扑结构灰度单元过滤技术
基于灰度拉伸的图像水位识别方法研究
基于局部相似性的特征匹配筛选算法
基于5×5邻域像素点相关性的划痕修复算法
基于canvas的前端数据加密
基于预处理MUSIC算法的分布式阵列DOA估计
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割
基于灰度线性建模的亚像素图像抖动量计算
浅谈PLC在预处理生产线自动化改造中的应用