汪传忠, 陈 超, 武海燕
(南昌航空大学 信息工程学院, 江西 南昌 330063)
粗糙集属性函数建模
汪传忠, 陈 超, 武海燕
(南昌航空大学 信息工程学院, 江西 南昌 330063)
本文针对宫颈微生物感染细胞的检测问题, 从视觉感知的角度分析宫颈微生物感染细胞的颜色、 强度和面积3个方面的视觉特性, 并根据这些特征参数结合粗糙集理论建立宫颈微生物感染细胞的属性集合模型.
粗糙集; 视觉感知; 函数建模
宫颈细胞学的筛查方法主要是收集宫颈口的脱落细胞, 然后通过观察脱落细胞的颜色、 纹理、 轮廓等特征, 依据宫颈细胞病理学知识作出诊断[1]. 根据宫颈细胞是否有病原体感染, 可以将宫颈细胞分为正常宫颈细胞、 微生物感染细胞.
1.1 正常鳞状上皮细胞
鳞状上皮细胞是子宫颈成熟上皮细胞, 鳞状上皮细胞的形态特征是细胞界限清晰, 细胞核居中及细胞质深染. 根据细胞的成熟度, 将鳞状上皮细胞由基底层至表层分为4种: 基底层细胞、 旁(副)基底层细胞、 中间层细胞及表层上皮细胞[2]. 从基底层到表层, 细胞核由大到小, 至固缩; 细胞核质比由大到小[3]; 细胞质颜色由深染蓝色至淡红色.
基底细胞是未分化的小细胞, 如图 1 所示.
基底细胞是未分化、 体积最小、 细胞核占比最大的细胞. 基底细胞的细胞形态呈圆形或者卵圆形, 细胞核圆形位于细胞中心.
旁(副)基底细胞是分化后的细胞, 如图 2 所示.
图 1 未分化的基底层细胞Fig.1 Undifferentiated basal layer cells
图 2 分化后的旁(副)基底层细胞Fig.2 Parabasal layer cells after differentiation
旁(副)基底细胞中等大, 形态为圆形或卵圆形, 胞质比较厚, 边界光滑, 细胞核居中, 细胞核染色质呈细颗粒状, 在细胞核上分布均匀, 细胞质呈蓝色染色较深.
中间层细胞是细胞未完全成熟的细胞形态, 如图 3 所示.
中间层细胞的形态表现为多样性, 呈多边形、 卵圆形等, 细胞核呈圆形居中. 中间层细胞的细胞质呈透明状, 胞浆丰富, 单薄, 染色后胞质颜色为浅蓝色.
表皮上层细胞是最成熟的鳞状上皮细胞, 如图 4 所示.
图 3 中间层细胞Fig.3 Intermediate layer cells
图 4 表皮上层细胞Fig.4 Epidermal layer cells
表皮上层细胞大而扁平, 细胞形态呈多边形或三角形, 染色质较疏松, 只是表层上皮细胞核呈固缩状, 细胞质染色与中间层细胞质染色不同, 呈粉红色.
1.2 宫颈微生物感染细胞
临床上宫颈细胞微生物感染是最常见的妇科疾病, 其中最常见的的感染有细菌、 真菌、 寄生虫和病毒等. 本文主要研究微生物感染中的细菌和真菌两种感染[2].
放线菌感染是最常见的细菌感染, 如图 5 所示.
图 5 放线菌感染Fig.5 Actinomycetes infection
图 6 念珠菌属Fig.6 Candida species
放线菌的细胞形态为菌丝样的病原体聚集成团, 放线菌呈现一团团嗜碱性的蓝色大小不一的球状物, 如同“棉花团”样; 典型的放线菌感染病例可见菌丝呈放射状排列, 团状菌丝的边缘可见细长菌丝, 也会见到单支的菌丝, 其中较粗的菌丝向外周延伸成“杵”状, 周围常见有许多白细胞相随. 放线菌一般不依附鳞状上皮细胞而存在[4].
念珠菌属是最常见的真菌感染, 如图 6 所示.
念珠菌属感染的细胞有分枝状的菌丝(假菌丝), 实际上是拉长的孢子, 分支与分支之间多呈锐角, 菌丝分节处常多见孢子, 形态小并成圆形或者卵圆形(大小不一的芽状物), 嗜伊红红色. 鳞状上皮细胞胞质褶皱明显. 菌丝表面有一种黏附蛋白, 长长的菌丝将鳞状上皮细胞黏附成团或成串[2].
对比正常宫颈细胞标本图像和真菌、 细菌感染的标本图像, 从视觉感知特征方面可以看出, 正常宫颈细胞与微生物感染细胞有如下3点差别:
1) 微生物感染细胞的颜色与背景的差异较大, 而正常宫颈细胞的颜色与背景的差异较小, 因此可以从颜色方面区分微生物感染细胞和正常宫颈细胞;
2) 正常宫颈细胞要比微生物感染后的细胞偏亮, 在视觉感知上微生物感染细胞的灰度值要小很多;
3) 正常宫颈细胞与微生物感染细胞相比, 在视觉感知上微生物感染细胞的面积要大很多.
通过上面对正常宫颈细胞与微生物感染细胞在视觉感知方面的分析, 以及正常宫颈细胞和微生物感染细胞的3个视觉差异, 我们选取微生物感染细胞特征的3个属性值.
属性值1: 颜色距离, 即宫颈细胞颜色与宫颈细胞标本背景颜色的视觉差异, 颜色距离的度量采用欧氏距离度量方式;
属性值2: 强度, 即在同一光照条件下, 宫颈细胞区域的灰度值与宫颈细胞标本背景区域灰度值的差;
属性值3: 面积, 即宫颈细胞区域的大小, 在数字图像中表现为细胞区域所占像素点的总和.
定义了微生物感染细胞的3个属性值, 我们需要对微生物感染细胞的3个属性的一致性进行分析. 以下分别从微生物感染细胞的颜色、 强度和面积3个属性特征分析微生物感染细胞的特征一致性, 并通过实验方法验证.
在计算机中, 数字图像一般采用RGB色彩空间模型来表示图像的颜色, 但是由于RGB色彩空间模型的R, G, B 3个分量之间有相互关联性[5], 不易采用RGB色彩空间模型度量数字图像的颜色参量之间的差异, 因此需要选取新的颜色空间度量数字图像中颜色参量之间的差异. 本文采用Lab颜色空间模型来度量微生物感染细胞的颜色距离.
2.1 微生物感染细胞颜色分析
分析宫颈微生物感染细胞的颜色特征一致性, 需要对大量的宫颈微生物感染细胞和正常鳞状上皮细胞的颜色视觉特征进行分析. 图 7 是宫颈微生物感染细胞部分图.
图 7 宫颈微生物感染细胞部分图Fig.7 Pictures of the cervical microbial infected cells
通过大量观察宫颈微生物感染细胞, 可以知道, 宫颈微生物感染细胞是液基宫颈细胞标本中染色较深的一类细胞, 颜色呈现为深蓝色. 由于宫颈微生物感染细胞的特性它们之间的颜色无差异或差异较小, 因此从视觉感知的角度可以认为宫颈微生物感染细胞的颜色具有一致性.
2.2 基于Lab空间的颜色距离度量
欧几里得度量(euclidean metric)(也称为欧氏距离), 是一个通常采用的距离定义, 指在m维空间中两点之间的真实距离, 或者向量的自然长度(即该点到原点的距离)[6]. 欧氏距离与m维空间中两点的位置无关.
在三维立体空间中,A和B表示立体空间中的两个点, 则欧氏距离的计算公式为
(1)
式中:D0是三维立体空间中A和B两点的距离; (xi,yi,zi)和(xj,yj,zj)是三维立体空间中A和B两点的坐标.
在Lab色彩空间, 两种颜色之间的数值差异反映了人们在视觉上感受到的颜色差异, 利用颜色距离能够区分一幅彩色图像中两种颜色之间的差异[7].
假设R是一幅RGB彩色图像, 包含有M×N个像素点数, 在Lab彩色图像中,X和Y是Lab彩色图像R上的两个点, 则两点之间的距离可以表示为
(2)
式中:Li,ai,bi和Lj,aj,bj分别是点X和Y在Lab空间中的坐标.
根据式(2), 可以得出图像上任一两点之间的颜色距离, 即两个颜色的差异.
2.3 基于Lab空间的颜色特征一致性验证
2.3.1 实验目的
根据定义的微生物感染细胞颜色属性特征及颜色距离的计算公式, 本节根据微生物感染细胞样本提取微生物感染细胞的颜色距离参数验证微生物感染细胞的颜色特征一致性.
2.3.2 实验方法
本文实验标本来源于北京协和医院洛奇临床检验所, 选取含有微生物感染标本, 并从中获得微生物感染细胞图像500幅. 本节采用数据统计、 分析的方法验证宫颈微生物感染细胞的颜色距离与视觉感知的一致性. 首先, 在Lab色彩空间分别提取宫颈微生物感染细胞和标本背景的L,a,b分量, 然后根据颜色距离度量方法获取宫颈微生物感染细胞与标本背景的颜色距离, 最后通过直方图分析宫颈微生物感染细胞颜色距离参数, 并用一致性检验方法验证宫颈微生物感染细胞颜色特征的视觉一致性.
2.3.3 实验结果与分析
对随机选取的500幅宫颈微生物感染细胞图像的颜色进行距离度量, 并获取颜色距离参数. 颜色距离数据如表 1 所示.
表 1 微生物感染细胞颜色距离数据统计
由宫颈微生物感染细胞的颜色距离参数, 可以得到宫颈微生物感染细胞的颜色距离直方图如图 8 所示, 其中, 横轴是颜色距离, 纵轴是概率分布.
图 8 微生物感染细胞颜色距离直方图Fig.8 Colordistance histogram of microbial infected cells
通过对表中实验数据分析可以得出, 微生物感染细胞的颜色距离分布比较集中. 颜色距离的数据范围主要集中在115~150之内, 只有少数的微生物感染细胞图像的颜色距离的数值在这个范围之外. 由此可以得知宫颈微生物感染细胞的颜色特性具有一致性.
3.1 微生物感染细胞强度分析
大量观察微生物感染细胞并分析其强度视觉特征. 部分微生物感染细胞及其对应的强度图如图 9 所示.
图 9 宫颈微生物感染细胞图像Fig.9 Cell images of cervical microbial infected
通过大量观察微生物感染细胞, 我们可以知道, 微生物感染细胞是液基宫颈细胞标本中染色较深的一类细胞, 在灰度图像中微生物感染细胞的灰度图差异较小. 因此从视觉感知的角度可以认为微生物感染细胞的强度具有一致性.
3.2 细胞光密度
在宫颈细胞图像中, 有细胞同样也有背景, 从视觉感知的角度来说, 细胞图像区域要比背景区域的亮度偏暗. 图像中明亮程度的度量可以使用光密度. 光密度(optical density)又称吸光度, 是细胞中不同成分对同一波长的单色光吸收的量度, 表示不同成分透光的强弱.
光密度的计算公式是:OD=-logT, 平均透射率T=出射光强/入射光强. 平均透射率反映物体的透光性, 透射率大则意味着透光多(即吸光少), 光密度小[8]; 透射率小则意味着透光少(即吸光多), 光密度大. 大多数文献在计算光密度特征参数时, 直接将目标区域的灰度值代入计算. 由于图像的灰度值与光密度是成反比的关系, 因此范金坪在宫颈细胞图像分割和识别方法研究的论文中根据光密度的定义, 提出了一个光密度换算[9]公式:
(3)
式中, 入射光强用灰度图像中灰度值的最大值255表示, 出射光强用灰度图像目标区域中各个点的灰度值I(x,y)表示. 这个换算公式能够充分体现细胞图像中光密度特征的意义.
3.3 基于灰度图像的强度特征一致性验证
3.3.1 实验目的
根据定义的微生物感染细胞强度属性特征及强度的计算公式, 本节根据微生物感染细胞样本提取微生物感染细胞的强度特征参数并验证微生物感染细胞图像的强度特征一致性.
3.3.2 实验方法
本文实验标本来源于北京协和医院洛奇临床检验所, 选取含有微生物感染标本, 并从中获得微生物感染细胞图像500幅. 本节采用数据统计与分析的方法, 验证宫颈微生物感染细胞强度特征与视觉感知一致性. 首先在灰度图像中提取微生物感染细胞的强度特征参数, 然后利用直方图统计强度特征参数分布, 通过直观的数据验证微生物感染细胞强度特征的一致性.
3.3.3 实验结果与分析
对随机选取的500幅微生物感染细胞图像的强度参数进行提取, 通过直方图分析微生物感染细胞的强度特性, 强度特征统计如表 2 所示.
表 2 微生物感染细胞强度数据统计
由宫颈微生物感染细胞的强度特征参数, 可以得到宫颈微生物感染细胞的强度直方图如图 10 所示, 其中, 横轴是细胞强度, 纵轴是概率分布.
图 10 微生物感染细胞强度直方图Fig.10 Intensity histogram of microbial infected cells
通过对表2中实验数据分析可以得出, 微生物感染细胞的强度数据比较集中, 由于微生物感染细胞染色比较深, 所以其强度参数相对比较小. 强度的数据范围主要集中在0.1~0.38之内. 由此可以得出微生物感染细胞的强度特征具有一致性.
4.1 微生物感染细胞面积分析
通过大量观察宫颈微生物感染细胞并对面积特征进行分析. 部分宫颈微生物感染细胞及对应灰度图和二值图如图 11 所示.
图 11 微生物感染细胞原始图、 灰度图和二值图Fig.11 Original picture, the gray-scale map and the binary image of the microbial infected cells
通过大量观察宫颈微生物感染细胞我们可以知道, 虽然宫颈微生物感染细胞中细菌感染和真菌感染后的细胞大小不一致, 但是细菌感染后宫颈细胞大小接近. 因此从视觉感知的角度可以认为宫颈微生物中细菌感染后细胞的面积特征具有一致性.
4.2 面积特征
形态特征是物体最重要的特征之一. 物体形态特征具有变换、 缩尺、 平移不变性的特性. 物体形态特征包括: 大小、 形状、 圆形度等特征, 其中大小可以直观地表示物体的特征.
面积特征代表物体的大小, 在数字图像中, 面积反映了目标区域所占像素点的多少. 在二值化图像中, 区域面积的计算有两种方式: 一种是根据二值化图像中白色区域的边界近似拟合一条闭合曲线, 然后计算闭合曲线包含区域的大小; 另一种是采用图像目标区域所占像素点的个数总数. 本文采用第二种面积计算方法, 面积计算公式
(4)
式中:P表示图像区域中任意点的像素点; (i,j)表示像素点P对应的坐标;M和N表示图像的长和宽.
4.3 微生物感染细胞面积特征一致性验证
4.3.1 实验目的
根据定义的微生物感染细胞面积属性特征及面积的计算公式, 本节根据微生物感染细胞样本提取微生物感染细胞的面积特征参数并验证微生物感染细胞图像的面积特征一致性.
4.3.2 实验方法
实验标本来源于北京协和医院洛奇临床检验所, 选取含有微生物感染标本, 并从中获得微生物感染细胞图像500幅, 采用数据统计和分析的方法, 用实验验证宫颈微生物感染细胞的面积特征一致性. 微生物感染细胞图像分割后, 在二值化图像中获取微生物感染细胞的面积特征参数, 并结合直方图统计面积特征参数的分布范围, 最后用直观的数据验证其面积特征一致性.
4.3.3 实验结果与分析
根据分割后微生物感染细胞的二值图像, 利用区域面积计算公式可以直接得到微生物感染细胞区域的面积. 宫颈微生物感染细胞的面积参数如表 3 所示.
由宫颈微生物感染细胞的面积特征参数, 可以得到宫颈微生物感染细胞面积的直方图, 如图 12 所示, 其中, 横轴是细胞面积, 纵轴是概率分布.
表 3 微生物感染细胞面积数据统计
图 12 微生物感染细胞面积直方图Fig.12 Cell area histogram of microbial infection
通过对表3中实验数据分析可以得出, 宫颈微生物感染中细菌感染后的细胞面积参数主要集中在980~6 000的范围之内, 有少部分细菌感染后细胞的面积大小在此范围之外. 由此可以得出微生物感染细胞的面积特性在视觉感知上是一致的.
通过人眼视觉感知系统角度, 对宫颈微生物感染细胞的颜色距离、 强度和面积特征进行一致性分析可知: 微生物感染细胞的颜色距离范围集中在 115~150 之内, 强度范围集中在0.1~0.38之内, 面积范围集中在980~6 000范围之内. 因此可以根据微生物感染细胞的颜色特征、 强度特征和面积特征的一致性, 通过集合的方式描述宫颈微生物感染细胞.
图 13 微生物感染细胞特征集合模型Fig.13 Feature set model of microbial infected cells
由微生物感染细胞的颜色、 强度和面积特征一致性及其特征参数范围, 依据数学集合描述的方式, 我们将微生物感染细胞3个属性的上下限分别用字母代替, 用集合方式分别描述微生物感染细胞的3个属性.
根据微生物感染细胞颜色距离、 强度和面积3个属性的集合模型, 可以将微生物感染细胞由集合的形式表示, 微生物细胞的属性集合可表示为
(5)
式中:D表示微生物感染细胞的颜色距离特征参数; (a,b)表示微生物感染细胞的颜色距离参数范围;I表示微生物感染细胞的强度特征参数; (c,d)表示微生物感染细胞的强度参数范围;A表示微生物感染细胞的面积特征参数; (e,f)表示微生物感染细胞的面积参数范围.
微生物感染细胞的属性集合立体图如图 13 所示.
本文从微生物感染细胞图像的视觉感知特性, 分析微生物感染细胞图像在颜色、 强度、 面积三个特征. 并根据分析结果建立宫颈微生物感染细胞属性集合模型, 根据此模型可以实现对宫颈微生物感染细胞的检测.
[1] 徐传运. 宫颈细胞学涂片自动判读方法研究[D]. 重庆: 重庆大学, 2014.
[2] 曹跃华, 杨敏, 陈隆文, 等. 细胞病理学诊断图谱及实验技术[M]. 北京: 北京科学技术出版社, 2009.
[3] 王会. 宫颈癌细胞学早期筛查智能采集方法研究与应用[D]. 南昌: 南昌航空大学, 2014.
[4] 丁顺, 余茂武, 宁佳羽, 等. 液基细胞学检测在宫颈疾病诊断中的应用[J]. 中外医学研究, 2015(11): 68-70. Ding Shun, Yu Maowu, Ning Jiayu, et al. Appliacation of liquid-based cytology test in the diagnosis of cervical disease[J]. Chinese and Foreign Medical Research, 2015(11): 68-70. (in Chinese)
[5] 周虹. YCbCr色彩空间的彩色图像光线补偿方法研究[J]. 柳州职业技术学院学报, 2014(3): 50-53. Zhou Hong. Research on color image light compensation method of YCbCr color space[J]. Journal of Liuzhou Vocational & Technical College, 2014(3): 50-53. (in Chinese)
[6] Bai X M, Shi Q, Yin B C, et al. Color edge detection based on HSV space[J]. Journal of Beijing University of Technology, 2004, 30(4): 500-504.
[7] 张国权, 李战明, 李向伟, 等. HSV空间中彩色图像分割研究[J]. 计算机工程与应用, 2010, 26: 179-181. Zhang Huoquan, Li Zhanming, Wei Xiangwei, et al. Research on color image segmentation in HSV space[J]. Computer Engineering and Application, 2010, 26: 179-181. (in Chinese)
[8] 汪薇, 王诗航. 光密度值测定在实验医学研究中的应用及意义[J]. 解剖科学进展, 2006(3): 286-292. Wang Wei, Wang Shihang. Application and Significance of determination of optical density in the study of experimental medicine[J]. Progress of Anatomical Sciences, 2006(3): 286-292. (in Chinese)
[9] 范金坪. 宫颈细胞图像分割和识别方法研究[D]. 广州: 暨南大学, 2010.
[10] Coleman. Evaluation of automated systems for the analysis of cervical smears[J]. Cytopathology Official Journal of the British Society for Clinical Cytology, 1998, 9(9): 359-68.
[11] 丁海艳, 孙允高, 叶大田. 计算机自动识别宫颈细胞涂片技术[J]. 国际生物医学工程杂志, 2000(2): 85-90. Ding Haiyan, Sun Yungao, Ye Datian. Computer-assisted cervical (Pap) smears screening technology review[J]. International Journal of Biomedical Engineering, 2000(2): 85-90. (in Chinese)
[12] 林小竹, 籍俊伟, 谷莹莹. 图像欧拉数的研究与应用[J]. 石油化工高等学校学报, 2007, 20(2): 88-91. Lin Xiaozhu, Ji Junwei, Gu Yingying. The euler number study of image and its application[J]. Journal of Petrochemical Universities, 2007, 20(2): 88-91. (in Chinese)
Function Modeling of Rough Set Attribution
WANG Chuanzhong, CHEN Chao, WU Haiyan
(School of Information Engineering, Nanchang Hangkong University, Nanchang 330063, China)
Aiming at the detection problem of cervical microbial infected cells, this paper analysed the three aspects, which were color, intensity and area of cervical microbial infected cells from the view of visual perception, and established attributes set model of cervical microbial infected cells according to these feature parameters and rough set theories.
rough set; visual perception; function modeling
1671-7449(2017)03-0206-09
2016-11-29
汪传忠(1969-), 男, 副教授, 博士, 主要从事图像处理与模式识别等研究.
TP391
A
10.3969/j.issn.1671-7449.2017.03.005