刘晨星,张海英,杨 浩
(1.中国科学院微电子研究所 健康电子研发中心, 北京 100029;2.中国科学院微电子研究所 新一代通信射频芯片技术北京市重点实验室,北京 100029;3.中国科学院大学 微电子学院,北京 100029)
基于Perona-Malik方法的GVF Snake模型在舌像分割中的应用
刘晨星1,2,3,张海英1,2,杨 浩1,2
(1.中国科学院微电子研究所 健康电子研发中心, 北京 100029;2.中国科学院微电子研究所 新一代通信射频芯片技术北京市重点实验室,北京 100029;3.中国科学院大学 微电子学院,北京 100029)
采用Snake模型进行舌像分割虽然能够快速地得到舌体轮廓信息,但是Snake模型对于噪声和外部图像能量十分敏感,特别是舌头颜色与嘴唇以及面部颜色相近,分割时容易丢失重要信息。为了能够有效地将这些信息分离得到准确的舌体轮廓,提出了一种改进的Snake模型。该模型首先引入Perona-Malik方法来处理原始图像的边缘信息,强化模糊轮廓界线,再计算得到舌体区域的梯度能量场,以此作为Snake模型的外部能量部分,得到最终的Snake轮廓曲线。实验表明,使用改进的模型可以得到包含更多边缘信息的舌体图像,特别是颜色相近或者轮廓线不规则的舌体图像效果更加明显。
Snake;Perona-Malik;GVF;舌诊;图像分割
在传统中医“四诊”中,望诊为首,而在望诊中又以舌诊为主要辨证手段之一。但是舌诊主要依靠医生长期的经验作为判断依据,具有很强的主观性,不利于客观且标准化的掌握。因此,中医舌诊客观化成为了近年来对中医现代化的研究重点之一。
舌诊客观化研究中的一个非常重要的环节就是利用计算机对采集的舌图像进行图像分析。在这些基于图像处理技术的舌象分析系统[1]中, 目前图像分割常用方法有阈值分割、区域增长、区域分裂、空间聚类、动态轮廓法等[2-4]。但各自都存在着优点和缺点,并没有一种完善的方法。
由Kass[5]提出的动态轮廓模型又叫Snake模型,该模型也被用于舌图像轮廓提取和分割中。Snake模型[6-8]定义了一条能量曲线,该曲线是针对特征目标的初始轮廓曲线。Snake模型通过不断迭代,在初始轮廓曲线的内部能量和外部能量的共同作用下,将初始轮廓曲线逼近目标轮廓曲线。然而,传统的Snake模型存在着很多的缺点,比如无法逼近极凹的轮廓内部,能量曲线容易得到局部极值解等。针对传统Snake模型存在的这些缺点,提出以下改进的方法。引入Xu等提出的梯度向量流(Gradient Vector Flow, GVF)模型[6,8],该模型对图像的外力场进行了优化,通过新的外力场与原图像内力的平衡来得到最终的目标轮廓曲线。然而,原始Snake模型是线性尺度空间,该空间有一个缺陷:图像的扩散过程是各向同性的,也就是说任意的像素点在任意方向的扩散速度都相同,结果就是图像边缘变得模糊,边界信息不完整。因此,引入Perona[9]等提出的各向异性方程对GVF模型中的热扩散方程进行了改进,使得图像在各个方向上的扩散速度各不相同。
根据上述分析,本文针对舌诊中对于舌图像轮廓的提取提出了一种基于Perona-Malik方法和改进的Snake 模型相结合的图像分割算法。此算法不仅较好地解决了传统Snake模型的缺点,而且改进了舌图像边缘模糊的问题,从而提高了舌图像分割的精度。
1.1 Snake模型
Snake模型是一种参数化的动态能量极小化曲线。Snake模型的能量框架包括内能、约束能和图像能,根据先验知识用能量函数将图像数据通过能量场的形式进行处理。Snake模型的思想是:通过求图像中的能量泛函的极小值,从而获得有效的特征目标轮廓信息,以进一步进行处理。
由Kass提出的Snake模型如下式所示:
其中,Esnake表示总能量,Eint表示内能,Eext表示外部图像能,Econ表示约束条件。内能表示轮廓的拉伸和弯曲程度;外部图像能表示目标轮廓与图像梯度的拟合程度;约束条件是根据实际需要进行的预处理,目的是突出目标特征。
内能Eint表示为:
由上式可知,曲线的一阶导数和二阶导数的和越小,曲线内能越小。其中α(s)、β(s)分别为Snake模型的弹性系数和刚度系数。
外部图像能Eext控制Snake模型曲线逼近真实的目标轮廓。外部能量通常表示为:
其中,I(x(s),y(s))表示原始图像。
综上所述,总能量Esnake可表示为:
其中,
设V={v1,v2, …,vN}是Snake初始轮廓上的N个点,则Snake模型的离散形式的总能量表达式为:
其中,
Eext(vi)=γ(vi)Eimage(vi)
传统的Snake模型对于初始轮廓比较敏感,并且对凹陷程度较大的边缘轮廓的逼近效果不理想。因此,考虑引入GVF进行进一步的优化。
1.2 GVF算法
基于GVF的Snake模型通过对外场力的优化来逼近目标轮廓,也就是通过极小化外力场的能量泛函来达到优化目的[7-8],外力场能量泛函定义如下:
其中,(x,y)为像素的坐标,μ为加权系数,ux,uy,vx,vy是u、v分别对x、y的一阶偏导;f是边缘函数。
应用变分法得到欧拉方程,如下所示:
通过将u、v看作时间的函数可以得到:
基于GVF的Snake模型的外力场的作用范围远大于传统Snake力场,在逼近目标轮廓时具有更大的搜索范围。并且基于GVF的Snake模型解决了原始Snake模型对活动轮廓初始位置敏感的问题,能够很好地逼近极凹目标轮廓,有效地减弱了原始轮廓位置的影响。
Perona-Malik模型的思想就是在非特征目标轮廓的区域内进行平滑,减少干扰;而在特征目标轮廓的区域或区域之间即特征目标边缘或边界处减少多余的平滑或不做平滑。Perona-Malik模型的各向异性偏微分方程如下:
u(x,y,0)=f(x,y)
式中,f(x,y)是原始图像函数,c(s)是图像扩散系数,满足以下条件:
Perona和Malik[10]给出的扩散率函数为:
c(s)=e-(s/k)2或c(s)=1/(1+(s/k)2)
其中,k是噪音估计因子。
Perona-Malik模型在图像边界和非边界区域的扩散速度是不一样的,是各向异性的扩散方程。图像边缘处对应的s比较大,c(s)较小,则扩散速度慢,从而保留了图像边界信息;在图像变化慢的区域则相反,s较小,c(s)较大,扩散速度较快。这样一来,边缘区域对应的梯度较高,则在该区域减少平滑或者不进行平滑处理。在模糊图像的同时还有效地保留了图像的边缘信息。本文采用4邻域离散形式的各向异性扩散方程,如下式:
式中ηs代表中心像素s的四邻域。us,p代表中心像素的四邻域图像函数。
引入各向异性扩散方程用于舌图像的预处理,既能模糊图像,还能有效地保留图像的边界信息。基本思想是:对与特征目标轮廓边缘的方向相平行的区域进行较强的平滑,而沿图像边缘的法线方向的平滑效果则比较弱。但是,在用Perona-Malik模型预处理舌图像的过程中,可能会出现“块效应”[10]。因此应当适当地选择迭代次数,避免在边缘处的“块效应”扩散,“腐蚀”了无效的舌面或者人脸信息,导致轮廓曲线变得扭曲。
为了验证方法的有效性,在MATLAB R2016b开发平台中实现了本文描述的处理算法,并对采集的舌像进行了轮廓提取,如图1所示。
图1(a)为原图像,(b)为Snake模型得到的轮廓曲线,可以看出,Snake模型对于有齿痕的舌轮廓的逼近仍有一定缺陷,虽然整体轮廓比较贴合,但是对于因齿痕导致的不规则舌体轮廓还是做了“平滑”处理,比如舌体左侧以及舌尖处的轮廓都被“平滑”处理了。图(c)为加入了GVF后的Snake模型,通过对比图(b)与图(c)可以看出,GVF的优化使得舌尖处的变化得到了准确捕捉,并且舌根部的轮廓更加深入。图(d)则是经过PM方法处理后的Snake模型曲线,可以看出,不仅舌尖处能够准确包络,并且舌体两侧的齿痕也能准确贴合,得到的轮廓凹凸明显。图(e)是经过PM方法处理后的图像的边缘能量图,白点代表区域能量极值点,也即舌体边缘与面部及嘴唇之间的区别很明显,有利于Snake模型对于舌体轮廓的捕捉。图(f)是经过PM方法处理后的梯度力场分布,可以看出,经过PM方法处理后在边缘处附近的力场分布更加两极化,突出了轮廓的特征信息。图(g)是梯度分布图,明显可以看出,图中梯度极值处准确对应舌体的边缘。
图1 Perona-Malik方法应用结果对比
本文对舌像轮廓提取的方法进行了研究,提出了结合Perona-Malik方法的GVF Snake模型。该模型以Perona-Malik方法处理舌体图像,通过优化热传导方程的方式来优化外部图像能,由此优化GVF的力场,从而优化了Snake模型对于不规则的舌体轮廓的逼近。
因为在算法的实现过程中需要不断地迭代计算,因此算法在时间上还存在不足之处。另外,阈值还需要手动选取,这是因为不同舌像之间的差别较大导致的。
[1] 王爱民.用于舌诊客观化的图像分析技术的研究[D].北京:北京工业大学,2001.
[2] 汪强,邹北骥,朱建凯.高可信度图像修复方法[J].计算机应用, 2010,30(5): 1331-1332,1401.
[3] 周越,沈利,杨杰.基于图像处理的中医舌象特征分析方法[J].红外与激光工程,2002,31(6):490-494.
[4] 孙场,罗瑜,周昌乐,等.一种基于分裂—合并方法的中医舌象区域分割算法及实现[J].中国图象图形学报,2003,8(12):1395-1399.
[5] KASS M, WITKIN A, TERZOPOULOS D. Snakes: active contour models [J]. International Journal of Computer Vision, 1988, 1(4):321-331.
[6] TSECHPENAKIS G,RAPANTZIKOS K,TSAPATSOULIS N, et al. A snake model for object tracking in natural sequences[J]. Signal Processing Image Communication, 2004, 19(3):219-238.
[7] Cheng Jinyong, Xue Ruojuan, Lu Wenpeng. Segmentation of medical images with Canny operator and GVF snake model[C]. World Congress on Intelligent Control & Automation, 2008,13(9):1777-1780.
[8] 邱书波, 王化祥, 梁志伟. 一种新的B-Snake 算法在目标轮廓跟踪中的应用[J] . 中国图象图形学报, 2005, 10(5):585-589.
[9] ATLAS A, KARAMI F, MESKINE D. The Perona-Malik inequality and application to image denoising[J] . Nonlinear Analysis: Real World Applications, 2014, 18(1):57-68.
[10] DUCHEMIN L, EGGERS J. The Explicit-Implicit-Null method: Removing the numerical instability of PDEs[J]. Journal of Computational Physics, 2014 , 263(4):37-52.
Application of GVF Snake model based on Perona-Malik algorithmin segmentation of tongue image
Liu Chenxing1,2,3, Zhang Haiying1,2, Yang Hao1,2
(1. R&D Center of Healthcare Electronics, Institute of Microelectronics of Chinese Academy of Sciences, Beijing 100029, China; 2. Beijing Key Laboratory of Radio Frequency IC Technology for Next Generation Communications, Institute of Microelectronics of Chinese Academy of Sciences, Beijing 100029, China; 3. School of Microelectronics, University of Chinese Academy of Sciences, Beijing 100029, China)
Using the Snake model on tongue image segmentation can get tongue contour information quickly, but the Snake model is very sensitive to image noise and the external force, especially the color of tongue and lips is similar, also the face, and it’s easy to lose important information of tongue during the segmentation. In order to effectively separate these information and obtain the tongue contours accurately, an improved Snake model is proposed. This model firstly uses the Perona-Malik method to deal with the edge information of original image, highlights the fuzzy boundary contour, and then calculates the gradient vector field of tongue area, as the part of the external force of the Snake model, and obtains the Snake contours eventually. The experimental results show that the improved model can be used to obtain the tongue images with more edge information, especially better at the tongue images with similar color or irregular contours.
Snake; Perona-Malik; GVF; tongue diagnosis; image segmentation
TP751
A
10.19358/j.issn.1674- 7720.2017.15.027
刘晨星,张海英,杨浩.基于Perona-Malik方法的GVF Snake模型在舌像分割中的应用[J].微型机与应用,2017,36(15):94-96,102.
2017-03-15)
刘晨星 (1990-),男,硕士,主要研究方向:计算机科学与技术。
张海英(1964-),女,研究员,博士生导师,主要研究方向:微电子和现代通信技术在医疗健康领域的应用研发。
杨浩(1978-),男,副研究员,硕士生导师,主要研究方向:新型健康电子设备。