基于改进的GLCM甲状腺纹理特征提取与分析

2018-12-04 02:14宋余庆陈香远
计算机工程与应用 2018年23期
关键词:共生纹理梯度

汪 娟,刘 哲,宋余庆,陈香远

1.江苏大学 计算机科学与通信工程学院 医学图像处理实验室,江苏 镇江 212013

2.江苏大学 医学院,江苏 镇江 212013

1 引言

甲状腺疾病是临床上最为常见的内分泌疾病,从病例数据来看,一般女性多于男性。目前我国甲状腺疾病总患病率近20%,约每5人中就有1人患甲状腺疾病,发病率高。影像学检查是甲状腺癌疾病的主要诊断及预后评价方法,包括CT、MRI、超声、核素显像、PET等,其中MRI检查有良好的软组织对比度,能显示CT不能显示的小肿瘤,可确定肿瘤的侵犯范围及有无淋巴结转移。但是诊断主要依赖于检查医师的水平和经验,存在一定的主观性,易造成漏诊和误诊[1]。因此,术前诊断对患者治疗有重要的意义。

纹理分析在图像处理和模式识别领域占有重要地位,反映了图像本身的属性,是图像分析的重点[2-3]。纹理特征在甲状腺图像的病变区域和正常区域中存在较大的差异,可用来区分甲状腺感兴趣区域有无病变。本文旨在研究提取甲状腺MRI感兴趣区域的纹理特征并病变可能性预测。目前该领域多是利用GLCM[4-7]、LBP[8]、Gabor小波变换[9-10]等纹理特征算法。在这些方法中,由Haralick[11]提出的GLCM纹理描述特征,被广泛地应用于医学领域,很多学者用来辅助诊断甲状腺的病变研究。该算法是联合两个位置的像素灰度的概率密度来定义的,反映了影像中具有同样亮度或相近亮度的像素之间的位置分布特性,是有关影像亮度变化的二阶统计特征。但存在计算量大,细节信息丢失等问题。对于几种常见的甲状腺病变图像而言,其纹理大多复杂多变、随机性大,且存在明显的边缘信息。使用传统GLCM来描述纹理特征缺少对图像梯度信息的描述,降低特征的可区分性;传统GLCM方法选取固定窗口尺寸来进行图像的分类,选取的窗口不同也会影响分类的结果。为此,国外很多学者改进的方法层出不穷。Rajković等[12]对乳腺癌图像建立了分形和灰度共生矩阵纹理分析算法的预后能力,首次发现肿瘤组织学的纹理分析的预后价值主要依赖于由共生矩阵特征计算的像素灰度值的空间分布。刘大鹏等[2]提出一种增强的基于GLCM的特征表达方法,实现对TI加权对比度增强MRI(CEMRI)脑肿瘤图像的自动分类,实验证实其方法对脑部肿瘤图像分类的有效性。Torheim等[13]用GLCM特征对宫颈癌的治疗结果进行预测,预测精度达到75%。Nagarajan等人[14]通过提取GLCM、直方图和灰度行程长度矩阵(GLRLM)纹理特征将甲状腺超声图像分为两类。该方法准确率达到89.74%、灵敏度为89.89%,特异度为91.67%,结果表明所提出的方法对分类效果很好。Huang等[15]使用3-D乳腺MRI形态特征评估其区分乳腺良恶性病变的价值。实验基于95例乳腺实性肿块MRI(良性44例,恶性51例)进行肿瘤恶性可能性的分析,提取其GLCM,形态特征和椭圆拟合特征获得88.42%的准确率,88.24%的敏感度和88.6%的特异度。

针对目前GLCM纹理特征提取方法存在的问题,提出GLCM的改进算法来表征甲状腺ROI的纹理特性。该算法充分考虑了图像纹理的梯度信息,是一种基于纹理和灰度互补的特征,对鉴别病理和正常组织效果显著[16]。首先提取同一病例甲状腺MR图像的正常和病变ROIs,对尺寸不同的ROIs进行尺寸归一化和上采样操作;基于HOG特征算子理论检测图像的梯度信息,采取滑动窗口自适应方法提取GLCM纹理特征;为抑制噪声的影响取四个方向(0°,45°,90°,135°)的共生矩阵均值为最终GLCM;最后计算GLCM的纹理特征参数。实验使用Logistic回归模型对ROIs纹理特征进行分析,评估本文方法对甲状腺MR图像的分类精确度。

2 灰度共生矩阵相关定义

灰度共生矩阵是描述图像灰度级空间分布的二阶纹理信息,它为一个行数和列数等于原始图像中的灰度等级数的方阵。假定一幅M×N图像灰度级数量为L,那么图像的GLCM是一个L×L的矩阵,灰度i和 j的一对像素点,其位置方向为θ,距离为d的概率为P(i,j,d,θ),一般 θ有四种情况:0°,45°,90°,135°。像素对I(k,l)=i和I(m,n)=j。在这四个方向上的出现概率如式(1)、(2)、(3)、(4):

其中,#表示在该集合中元素的数目,再对每个灰度共生矩阵所有元素进行归一化处理,使得归一化后的矩阵所有元素和为1,然后计算五个相互独立的二阶统计纹理特征:相关、能量、对比、逆差矩和熵。基于给定的5个GLCM特征参数计算每个特征的均值和标准差作为最终的特征向量。

共生矩阵并不能直接反映图像的纹理特征,本文利用下面常用的五个统计量来描述灰度共生矩阵P的纹理特征[6]:

(1)相关(COR)

相关度量空间灰度共生矩阵元素在行或列方向上的相似程度,反映了图像中局部灰度相关性。当矩阵元素值均匀相等时,COR越大;反之亦然。

(2)能量(ENG)

能量是灰度共生矩阵各元素的平方和,也称角二阶矩(ASM)。它主要反映图像纹理灰度级分布的均匀性和纹理的粗细程度。ENG越大,纹理越均匀且粗壮;反之,则纹理越不规则且细致。

(3)对比(CON)

对比也称惯性矩,反映了图像的清晰度和纹理沟纹的深浅度。其取值范围在0~(L-1)2之间,为图像的灰度等级。CON越大表示纹理沟纹越深,视觉效果越清晰;反之,则沟纹浅,图像视觉较模糊,纹理效果不明显。

(4)逆差矩(HOM)

逆差矩又称局部平稳,是对图像纹理局部变化的度量,反映了纹理的平滑度。图像中纹理越规律越平滑,则HOM值越大。

(5)熵(ENT)(假设 0×ln(0)=0)

熵代表图像所具有的信息量,表示了图像纹理的均匀度或复杂度。ENT越大,表示图像内容越随机,纹理越复杂且密度越不均匀。当ENT为0时,表明图像没有纹理。

3 改进的GLCM窗口自适应算法

目前纹理特征提取方法众多,反映图像灰度模式的空间分布,同时兼顾了图像的宏观信息与微观结构。为解决传统GLCM方法固定窗口和噪声抑制对图像分类的影响问题。在这个阶段,结合梯度信息,采用自适应的滑动窗口大小方法获得GLCM,提取甲状腺ROIs的纹理特性。实验算法流程图如图1所示。

3.1 图像预处理

如图1所示,对甲状腺原图像中提取的甲状腺ROIs不同尺度的图像采用最邻近插值算法调整图像大小,保持所有ROIs尺寸的一致;然后进行上采样操作,对图像进行放大处理,以便增加图像梯度信息;再将每个图像划分为2×2的子图,使得更均匀地提取图像内部梯度信息。

3.2 梯度检测

HOG特征算子其核心思想是统计图像局部目标区域的梯度方向信息作为该局部图像区域表象和形状的表征。通过梯度信息来描述图像中物体的边缘、轮廓、形状等纹理信息。赵顺廷[17]在低场强MRI对甲状腺肿瘤的诊断和鉴别的研究中,主要研究了四种甲状腺疾病,分别是:结节性甲状腺肿、甲状腺囊肿、甲状腺癌和甲状腺瘤。而大部分甲状腺病灶区域内部纹理会有明显的变化且病灶区域边界较清晰。因此可通过HOG特征检测甲状腺ROI区域梯度信息,以便采用滑动窗口自适应进行GLCM纹理特征提取。具体步骤如下:

步骤1对图像进行预处理,采用Gamma校正法对输入的图像进行标准化处理,目的是调节图像的对比度,抑制噪声的干扰。

步骤2将图像划分成连通区域(称为细胞单元);再采集细胞单元中各像素点的梯度的方向值,即通过计算图像横坐标和纵坐标方向的梯度获得每个像素位置的梯度方向值。实验采用模板[−1,0,1]计算图像的梯度以及方向,通过梯度模板计算水平和垂直方向的梯度,设图像中像素点为(x,y),计算其梯度的公式如下:

式中Gx(x,y),Gy(x,y)分别表示输入图像中像素点(x,y)处的水平方向梯度、垂直方向梯度。像素点(x,y)处的幅值G(x,y)和梯度α(x,y)方向公式分别为式(11)和式(12):

图1 甲状腺MR图像病变和正常区域识别流程

步骤3求所有像素点的幅值和梯度方向,通过图像中所有过零像素点进行梯度检测,即G(x,y)的过零点。

3.3 GLCM窗口自适应算法

为了有效地对ROIs进行分类,最重要的是提取区分甲状腺病变和正常ROIs的有效特征集。本文基于传统GLCM由HOG特征启示捕获图像的梯度分布来查找甲状腺病变区域的边缘,进行灰度共生矩阵的改进算法纹理特征提取,如图1所示,本文算法流程分为以下几个部分:

步骤1图像预处理,对提取的正常和病变ROI图像进行尺度归一化、上采样以及灰度级量化,并划分成2×2的连通区域。

步骤2梯度计算,计算所有区域的每个像素位置的梯度(包括大小和方向),即计算所有像素点的幅值和梯度方向,即G(x,y)。

步骤3检测梯度,即求G(x,y)的过零点。当G(x,y)的过零点时,滑动窗口取较小窗口,否则取较大窗口。

步骤4计算图像不同窗口下的GLCM,如若滑动未完成,则继续步骤3。

步骤5为抑制噪声的影响并体现图像灰度的离散程度,取四个方向共生矩阵的均值作为最终的共生矩阵,并提取特征参数相关、能量、惯性矩、逆差矩和熵的均值和方差,构成10维的特征向量T(t1~t10)。

步骤6特征向量归一化,由于各个参数间差异很大,故在对其分析前进行数据归一化处理。

步骤7使用Logistic回归模型分析,评估甲状腺图像的分类准确度。

实验设定滑动窗口大小为w(取值奇数),当检测梯度时,为保留目标图像的细节,w取较小值,否则取较大值。窗口的尺寸大小以及步长对GLCM计算结果影响最大,因而针对不同的图像应通过实验选择合适的值,以获得最好的结果。实验发现设置滑动窗口大小较小的为5×5,较大的为17×17时效果最佳。为了抑制方向分量使得提取的纹理特征与方向无关[18],取四个方向的共生矩阵的均值Pm(i,j,d)作为最终的共生矩阵,计算公式如式(13),然后提取共生矩阵的特征参数。

最后计算五个相互独立的二阶统计纹理特征:相关、能量、对比、熵和惯性矩,基于这5个GLCM特征参数计算每个特征的均值和标准差作为最终的特征向量。

4 结果与分析

4.1 实验数据

本文选取江苏大学附属医院的47例甲状腺MRI病例,其图像格式为DICOM格式,分辨率为512×512。由于图像像素灰度级较大,需要对图像进行灰度级量化。原始图像包含感兴趣区域和大部分非感兴趣区域,需要对其进行ROI提取。具体操作是参照医生所勾画的病变区域,运用ImageJ软件从甲状腺患者MR图像中手动分割出正常和病变区域两组图像各47例,并以DICOM格式存储。图2所示为医生已勾画出病变区域的甲状腺MR图像切片图,图2(b)为(a)中白色轮廓勾画区域,即提取的病变ROI。

4.2 评价指标

Logistic回归模型在医学中主要用来预测某疾病发生的概率。二分类Logistic回归分析在医学研究领域已经得到广泛应用,其中包括对疾病的预测和判别。为了验证提出算法的有效性,实验对94例甲状腺MR图像(47例病变,47例正常)进行纹理特征提取。Logistic回归赋值以金标准诊断结果为依据,以提取的纹理特征参数作为协变量建立Logistic回归模型,获得灵敏度、特异度、准确率,计算漏诊率、误诊率以及ROC曲线下面积AUC。灵敏度(Sensitive,Sen)指实际有病而被正确诊断的百分比,其公式为式(14);漏诊率为诊断没有检出的病例,漏诊率 =1-Sen;特异度(Specificity,Spe)反映了诊断实验排除非病例的能力,其公式为式(15);误诊率为诊断实验没有排除的非病例比例,误诊率=1-Spe;准确率(Accuracy,Acc)反映正确诊断正常和病变的能力,公式如式(16)。

另一个评价指标ROC曲线下面积AUC,计算公式如式(17),其中TPrate=Sen,FPrate=1-Spe。当AUC取值0.5~0.7,表示诊断价值较低;0.7~0.9表示诊断价值中等;0.9以上时表示诊断价值较高。通过以上6个评价指标来判别甲状腺有无病变的性能。据以上规则,采用二分类Logistic回归模型分析和ROC曲线分析本文算法各个参数的显著性即 p值,当 p<0.05时有临床意义。评估本文方法对甲状腺图像分类的准确率,AUC值越大临床意义就越大,特异性和敏感性越高诊断漏诊的概率就越小。

4.3 实验分析

实验分别选取基本GLCM、LOG-GLCM[18]与本文方法进行对比实验与分析,采用二分类Logistic回归模型分析病变可能的预准确率、灵敏度、特异度、漏诊率、误诊率和ROC曲线下面积AUC。本文提出方法涉及三个参数:量化级数L,步长d,以及滑动窗口尺寸w。Clausi等[19]证实不同灰度级的GLCM会对最后的分类结果产生较大的影响。灰度级较大时,图像中纹理信息能够得到更细致的描述,同时也易受到噪声的影响,且计算量会显著变大。步长较小时,能够捕获图像细微的结构,而较大时能够描述粗纹理[14]。滑动窗口的大小对共生矩阵的影响最大,大尺度的窗口会严重损害目标图像的纹理特性,较小窗口尺寸可以保留目标图像的细节[19]。当窗口过大时,窗口内包含的信息越复杂,会影响计算的结果,而窗口过小甚至小于目标尺寸,计算的结果也不可靠。当计算窗口的尺寸由小取到大时,在纹理图像中,其边缘会变得越来越模糊化。因此,本文通过上采样增强图像的边缘信息,再自适应调整滑动窗口的尺寸。在梯度处选择较小滑动窗口,否则选择较大滑动窗口。针对本组实验数据ROI尺寸自适应调整窗口范围在3×3~23×23之间。为了得到灰度级L,步距d和滑动窗口尺度w的最优参数组合,分别选取如表1所示的各参数设置,进行多次实验。通过多组实验验证,针对本组实验数据:边缘处窗口尺寸设定为3×3,非边缘处设定为17×17时,目标内部既没有小窗口那么复杂,边缘信息也保存得较好[20]。灰度级为32,步距为1时,图像梯度信息和纹理细节保持最好。

图3 甲状腺病变(“1”)和正常(“0”)ROIs的特征参数均值散点图

表1 纹理特征提取算法各参数设置

实验分别对病变和正常区域进行灰度共生矩阵的改进算法的纹理特征提取,获得特征向量:ENG、ENT、HOM、CON和COR的均值和方差。表2展示本文算法特征参数ENG、ENT、HOM、CON和COR的均值和方差的P值和AUC值,很明显本文方法提取的参数P值均小于0.000 1具有临床诊断意义。由ROC曲线并对照表2中AUC值可知,能量、熵、对比以及惯性矩对应的AUC值较高,相关的AUC值相对较低。图3的散点图为使用本文方法提取病变和正常甲状腺ROIs的特征参数(能量、熵、对比、相关和惯性矩)均值比较,其中横坐标为状态标量,分别用“1”和“0”表示病变和正常图像,纵坐标为各个参数取值范围。显然,能量、熵、对比和惯性矩对本实验甲状腺图像的判别诊断意义比相关更大。能量均值近似范围区间:正常甲状腺在0.06~0.14,病变在0.01~0.05;同样地,熵均值:正常在2.2~3.3,病变在3.3~5.4;对比均值:正常在0.1~0.6,病变在2~8上下波动;相关均值:病变在0~0.2;惯性矩均值:正常在0.7~0.95,病变在0.4~0.6上下波动。综合分析,能量、熵、对比以及惯性矩对甲状腺图像预测分类的意义和诊断价值较相关更好。

表2 GLCM改进算法特征参数P值和AUC值

图4 本文提出改进方法的各个特征参数的ROC曲线图

图4 为本文提取的10个特征向量ROC曲线图,ROC曲线离参考线越远,AUC值越高,其预分类精确度越高。左边为状态变量输入1的ROC曲线,右边为状态变量输入0下的ROC曲线。由图可知,病变ROIs的ENTMEAN、ENTVAR、CONMEAN、CONVAR、HOMVAR、CORVAR均高于正常ROIs,正常ROIs的ENGMEAN、ENGVAR、HOMMEAN、CORMEAN均高于病变ROIs。参照各个参数的物理意义,并对照图5(a)中正常区域和图5(b)中甲状腺病变的图像,分析各个参数的ROC曲线和AUC值可知:大部分甲状腺病变图像内部纹理结构更随机、复杂多变,且密度分布不均匀,大多纹理沟纹更深,局部纹理呈现不规律,病变图像的灰度分布离散程度更大;而正常甲状腺图像纹理灰度分布更均匀且粗壮,局部平稳性高,规律性较强。

图5 甲状腺MR病变和正常区域的ROI样本图

表3给出传统GLCM、DBC、Uniform-LBP、LOGGLCM与本文方法的分类结果,其中最佳临界点p=0.5,标准误差为0.033 6。从表3可以看出,这五个方法的分类准确率分别为75%,63.8%,88.8%和79.6%,本文方法的预分类准确率相比原始GLCM、DBC、ULBP和LOGGLCM分别提高了21.8%、15.8%、8%和17.2%,本文方法的灵敏度为97.9%,特异度为95.7%,漏诊率为2.1%,误诊率为4.3%,并得出一个接近0.968的AUC。LOGGLCM在提取图像边缘时,虽然降低了噪声但是细节损失较大,梯度定位精度也较低,存在噪声抑制能力与梯度定位能力相矛盾的问题,因而影响在实际梯度检测中的效果。而本文方法基于图像上采样和分块处理提取梯度信息,解决LOG-GLCM方法中梯度细节丢失的问题,在有效地消除噪声的同时又较好地保存了图像的梯度信息。本文提出方法相比其他方法,结合图像梯度信息,同时兼顾甲状腺图像内部纹理宏观信息和局部结构信息,并考虑参数的影响,选择最佳特征参数组合,在特征提取时采取区域划分的方法也能进一步提高分类准确率,增强本文算法的实用性,为临床医生更好地进行甲状腺病变的预测提供帮助。由表3可知,本文算法所有指标均高于其他方法,对甲状腺MR有无病变的判别效果较其他算法更好,对病变和正常的识别率更高,提高预分类准确率,并辅助医生诊断治疗。

5 结束语

为了进一步提高甲状腺MR图像病变和正常区域的预分类准确率,本文提出了改进GLCM的窗口自适应纹理特征提取算法。结合图像的梯度信息和GLCM的统计纹理特征提取算法,分别在感兴趣区域无边界处和病变区域有边界处采用窗口自适应的灰度共生矩阵算法提取甲状腺MR图像的纹理特征,采用Logistic回归模型对病变和正常区域的纹理特征进行分析,获得预分类精确率。

实验结果证明,本文算法准确率为96.8%,较其他方法有更好的预测分类结果。其中提取的能量、熵、对比和惯性矩具有较好的诊断价值,这些特征能有效地区分正常和病变的甲状腺区域。本实验在提取纹理特征时,考虑了病变区域的梯度信息,因此不需要精确地分割出病变区域,方便对自动化检测甲状腺病变系统地进一步研究和设计;通过实验分析可知,不同病变类型的甲状腺内部纹理存在一定的差异,比如:纹理规律和纹理沟纹等方面。对此,还需进一步研究;由于临床获取的MR图像存在噪声严重、病变种类多样化、结节形态不规则及对比度不明显等问题。因此,在临床上辅助医生诊断仅依靠纹理特征还不够,为提高辅助诊断的准确率,在后期研究中可考虑其形态、密度等特征以及选择更好的分类器。

表3 二分类Logistic回归模型分类表(最佳临界点p=0.5)

猜你喜欢
共生纹理梯度
一个改进的WYL型三项共轭梯度法
人与熊猫 和谐共生
共生
一种自适应Dai-Liao共轭梯度法
基于BM3D的复杂纹理区域图像去噪
优生共生圈培养模式探索
优生共生圈培养模式探索
使用纹理叠加添加艺术画特效
一类扭积形式的梯度近Ricci孤立子
TEXTURE ON TEXTURE质地上的纹理