郭依正, 倪红军
(南京师范大学泰州学院,江苏 泰州 225300)
在医学领域中图像的识别技术应用在不断提高,对于肝脏的计算机断层扫描(Computed Tomography,CT)图像,利用计算机寻找合适的智能识别方法,辅助医生进行诊断,已成为计算机和医学交叉领域的研究热点[1-2]。
特征提取与选择是图像识别过程的核心环节,直接影响着最终结果的优劣。典型的图像特征包括颜色特征(肝脏CT图像是典型的灰度图像,可以提取反映图像灰度分布的灰度特征)、形状特征和纹理特征[3-5]。文献[3]中使用了Gabor纹理特征对肝脏疾病进行分类,文献[4]中结合共生矩阵和矩特征进行病灶CT图像识别,文献[5]中使用形状特征区分肝癌、囊肿和血管瘤等非正常肝组织。
在实际应用中,仅仅利用一类特征是很难完整描述一副图像内容的。为了提高正常和异常图像的识别率,本文综合提取了颜色、形状和纹理特征,用局部线性嵌入(Locally Linear Embedding,LLE)的方法对特征数据进行降维融合,通过比较实验,采用改进的混合核函数支持向量机(Support Vector Machines,SVM)进行分类识别。
本文采用综合提取颜色、形状和纹理3类特征形成的组合特征不仅维数较高,而且特征之间也存在冗余,为了有效利用各类特征,在对组合特征采用标准差变换和极差转换进行规格化后,利用LLE方法对特征数据进行降维融合;再与其他同类典型流形学习算法[6-8]进行实验比较;最后采用改进的混合核函数支持向量机即Sigmoid核函数和RBF核函数线性组合形成的混合核函数支持向量机进行分类识别。
实验图像采集于某医院影像诊断科,本文从近4万余幅腹部CT图像中,选择了2 000幅图像作为本研究的实验数据,其中包含1 000幅肝脏正常医学图像和1 000幅肝脏异常的医学图像。
每幅CT图均是灰度级为256的灰度图,即像素取值范围为0~255;图像分辨率为512×512。由于不同个体、不同断层扫描的腹部CT图差别较大,为了提高肝脏异常与否的识别率,本文采用交互式自动分割方法获取感兴趣区域(Region of Interest,ROI),即由用户点击感兴趣区域的中心点,通过软件自动分割出大小为m×n的感兴趣区域。
如图1所示,分别给出了随机抽取的两幅正常肝脏CT图和两幅异常肝脏CT图所确定的感兴趣区域(标“-ROT”的图),本实验中m=60,n=120。
图1 随机抽取的CT图及其感兴趣区域
本文的实验方案如图2所示,主要包括图像预处理、特征提取、特征选择优化、改进的SVM识别4个部分:①图像预处理的主要工作是获取感兴趣区域;②特征提取的主要工作是分别利用灰度直方图、Hu不变矩、Gabor方法提取感兴趣区域的颜色、形状、纹理特征;③特征选择优化的主要工作是将前述的组合特征规格化到[0 1]区间,以及基于LLE的特征降维融合;④通过改进的SVM识别得到图像异常与否的判断结果。
图2 CT图像处理与识别实验方案
特征的提取过程具体包括基于灰度直方图的颜色特征提取、基于Hu不变矩的形状特征提取以及基于Gabor的纹理特征提取,为后继特征选择和分类识别做准备。
(1)颜色特征是描述图像内容的最直接的视觉特征。本文基于灰度直方图,对每幅图像的感兴趣区域提取了均值μ、方差σ2、倾斜度μs、峰态μk、能量μN、熵μE等特征。
(2)形状特征是反映目标形状信息的特征。形状特征提取是图像特征提取的重要组成部分,本文提取了基于Hu不变矩的形状特征,它们具有位移、缩放、旋转等不变性[9]。对每幅图像的感兴趣区域提取了M1,M2,…,M77个不变矩特征作为图像的形状特征。
(3)纹理特征是一种区域性特征。纹理特征能较好地描述图像疏密等表面特性,对于区分肝脏是否异常意义重大。
对于一幅给定的P×Q大小的灰度图像I(x,y),提取基于Gabor变换的纹理特征[10-11],其离散Gabor小波变换为
在不同方向和尺度上计算变换后的系数幅度序列
以系数幅度序列的均值μm,n和标准方差σm,n为分量构成特征向量f来描述图像的纹理:
式中:m,n分别是指定小波的尺度和方向,m=0,1,…,s-1;n=0,1,…,k-1;s为尺度数,k为方向数。本文实验中s=4,k=5,即对每幅感兴趣区域提取的Gabor纹理特征向量为f=(μ0,0,σ0,0,μ0,1,σ0,1,…,μ3,4,σ3,4)。
通过上述方法,每幅图像提取了3类特征,合并构成了表征CT图像内容的特征矢量。但因特征矢量维数高、特征间存在冗余等,并不适合直接用于分类识别,为此,本文采用LLE算法对特征进行降维融合。考虑到特征之间的数值范围相差较大,因而需要采用标准差变换和极差转换对提取的特征进行规格化[12],将所有特征规格化到[0 1]区间,从而消除量纲对分类识别的影响。
输入的高维特征记为X={X1,X2,…,Xn},Xi∈RD,用局部线性嵌入方法进行特征降维,把X映射到低维空间后变为Y={Y1,Y2,…,Yn},Yi∈Rd。采用K邻域法或者ε邻域法,找到离目标样本点最近的K个数据点,作为该目标点的邻近点。代价函数为
式中:Wi,j为Xi和Xi,j间的重构加权值,Xi,j表示Xi的第j个近邻点,且满足,如果Xj不是Xi的近邻点,则Wi,j=0,代价函数越小,重建的越好。约束关系为:
式中:M=(I-W)T(I-W)为稀疏阵,需要求解M中最小的(d+1)个特征值所对应的特征向量。低维流形Y就是由第2个到第(d+1)个特征向量组合成。
取得了分类特征,下一步应构建分类器。支持向量机(SVM)已经成为当前解决分类和回归等问题方面最流行且功能强大的一种工具[13]。SVM是典型的两类分类器,其分类函数[14]为
式中:α是拉格朗日因子;k为核函数;C为惩罚因子。
在使用核函数SVM时,不同的核函数往往产生不同的分类效果。目前使用较多的核函数有Poly(多项式)核函数、RBF(径向基)核函数和Sigmoid核函数[15]。RBF核函数属于局部核,具有良好的局部特性和插值能力,但泛化性能较弱;而Sigmoid核函数具有较好的全局分类性能和推广能力,但学习能力较弱。
本文将Sigmoid核函数和RBF核函数线性组合形成混合核函数为
式中:δ为核函数的权值,δ∈(0,1),本实验中δ=0.4。
为了对所提方法的有效性进行验证,本文以前述的实验方案,实验用Core i5-4200U/1.6GHz/8GB/240GB计算机,在仿真软件为Matlab 2012b平台下,用图1所示的“za-ROI”和图2所示的“ya-ROI”2幅图像为例,通过计算得到了3类特征提取方法提取的特征值,如表1所列,特征值保留3位小数,其中,基于Gabor的纹理特征维数较高,这里只给出了前四维。
表1 3类特征提取方法所提取的特征示例
特征提取并规格化后采用LLE算法对组合特征进行降维融合,为了验证降维后的特征能更好地表达原始医学图像感兴趣区域的内容信息,实验将各单类特征及融合后特征分别用于分类识别。在图像数据库中各选择100幅正常及异常图像作为训练样本,目的是能将输入的肝脏图像分成正常、异常两类,分类器统一采用混合核函数SVM。
图像识别实验分别对200、500和800幅待识别图像进行分类,使用基于灰度直方图的颜色特征,图像识别率平均为46.9%,使用基于Hu不变矩的形状特征,图像识别率平均为41.7%,使用基于Gabor的纹理特征,图像识别率平均为83.8%,使用本文基于LLE算法融合后的特征,图像识别率平均为95.8%。
结果表明,融合后的特征能更好地表达医学肝脏CT图像的内容,图像识别率更高。仅使用单类特征只能表达图像的部分属性,单类特征分类不能兼顾多方面的考虑,而多类特征融合分类表现出了更优越的性能。此外,就单类特征而言,Gabor纹理特征的识别率显著高于颜色特征和形状特征的识别率。
为了进一步验证局部线性嵌入方法降维融合效果,本文还做了横向比较,将局部线性嵌入算法与拉普拉斯特征映射(Laplacian Eigenmaps,LE)、等距映射(Isometric Mapping,ISOMAP)等典型流形学习(Manifold Learning)算法[8]分别做了实验,结果如图3所示。
图3 LLE与其他典型降维算法比较
实验结果表明,局部线性嵌入算法较其他典型流形学习算法,在本实验中,表现出了更好的鲁棒性,局部线性嵌入算法在维数降到11维时达到了最佳识别率。局部线性嵌入算法更能发掘高维样本空间内非线性结构及规律,实现优化。进一步的实验发现,基于Sigmoid核函数和RBF核函数线性组合形成的混合核函数支持向量机用于分类识别,较单一核函数SVM的识别率提高了5%以上。
本文针对医学肝脏CT图像提出的基于LLE特征降维及改进SVM的肝脏图像识别方法,通过特征组合、局部线性嵌入算法的特征降维融合、混合核函数支持向量机分类器,取得了更高的识别率,并经实验验证了本文方法的可行性和有效性。结果表明:基于LLE的特征降维融合比单类特征更好的表达了图像内容,待识别图像经改进的混合核函数SVM分类后,平均识别率为95.8%。
本文的识别结果可以为医生辅助诊断提供参考。对于原始医学肝脏CT图像内容信息复杂,如何实现自动精确的多类别识别(例如判断是肝囊肿、还是肝硬化、抑或是肝癌等)值得继续深入研究。