宋卫华
(黄山学院机电与信息工程学院,安徽黄山 245021)
随着计算机技术和医学成像技术的发展,基于内容的图像检索(Contend-Based Image Retrieval,CBIR)在生物医学领域的应用成为研究热点。CBIR在描述图像时,大多提取图像自身的颜色、纹理、形状、空间关系等底层特征,形成特征库,然后将待查图像与特征库进行基于向量空间模型的匹配[1-2],寻找相似图像,以辅助医生的判断和诊疗。
纹理特征是一种重要的图像底层特征,并被广泛应用[3-4]。文中研究的胸部CT图像,其图像间相似度高,空间分辨率高,鉴于其纹理信息丰富,从统计法中的灰度共现矩阵和频谱法中的小波变换来提取纹理特征,对两种方法进行了比较和分析,实验表明,基于小波变换的纹理特征提取方法可以有效描述图像纹理并取得较好检索结果。
灰度共现矩阵(Gray Level Co-occurrence Matrix,GLCM)建立在估计图像的二阶组合条件概率密度函数基础之上,描述在θ方向上距离为d的一对像素,分别具有灰度值i和j的出现概率,其元素可记为p(i,j|d,θ)。由此可得灰度共现矩阵是距离和方向的函数。定义如下:
式中:Lr,Lc——分别为水平空间域和垂直空间域。
同理可得到距离为d,方向为θ=45°,90°,135°的公式。其中,分子表示具有某种特定空间关系,灰度层分别为i,j的像素对的个数,分母为像素对的总个数(#代表数量)。这样所得的p是归一化的,文中距离d取1。由空间灰度共现矩阵可以计算出一组参数,用来定量描述纹理特性。文中根据胸部CT图像灰度分辨率高等特点,提取以下6种参数[5]:
1)二阶矩:
2)熵:
3)对比度:
4)最大概率:
5)相关性:
式中:μx,μy,σx,σy——分别为px,py的均值和标准差;
6)最大运行长度概率:
针对所研究的胸部CT图像,文中提取0°,45°,90°,135°的4个方向上的灰度共生矩阵(d取1)。最后以各分量的均值和标准差作为纹理特征向量中的各个分量(总共12个分量)。因12个特征分量的物理意义和取值范围不同,运用高斯方法对其进行内部归一化。由于胸部CT图像的病理特征主要反映在肺叶区域,在进行特征提取时为了突出图像中部区域的重要性,将原始图像的二维空间进行8×8的划分,每个区间赋予一定的权值,权值矩阵如下:
再针对每个分块提取纹理特征,其相似度计算如下(其中k表示分块):
小波变换(Wavelet Transform)算法是由法国科学家Mallat在1988年提出的,常用于纹理分析和分类[6]。小波变换是将图像信息分解到尺度与空间域的联合分布之中,形成对图像信号的联合表征。纹理分析常采用两种结构的小波变换:金字塔结构的小波变换和树结构小波变换[7]。就性能来说,不同的小波变换在对纹理分析方面没有很显著的差别。文中采用了金字塔结构的哈尔小波变换,通过对基函数分解表示图像信号,其中,基函数ψmn(x)是由母函数ψ(x)伸缩和平移得到:
其中m,n是整数,图像经过小波变换后的变换系数f(x)可表示为:
cmn为图像相邻像素的均值和方差组成的系数,整个小波变换的过程需要递归的过滤和采样。首先,利用哈尔小波变换将图像进行3级分解,得到一个多分辨率表示,获取图像信息的一种简单的分层理论框架。文中对胸部CT图像3层小波分解,如图1所示。
图1 胸部CT图像3层小波分解图
小波分解通道的输出具有较大的能量时即体现了图像在当前频率或方向下的纹理特征。为此,可以用每个波段的每个分解层次上能量分布的均值和方差来表示图像的纹理特征。公式如下:
式中:M×N——小波子带的大小;
μ(x)——小波系数的均值。
经上述分解后提取20维的纹理特征向量。
针对采集的胸部CT扫描图片(共215幅,其中肺癌患者图像45幅,其余为正常图像),基于上述分析,在Windows XP系统下,应用VC#和SQL Server 2005实现了一个图像检索的原型系统,在此基础上进行了以下实验:
1)基于灰度共现矩阵的纹理特征检索;
2)基于小波变换的纹理特征检索。
实验规定:判断两幅图像相似(相关)的依据是它们是否具有相同的病理特征。
采用查准率评价算法的检索性能,查准率越高,表明检索到的图像越相似,检索算法、检索精度也就越高。查准率precision定义为:
式中:a——系统返回的图像中与查询图像相关的图像数目;
b——不相关的图像数。
为了定量地评价文中算法,随机选取10幅图像进行上述实验,分别计算10幅图像检索的查准率,结果如图2所示。
图2 检索结果比较
由图2可见,基于小波变换的纹理特征检索方法要比基于灰度共现矩阵的纹理特征检索效果好。由于医学图像一般都具有丰富的纹理信息,而多数的病灶部位也都是通过图像上的纹理分布才可获得,经过小波变换的多分辨率分解,将粗纹理的空间能量集中在低频部分,而细纹理对应的频率分量主要在高频部分,为此通过提取高频和低频部分的纹理,可有效描述图像的底层纹理特征,从而获得了相对较好的检索效果。
从统计法中的灰度共现矩阵和频谱法中的小波变换来提取纹理特征,对两种方法进行了比较和分析,实验表明,基于小波变换的纹理特征提取方法可以有效描述图像纹理信息,取得了较好的检索结果,这对研究CBIR技术在医学领域(如胸部CT图像)的应用具有一定的参考价值。文中的特征检索技术仅涉及到图像的底层纹理特征,为此,如何融合高层语义本体特征,弥补底层-高层特征间的“语义鸿沟”[8-10],进一步提高检索的效果,将是我们下一步的研究工作。
[1] 钱晶莹,高月松.图像检索系统中的CBIR技术研究[J].电脑知识与技术,2011,7(2):415-417.
[2] 王洋.多模态图像检索技术[D]:[博士学位论文].合肥:中国科学技术大学,2013.
[3] 章毓晋.基于内容的视觉信息检索[M].北京:科学出版社,2003.
[4] Wang J Z,Li J,Wiederhold G.SIMPLIcity:Semantics-sensitive integrated matching for picture libraries[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2001,23(9):947-963.
[5] Haralick R M.Statistical and structural approaches to texture[J].Proceedings of IEEE,1979,67(5):786-804.
[6] 李玮琳.平移不变小波医学图像融合方法[J].长春工业大学学报:自然科学版,2013,34(6):653-655..
[7] 邰晓英,北研二.信息检索技术导论[M].北京:科学出版社,2006.
[8] 何超,张玉峰.融合领域本体的中文文本语义特征提取算法[J].研究情报理论与实践,2013,36(9):96-99.
[9] Timothy N R.Statistical topic models for multi-label document classification[J].Machine Learning,2012,88(1/2):157-208.
[10] 张国栋,张化祥.基于语义的文本特征加权分类算法[J].计算机应用研究,2012,29(12):4476-4478.