宋卫华 (黄山学院机电与信息工程学院,安徽 黄山 245021)
基于特征融合和相关反馈技术的图像检索研究
宋卫华 (黄山学院机电与信息工程学院,安徽 黄山 245021)
为提高图像检索精度,在研究单一特征检索算法基础上,提出了基于底层-底层和底层-高层2种级别的特征融合检索方法,利用相关反馈技术逐步求精以提高检索性能,并用VC#和SQL server2005实现了一个图像检索原型系统。研究表明,利用该研究方法能够提高图像检索精度,因而具有可行性。
图像检索;特征融合;相关反馈
基于内容的图像检索在对图像进行描述时,一般首先提取图像自身的颜色、纹理、形状、空间关系等特征,再进行基于向量空间模型的匹配[1]。但仅仅利用单一特征是不够的,因而如何有效集成图像的多种特征是目前的研究热点[2]。为此,笔者了基于特征融合算法和相关反馈技术对图像检索进行了研究。
1.1基于模糊C均值聚类的颜色相关图特征提取
在模糊C均值聚类基础上提取颜色相关图特征,通过对目标函数的迭代优化以实现集合的模糊划分[3],将n个数据点分为c个模糊组,对每个数据点用值在[0,1]来确定其属于各个组的程度,并求每组的聚类中心,最终使得非相似性指标的价值函数达到最小。隶属矩阵U如下:
(1)
模糊C均值聚类时的价值函数J如下:
(2)
式中,uij∈[0,1];ci为模糊组i的聚类中心;dij为第i个聚类中心与第j个数据点的欧式距离;m∈[1,∞]是一个加权指数。
构造以下新的目标函数,使得式(2)达到最小值的必要条件为:
(3)
式中,λj(j=1,…,n)是约束式的拉格朗日乘子。
对所有输入参量求导,使式(3)达到最小值的必要条件为:
(4)
进行FCM聚类的具体步骤如下[4]:①设定N个聚类中心的初始值;②求每个像素值与所有聚类中心的Dhsv距离,并确定隶属函数矩阵,在此基础上,计算总的价值函数和确定聚类中心。③根据确定的聚类中心计算总价值函数并与②中的总价值函数相比,若趋于稳定(价值函数值相对比较小)则停止迭代,否则返回②继续进行。
1.2纹理特征的分析与提取
小波变换提供了一种将能量有限信号分解成一系列对数带宽相同的频道的方法,通过将图像信息分解到尺度与空间域的联合分布之中,形成对图像信号的联合表征。纹理分析常采用2种结构的小波变换:金字塔结构的小波变换和树结构小波变换。就性能来说,不同的小波变换在对纹理分析方面没有很显著的差别。笔者采用了金字塔结构的哈尔小波变换[5],通过对基函数分解来表示图像信号,其中基函数ψmn(x)由母函数ψ(x)伸缩和平移得到:
(5)
ψmn(x)=2-m/2ψ(2-m/2x-n)
(6)
式中,m表示伸缩因子;n表示平移因子。
则图像经过小波变换后的变换系数f(x)可表示为:
(7)
式中,cmn为图像相邻像素的均值和方差组成的系数。
整个小波变换化的过程需要递归的过滤和采样,为此将图像进行3层分解,得到图像信息的简单分层理论框架。在每个层次上,信号被分解为4个波段,用每个分解层次上的每个波段的能量分布均值(ENG)和方差(DEV)来表示图像的纹理特征:
(8)
(9)
式中,M×N是小波子带大小;μ(x)是小波系数均值。
1.3图像检索过程
首先对多个特征设置不同的权重,然后将其进行线性组合来实现特征融合算法。由于不同特征间相似度不具可比性,为此进行特征间归一化[6]:
(1)计算查询图像q与库中每幅图像的基于单一颜色相关图特征的相似距离d(1,q),d(2,q),…,d(n,q),(n为库图像总数),并计算其均值md和方差σd。
(2)对d(1,q),d(2,q),…,d(n,q)按下式进行高斯归一化,使相似度的值落在区间[0,1]上:
(10)
(3)重复步骤(1)、(2),可得到归一化后的基于单一纹理的相似距离。
(4)为单一特征分配权重wi,进行特征融合,则基于特征融合的相似距离Dfus可表示为:
(11)
相关反馈技术主要是通过修正系统的检索策略,进行多次检索,得到与用户实际需求尽可能相符合的检索结果[1]。对于采用向量空间模型的系统,相关反馈技术一般采取如下2种策略,即移动查询向量和调整距离测度策略。其中移动查询向量的过程如下:按照最初的查询条件(向量),查询系统返回查询结果,然后人为介入(或自动)来选择几个最符合查询意图的返回结果(正反馈集合),也可以选择最不符合查询意图的几个返回结果(负反馈集合)。上述反馈信息被送入系统用来更新查询条件,以便重新进行查询,从而让随后的搜索更符合查询者的真实意图。笔者采用Rocchio算法[7]来移动查询点,该过程是一个迭代过程:
(12)
式中,Qi+1和Qi分别对应第i+1次和第i次的查询向量;DR′和DN′分别为正反馈集合和负反馈集合;NR′和NN′分别为正反馈集合和负反馈集合的数目,α、β、γ分别为加权常数。因此,通过移动小波变换后各波段能量分布的特征向量的查询点和调整颜色相关图特征与纹理特征的权重,可实现检索时的相关反馈。
针对采集的内窥镜图像1361幅(其中169幅为有癌图像,其余为无癌图像),基于上述分析,运用VC#和SQL Server2005实现一个图像检索原型系统,在此基础上设计如下试验:①基于模糊C均值聚类的颜色相关图特征检索;②基于小波变换的纹理特征的检索;③在试验①的基础上融入基于小波变换的纹理特征,进行特征融合检索;④在试验③的基础上加入相关反馈进行多次检索。判断2幅图像相似(相关)的依据是它们是否具有相同的病理特征。
对于检索性能的评价,采用了基于排序值的Rank方法[8],一般地,排序值越靠前(小),说明图像间相似度越高。除此之外,还应计算查准率,查准率定义为检索到的相关图像数占检索到的图像数的比例,查准率越高,表明该检索算法检索精度越高。为此,随机选取10幅图像并计算其检索的平均排序值和平均查准率(见表1)。
表1 基于不同检索算法的检索结果比较表
从表1可以看出,基于特征融合和相关反馈技术的检索算法获得的检索结果,其平均排序值最低,而平均查准率最高,因而利用该算法可以获得很好的检索精度。
在分析单一特征检索算法的基础上,提出了基于特征融合和相关反馈的图像检索算法。实例分析表明,该算法具有较高的查准率和较小的排序值,说明其检索性能较好,可用应用在精度要求较高的图像(如内窥镜图像)检索中。
[1]钱晶莹,高月松.图像检索系统中的CBIR技术研究[J].电脑知识与技术,2011,7(2):415-417.
[2]陆丽珍,刘仁义,刘南.一种融合颜色和纹理特征的遥感图像检索方法[J].中国图象图形学报,2004,9(3):328-332.
[3]Song Weihua,Tai Xiaoying.Medical image retrieval based on FCM using feature fusion[J].Journal of Computational Information System,2007,3(4):1635-1642.
[4]Brecheisen S,Kriegel H P,Pfeifle M. Multi-step density-based clustering[J].Knowledge and Information Systems April,2006,9(3):284-308.
[5]韦娜.基于内容图像检索关键技术研究[D].西安:西北大学,2006.
[6]邰晓英,北研二.信息检索技术导论[M].北京:科学出版社,2006.
[7]芳野纯洁, 滨田.内镜诊断与鉴别诊断图谱[M].沈阳:辽宁科学技术出版社,2003.
2013-05-22
宋卫华(1982-),女,硕士,助教,现主要从事图形图像和数据库方面的教学和研究工作。。
TP391
A
1673-1409(2013)28-0026-03
[编辑] 李启栋