刘 晙, 茹庆云
(河南机电高等专科学校计算机科学与技术系,河南 新乡 453000)
基于快速小波变换的高适应性图像检索技术研究
刘 晙, 茹庆云
(河南机电高等专科学校计算机科学与技术系,河南 新乡 453000)
在目前已有的研究工作中,基于自适应小波的图像特征在基于内容的图像检索领域获得了广泛的应用。但这些方法存在一个共同问题,即采用相同的小波基描述不同的查询图像。为了提高图像检索技术的自适应能力,本文对不同的查询图像设计不同的小波基表示,从而实现用可调整的距离测度表征不同类别图像的特征改变。为了进一步降低表征图和表征导数图的求取时间,该文使用了近似泰勒展开。实验结果表明,这种新的图像检索技术具有高度的自适应能力,检索性能也大幅度提高。
图像检索;小波变换;小波基;自适应
自适应小波已经在基于内容的图像检索中取得了广泛的应用,这在计算机科学领域已经成为一个热点研究[1]。基于内容的图像检索使用图像特征来捕捉两幅图像的相似性,并依据查询图像的特征在参考数据集中实现自动的检索[2]。
早期的图像检索系统,主要依赖机器语言和用户感知来建立低级图像特征[3]。小波变换应用于图像检索技术后,图像特征的建立手段更加丰富了[4]。另外,小波变换在图像检索中还具有一个明显的优势,那就是它可以灵活地调整表征图像特征的小波基,从而使得图像检索方法的适用性更加灵活[5]。
但从目前的使用情况看,对于一个图像检索系统,查询图像的小波基构建方法基本固定,当检索开始后再无更改的可能,从而没有把小波变换的灵活性最大限度地发挥出来[6-7]。实际上,对不同查询图像的图像特征采用统一的小波基构建方法,势必会降低整个图像检索系统的性能[8-9]。
为此,要进一步提高基于小波变换的图像检索技术的适应性和整个图像检索系统的性能,就应该为每一幅不同的查询图像量身定制小波滤波器。本文所作的研究工作,正是在这样的出发点下展开的。
根据定义,I在任意位置 (i, j)、任意分析范围s∈ Ν*的小波变换的系数,可用下面的公式计算:
利用公式(1),对公式(2)进行改造,可以得到下面的公式:
我们可以用标准矩描述小波系数(xi,j,s)i=0,…,M-1,j=0,…,N-1的分布特征。在纹理图像的特定情况下,可以使用非倾斜均值广义高斯函数来模仿任意尺度的小波系数分布模型。这个广义高斯函数有两个参数:α和β,它们即分别为规模和形状参数。则标准矩 (μ ,σ ,ν,κ)与α和β相关,并且可以按照公式(4)~(6)计算。
这里Γ是伽玛函数,σ 、κ 分别与 α、β 密切相关。根据标准偏差σs,K,L(I )及其峰值κs,K,L(I ),我们可以描述任意小波系数的特征分布。当I、 K 、 L为已知时, σs,K,L(I )和 κs,K,L(I )可以分别简记为σs和 κs,其具体计算如下:
这里 ms,d是 I的小波变换的一个多项式函数,其具体表达如下:
如果 IS和 JS分别表示集合和那么上述公式所反映出图像特征的复杂性应为O(MNKL/s2)。
2.1 小波滤波器空间
让 WK,L表示所有支持 (2 k+ 1)×(2L+1)的小波滤波器的空间,让D表示它的维数。因为根据式(1)各滤波器 w ∈ WK,L中心系数被限制,
2.2 表征图和表征导数图
根据小波自适应的构建目的,我们对于一个给定的分析规模 s∈ N*和每个过滤器 w ∈WK,L计算I的表征 (σs,κs),由此产生的一系列特征被称为I的表征图,它也用于计算表征的一阶导数。由此产生的表征导数称为I的表征导数图。
据前所述,用小波滤波器提取图像特征具有O(MNKL/s2)的复杂度,因此需要大量的时间。为此,我们使用近似表征图和表征导数图。
2.3 近似表征图
本文使用泰勒展开的近似表征图和表征导数图,这是一种全新的应用。通过一个有限集的小波滤波器计算表征和表征导数,这被称为关键小波滤波器,其余每个图使用泰勒展开近似。一套关键小波滤波器用来表示,假设是关键小波滤波器。在 w处,函数f(无论是还是的泰勒展开如下所示。
这里 nT表示顺序泰勒展开的阶数,表示二阶。
2.4 表征图及其导数的不变性
首先,如果小波滤波器 w ∈ WK,L乘以一个正实数 λ∈ R+,根据公式(3)和式(9),有δs,d(k ,l )和ms,d乘以 λd,∀ s, k和l。因此,如果w乘以λ,然后σs乘以λ, ks不变。至于导数,如果w乘以λ, (∂ σs/∂wk,l)不变和 (∂ ks/∂wk,l)除以λ。这个不变性分析意味着,我们只需要在单位球面内对小波滤波器计算表征图及其导数。
其次,如果w乘以-1,有δs,d(k ,l )和ms,d乘以(- 1)d,∀ s , k和l。因此,如果w乘以-1,那么σs和 ks不变, (∂ σs/∂wk,l)和 (∂ ks/∂wk,l)乘以-1。这个不变性分析意味着,我们只需要在单位半球面内对小波滤波器计算表征图及其导数。
2.5 表征图像的建立步骤
整个表征图的构建过程如图1所示。图1中,横轴代表第一个无约束的小波滤波器系数的值,实心弧代表表征图的泰勒展开。
第三步,是计算特征和特征导数在 WK,L集出的差,如图1(c)所示。让λ在集合处被二阶w过滤器过滤。让是一个变量显示,( w /λ)属于( δ=1)或( δ=-1)半个单位球体。
图1 表征图构建过程
如果用 Iq代表查询图像,R代表参考图像数据集。在图像检索过程中,表征图是用来计算I∈ R 的图像相似度排名,将形成 I1(Iq),I2(Iq),…IK(Iq)的检索结果,其中 K∈ N*。
我们建议将每个图像用S(I)=(σs,K,L(I ),κs,K,L(I))s∈N*,K∈N,L∈N标 注 , 在 标 注 S (I), 特 征σs,K(,LI ) 和κs,K,L(I)在分析规模s处提取分析表,使用支持 (2 K + 1)×(2L+1)的滤波器 ws,K,L。基于这些明显特征, Iq和另一幅图像 I∈ R之间的距离定义如下:
假设 dH(Iq,I)表示 Iq和I之间强度直方图的二阶距离, dH(Iq,I)是用 Iq和I的低频成分。每一部分的距离测度被实数加权:假设和则或
从已有的图像检索方案来看,一般都是使用单一的距离参数来评价查询图像和各幅参考图像之间的相似性。而本文利用公式(12)所示的距离定义函数,根据前面所述的不同表征图和表征导数图,可以根据不同查询图像的特征,有针对性地调整距离测度,从而极大地提高图像检索过程的自适应性。
在这种高度自适应的图像检索方法中,不同的距离参数集用于每个查询图像。确切地说,距离参数(小波滤波器系数权重)可以在不同的特征空间使用。
为了验证本文提出的基于快速小波变换的高自适应图像检索方法的有效性,实验使用的测试图像是以从http://www.wang.st.psu.edu/IMAGE下载的包含10000 幅测试图像的图像库,这个数据平台共有分辨率大小为 126×85 或85×126两种规格。图像内容涉及了山水、花草、昆虫、动物、建筑。实验过程采用了主频为2.6GHz的酷睿双核CPU,存储空间为8G的内存,显存为2G的独立显卡的计算机。软件编译平台为 Visual C++.net 2005平台。为便于比较,在相同的软硬件平台上进行二组实验,分别实现了文献[5]、文献[8]中的检索方法和本文提出的检索方法,采用检索结果的检索时间、查全率、查准率作为检索的评价准则。
4.1 牡丹图像的检索实验
为了形象地说明本文算法的实现流程,首先采用了两幅牡丹图像作为查询图像,进行了表征图提取,其结果如图2所示。
图2 不同“牡丹”查询图像的表征图提取过程
图2中,我们利用小波变换技术,对两幅不同的“牡丹”查询图像进行了表征图求解。其中分别展示了 H2、H4、V2、V4等小波分解级次在σ、 K计算尺度下的表征图。从图2中明显可以看出,不同的查询图像所对应的表征图并不相同,如果用相同的小波基表征形式进行后续查询和检索,会降低检索性能。进一步用本文所提的方法进行图像检索性能测试实验,检索结果如图3所示。从图2以及图3可以看出,通过本文方法的设计,可以为不同查询图像设计不同的表征图,从而使整个检索过程的自适应性大大提高。
图3 牡丹图像查询结果
表1是实验一中3种方法检索时间以及查全率的比较,可以看出由于本文算法和文献[8]中的检索方法都是建立在图像特征库的基础上,使得查询不相关图像大为减少,从而使检索时间较文献[5]检索大大缩短。另外,本文算法从查询时间上看,从10000幅图像构成的图像库中进行“牡丹”图像的查询,仅花费 0.28s,并没有因为表征图的计算导致检索时间的增加。并且随着数据库规模增大,检索速度提高的更加显著。在查全率、查准率方面也比上面两种方法更具优势。
表1 3种算法查全率、查准率、检索时间统计对比
4.2 日出图像的检索实验
为了测试本文算法的鲁棒性,本文还采用了两幅日出图像作为查询图像,进行了表征图提取,其结果如图4所示。
图4 不同“日出”图像的表征图提取过程
我们仍然采用和第一组实验一样的方法,先来求解两幅不同的“日出”图像的表征图像。这里 , 也 分 别 计 算 了 在 σ、 K下 的H2、H4、V2、V4小波分解级次图像。从图4中可以看出,和“牡丹”图像的结果一样,不同的“日出”图像所对应的表征图也有很大差异。利用本文方法,对“日出”图像执行的最终检索结果如图5所示。
图5 日出图像查询结果
表 2是第二组实验 3种方法检索时间的比较,可以看出同样本文算法和文献[8]检索时间较文献[5]检索大大缩短。另外利用本文方法执行“日出”图像的查询,耗时为 0.34s,也表现出较快的检索速度。从以上分析可以看出,应用本文的小波分解思路,在一定程度上可以提高检索的适应性能和精确性,同时在时间消耗没有明显的增加。
表2 3种算法查全率、查准率、检索时间统计对比
为了说明本文方法的查全率、查准率,分别用本文方法的查全率、查准率与文献[5],[8]的两种方法进行了比较。比较结果的曲线图如图5所示。
图6中,横坐标为要检索出图像数目占图像总数的百分比,纵坐标为检索精度,三条曲线分别代表了本文方法、文献[5]、文献[8]的方法。从这个结果可以看出,本文方法的检索精度要远远高于文献中两种方法。
图6 3种图像检索方法的对比
对于不同查询图像,使用同一小波分解策略并执行统一的相似性比较,显然会降低图像检索的性能。本文针对此问题,对不同查询图像进行了不同表征图像的提取,并通过对小波分解过程的泰勒函数近似展开,来有效降低这种处理过程的时间消耗。实验结果表明,本文所设计的图像检索方法,具有高度的自适应能力,可以提高针对不同查询图像的检索性能,而时间上的消耗也没有明显的增加。
[1] 李向阳, 庄越挺, 潘云鹤. 基于内容的图像检索技术与系统[J]. 计算机研究与发展, 2001, 38(3): 344-354.
[2] 齐 恒. 基于内容图像检索的关键技术研究[D]. 大连: 大连理工大学, 2012.
[3] 庄 凌, 庄越挺, 吴江琴, 叶振超, 吴 飞. 一种基于稀疏典型性相关分析的图像检索方法[J]. 软件学报, 2012, 23(5):1295-1304.
[4] Bian Wei, Tao Dacheng. Biased discriminant Euclidean embedding for content-based image retrieval [J]. IEEE Transactions on Image Process, 2010, 19(2): 545-554.
[5] 傅启明, 刘 全, 王晓燕, 张 乐. 遗传反馈的多特征图像检索[J].中国图象图形学报, 2011, 16(10): 1858-1865.
[6] 温 超, 耿国华, 李 展. 基于 K均值聚类和多示例学习的图像检索方法[J]. 计算机应用, 2011, 31(6): 1546-1549, 1568.
[7] Ferecatu M, Geman D. A statistical framework for image category search from a mental picture [J]. IEEE Trans. Pattern Anal. Mach. Intell, 2009, 31(6): 1087-1101.
[8] 史习云, 薛安荣, 刘艳红. 改进k-means聚类算法在图像检索中的应用研究[J]. 计算机工程与应用, 2011, 47(10): 193-197, 248.
[9] 李宗民, 唐志辉. 九宫格空间框架的图书图像检索[J].中国图象图形学报, 2013, 18(3): 325-329.
Highly Adaptive Image Retrieval Technology Based on Fast Wavelet Transform
Liu Jun, Ru Qingyun
(Department of Computer Science and Technology, Henan Mechanical and Electrical Engineering College, Xinxiang Henan 453000, China)
In the existing research in the field of content-based image retrieval, image features obtained by adaptive wavelet transform have a wide range of applications. There is a common problem in these methods that different query images are described with the same wavelet basis. In order to improve the adaptive capacity of image retrieval techniques, different wavelet bases are designed for different query images. Different wavelet bases can be used in adjusting retrieval performance for different query images, and the extraction time does not significantly increase. The experimental results show that this new image retrieval technology has a high adaptive capacity and its retrieval performance is also greatly improved.
image retrieval; wavelet transform; wavelet basis; adaptive
TP 393
A
2095-302X (2014)02-0262-06
2013-05-21;定稿日期:2013-07-21
河南省基础与前沿技术研究计划基金资助项目(082300410390);河南省高等学校教学工程项目——教学团队(豫教高2012[1099]号)、精品资源共享课程(豫教高2012[1185]号)
刘 晙(1981-),男,湖北天门人,讲师,硕士。主要研究方向为图形图像、软件技术及数据库。E-mail:liujun20100@163.com
茹庆云(1958-),男,河南新乡人,副教授,硕士。主要研究方向为小波及图像方面的应用。E-mail:ddnt@163.com