一种利用局部直角均值模式的图像检索算法

2017-04-20 03:40洪天昊孙华东金雪松张广元赵志杰
关键词:查全率查准率直角

洪天昊,孙华东,金雪松,张广元,赵志杰

(哈尔滨商业大学 计算机与信息工程学院,哈尔滨 150028)

一种利用局部直角均值模式的图像检索算法

洪天昊,孙华东,金雪松,张广元,赵志杰

(哈尔滨商业大学 计算机与信息工程学院,哈尔滨 150028)

提出一种基于纹理特征的图像检索方法.在RGB颜色空间提取纹理特征描述子,将彩色图像分离出R、G、B三通道色,使用Haar小波基将三通道颜色图像通过二维离散小波变换,分别提取其低频子带.在三维球形对称模式下,使用局部直角均值模式对邻域像素进行重新编码,通过均匀LBP模式进行降维,取直方图作为特征向量,从而实现图像检索过程.在Corel-10K数据库上进行实验,通过对实验结果进行分析,表明本文方法在图像检索方面有较好的表现.

CBIR;纹理特征;局部纹理模式;局部直角均值模式

随着信息量的指数型增长,低廉的数据存储成本以及庞大的数据量促进了数字图像处理在诸多研究领域的蓬勃发展:医学图像处理,网络图像检索,人脸识别,步态识别等.在日益壮大的互联网时代,用户可以轻松地获取和访问大量的数字图像信息,这使得图像检索逐渐成为拥有更广泛应用价值的研究领域.20世纪90年代初,CBIR系统的诞生[1]使众多计算机各领域的研究人员更倾向于对数字图像检索系统的研究.目前,有多种特征用来作为索引,大体上可分为低层视觉和语义内容这两类.低层视觉特征主要包括颜色、纹理和形状等;语义内容就是图像的含义,它包含着人类对图像的识别和理解,往往借助人类的知识推理.由于当今计算机视觉和图像理解的发展水平限制,还无法真正依靠基于语义图像检索,所以目前研究得比较多也比较成熟的检索算法大多都是基于图像的低层视觉特征.Ojala等人提出了用于纹理分类且具有旋转不变性的LBPs算子[2-4].随着研究人员对LBP旋转不变性的广泛研究,LBP也衍生出了各种形式.S·Murala等人[5]在此基础上使用球形对称的三维局部三值模式SS-3D-LTP,使用不同标准偏差值的高斯滤波器组的多分辨率图像,根据五个不同方向建立三维立体模型来实现特征提取.

1 纹理特征提取

本文纹理特征提取具体过程如下所示:

1)分离彩色图像R、G、B三通道色;

2)基于Haar小波基分别对三通道色进行二维离散小波变换,取LL低频子带;

3)建立球形对称模型,对五个方向分别采集样点,生成局部直角均值模式;

4)将局部直角均值模式分解转换为两个二值模式,并对二值模式直方图进行计算,将连接直方图形成特征向量.

2 局部直角均值模式

以R通道色LL低频子带为例.根据中心像素gc,半径R=2分别取α及(α+90°)方向上邻域像素gp,邻域像素个数P=8.通过比较α及(α+90°)方向邻域像素均值与中心像素(gc±μ)的关系确定二值模式下α方向上邻域像素取值,设固定阈值μ=2.局部直角均值模式计算过程如图1所示.图1中gpa(α=0°,45°,90°,…,315°)分别对应gpi(i=0,1,2,…,7).局部直角均值模式计算公式如下所示:

(1)

α=0°,45°,90°,…,315°

(2)

其中:gc表示中心像素,gPa和gpα+90°分别表示中心像素在α及(α+90°)方向上的邻域像素.

图1 局部直角均值模式

3 相似度度量算法及评价准则

3.1 相似度度量算法

通过计算待检索图像Q的特征向量fQ=(fQ1,fQ2,fQ3,…,fQLg)与图像数据库中图像的特征向量fDBj=(fDB1,fDB2,fDB3,…,fDBLg,j=1,2,…|DB|的距离实现图像检索.匹配图像的距离公式如下所示:

(3)

其中:fDBji代表数据库|DB|中第j幅图像的第i个特征,Lg表示图像数量.

3.2 评价准则

对提出方法性能的评价指标使用查准率和查全率来计算.对于待检索图像Iq,查准率计算公式见式(4):

(4)

其中:n表示检索到的相关图像数量,|DB|表示数据库大小,φ(x)表示x的类别.

查全率计算公式如式(5):

(5)

其中:NG表示与待检索图像Iq相关图像总量,φ(x,y)函数关系如式(6):

(6)

4 实验结果分析

本文使用Corel-1K数据库进行实验,该数据库包含10类图像(黑人,海滩,建筑,汽车,恐龙,大象,鲜花,马,雪山,食物),每类图像各100幅,图像大小均为384×256,图像内容丰富,适合作为数据库进行图像检索实验.

图2表示局部直角均值模式与SS-3D-LTP模式在数据库Corel-1K中的检索结果的比较,查询图像通过随机生成,通过查准率进行表示.图3通过查全率表示局部直角均值模式与SS-3D-LTP模式在数据库Corel-1K中检索结果的比较.红色曲线代表局部直角均值模式,蓝色曲线代表SS-3D-LTP模式.表1表示不同类别不同待检索图像数量的查准率表现情况.

Corel-1K数据库图像检索在查准率上局部直角均值模式与SS-3D-LTP模式比较实验结果表明(待检索图像定为30幅):在黑人图像中,提升23.33%;在海滩图像中,提升1.00%;在建筑图像中,提升7.66%;在汽车图像中,提升3.66%;在恐龙图像中,降低0.66%;在大象图像中,提升10.00%;在鲜花图像中,降低23.00%;在马图像中,提升33.00%;在雪山图像中,提升15.33%;在食物图像中,提升27.67%.通过实验结果分析可知,局部直角均值模式与SS-3D-LTP模式在查准率上相比,8类图像有所提升,2类图像有所下降,查准率平均提升9.80%.

图2 查准率在不同类别上的检索情况

图3 查全率在不同类别上的检索情况

Corel-1K数据库图像检索在查全率上局部直角均值模式与SS-3D-LTP模式比较实验结果表明(待检索图像定为30幅):在黑人图像中,提升18.10%;在海滩图像中,提升3.90%;在建筑图像中,提升2.60%;在汽车图像中,提升7.90%;在恐龙图像中,降低6.50%;在大象图像中,提升5.70%;在鲜花图像中,降低9.20%;在马图像中,提升20.90%;在雪山图像中,提升13.60%;在食物图像中,提升21.60%.通过实验结果分析可知,局部直角均值模式与SS-3D-LTP模式在查全率上相比,8类图像有所提升,2类图像有所下降,查全率平均提升7.86%.

表1 图像检索查准率情况(%)

数量类别 20406080黑人50.0049.5046.3344.38海滩28.0028.0025.8324.75建筑51.5042.5036.6733.38汽车57.5047.5038.3333.63恐龙98.0091.5084.3371.37大象36.5026.7522.8320.63鲜花58.5050.7544.0038.00马83.5075.7569.3361.63雪山50.0047.0044.0040.63食物35.0033.2530.3328.25平均值54.8549.2544.2039.66

5 结 语

本文提出一种新的纹理特征提取算法.检索实验结果表明,在Corel-1K数据库下该方法有良好的检索精度.在局部直角均值模式中,阈值选择初步选择为定值有一定的主观因素,将考虑使用局部自适应阈值代替,从而提高检索精度.我们还将尝试使用其他数据库进行实验,并继续探索更好的纹理特征提取方法.

[1]SMEULDERSAWM.Content-basedimageretrievalattheendoftheearlyyears[J].IEEETrans.PatternAnal.Mach.Intell, 2000, 22: 1349-1379.

[2]OJALAT,PIETIKINENM,HARWOODD.Acomparativestudyoftexturemeasureswithclassificationbasedonfeaturedistributions[J].PatternRecognition, 1996, 29(1): 51-59.

[3]OJALAT,PIETIKINENM,MENPT.Multiresolutiongray-scaleandrotationinvarianttextureclassificationwithlocalbinarypatterns[J].PatternAnal.Mach.Intell., 2002, 24(7): 971-987.

[4]PIETIKAINENM,OJALAT,SCRUGGST, et al.Rotationalinvarianttextureclassificationusingfeaturedistributions[J].PatternRecognition, 2002, 33(1): 43-52.

[5]MURALAS,JONATHANQM.Sphericalsymmetric3Dlocalternarypatternsfornatural,textureandbiomedicalimageindexingandretrieval[J]. 2015, 149(C): 1502-1514.

Study on image retrieval algorithm based on local right-angle mean patterns

HONG Tian-hao, SUN Hua-dong, JIN Xue-song, ZHANG Guang-yuan, ZHAO Zhi-jie

(School of Computer and Information,Harbin University of Commerce, Harbin 150028, China)

This paper proposed an image retrieval method based on texture feature. The texture feature descriptor was extracted in RGB color space. Isolated R, G, B three channel color images from the color images, and used two-dimensional discrete wavelet to transform three channel color images based on Haar wavelet basis, respectively extract low frequency sub band of them. The local right-angle mean patterns was used to reencode neighborhood pixels in the three-dimensional spherical symmetric patterns, reduced dimension by uniform local binary patterns, and took the histogram as the feature vector, such for realizing the image retrieval process. In this paper, through the experiments on the Corel-10K database, the analysis of the experimental results showed that this method has better performance in natural image retrieval.

CBIR; texture feature; local texture patterns; local right-angle mean patterns

2016-12-26.

洪天昊(1992-),男,硕士,研究方向:图像处理与识别.

TP391

A

1672-0946(2017)02-0172-03

猜你喜欢
查全率查准率直角
多少个直角
巧用“一线三直角”模型解题
化归矩形证直角
海量图书馆档案信息的快速检索方法
基于数据挖掘技术的网络信息过滤系统设计
基于词嵌入语义的精准检索式构建方法
大数据环境下的文本信息挖掘方法
初识“一线三直角”
基于深度特征分析的双线性图像相似度匹配算法
基于Web的概念属性抽取的研究