一种基于加权颜色形状特征和LBP-GLCM纹理特征提取的服装图像检索方法

2019-08-14 02:16缪智文何丽嘉刘洞波
纺织报告 2019年4期
关键词:直方图形状检索

缪智文,何丽嘉,刘洞波

(湖南工程学院,湖南湘潭 411104)

当今,在服装网络销售蓬勃发展的大势之下,传统的基于文本的图像检索技术(Text-based Image Retrieval,TBIR)[1]已经跟不上时代的发展,无法满足广大消费者对图像检索的要求。而基于内容的图像检索技术(Content-based Image Retrieval,CBIR)[2]是通过有效的算子获取图像的基本特征,如空间、形状、纹理及颜色信息等,从而利用距离函数来计算图像的相似度以达到精度检索的目的,此技术可取代TBIR在图像检索中的位置,并弥补其不足。

本研究提出一种运用颜色直方图和 Hu不变矩的特性进行加权处理,再融合 LBP-GLCM纹理特征进行服装检索的方法。首先,提取样本中的颜色和形状特征并进行加权处理后,完成检索的第一步,再对返回的检索结果构建新的数据集,将Uniform-LBP算子与灰度共生矩阵相结合,完成检索,使之具有更高的检索效率和准确率。

1 颜色和Hu 不变矩特征的检索

1.1 基于颜色划分的颜色直方图和改进颜色矩的融合

一个好的颜色量化方案[3],一方面可以降低计算的复杂度,另一方面也不会丢失过多的彩色信息。根据颜色直方图改进方案,将色调 H 把颜色划分为8类,形成8 bin的直方图;将符合人眼视觉的基于HSV颜色矩9 bin直方图和8 bin直方图结合形成颜色融合的17 bin 直方图,不仅有效地降低了颜色直方图的权柄数,节省存储空间,实验结果验证其并未降低图像的检索效率。本实验使用常用的欧几里德距离计算进行相似性度量[4],并归一化处理。计算公式如下:

其中,x,y—为两幅待检测的图像,xi,yi—归一化后的特征值,相似性度量用d(x, y) 表示。

1.2 形状特征

服装由于季节变更和穿着身材等因素,产生了许多不同款式的样体。在服装图像中,大衣、长裤、短裤、衬衫等都有其固定的形状特征,不同款式的服装也有其各自的几何属性。形状的表述对于图像识别及分类具有重要的作用,在图像检索中也是持续研究的课题[5]。目前,系统呈现形状特征通常是基于区域和轮廓。两类方法在图像识别中应用较多的是 Hu不变矩描述子[6]和傅里叶描述子[7]等。傅里叶描述子从信号频率的角度来解释轮廓信息,对人的视觉属性存在局限性。Hu 不变矩描述子注重几何形状的全局特征,具有空间几何不变性。图像f(x, y)的 q+p阶矩和阶中心距公式为:

重心坐标的计算公式为:

Hu 提出了如下的 7 个不变矩:

2 纹理特征

2.1 旋转不变LBP算法

多尺度的LBP算法所得到的LBP值与二进制序列的起始位置和选取方向密切相关。如果图像发生旋转,对应的二进制顺序就会发生变化,最终的LBP值也将不同。因此,为了得到不变的编码模式,Ojala等[8]又提出了旋转不变LBP算法,即不断旋转圆形邻域得到一系列初始定义的LBP值,取其最小值作为该邻域的LBP值,用公式表示如下:

式中,ROR(x,i)—对二进制序列x循环移动i位且 i<P。

对于P=8,将有36种唯一的旋转不变二值模式。由于此时的编码模式仍较多,应用到服装纹理特征提取时,计算量较大,影响检索速度。

2.2 Uniform模式

在记录阈值化后的二进制序列时,如果选取的起始点和方向不同,二进制序列将有 2P 种,对应的LPBP,R会产生2P种模式。但是在实际研究中发现,各种模式所出现的频率是不同的。统计结果表明,少数的模式出现的数量占所有模式的90%以上,Ojala等[2、4]将这些出现频率特别高的模式定义为Uniform模式。将二进制序列看作一个圆环,如果“0→1”和“1→0”的变化不超过 2 次,则该序列称为Uniform 模式。例如,“00000000”(0次转变)、“00011100”(2次转变)是 Uniform 模式,而“10010011”(4次转变)不是 Uniform模式。在使用LBP算法对图像进行纹理分析时,通常只关心 Uniform 模式,而将其他模式归为同一类称为混合模式。判断某种序列是否为Uniform模式的方法如下:

这样改进后,模式的种类大大减少,特别是对于P= 8的情况,模式数量由改进前的256种变为改进后的58种。

2.3 Uniform-旋转不变LBP算法

经过抗旋转的编码方式获得了若干LBP模式,但是通过前面Uniform 模式的论述可知,其中某些模式在所有的模式中并不是占有大量的比重,故又有人提出Uniform-旋转不变LBP算法,使模式种类减少到P+1种,表示如下:

uniform-旋转不变LBP算法,既保证了旋转不变性,又使模式数量大大减少,应用到服装图像检索可提高相似度检索的效率和精度。

3 实验及结果分析

3.1 实验平台和数据

实验平台为Windows 7操作系统,实验工具是MATLAB 2016a。以此分别进行:单一的颜色特征检索、单一的形状特征检索、累加颜色直方图和Hu不变矩的加权检索以及本研究的检索方法。数据库中,从互联网选取共计600张服装图像,其中大衣150张,短裤150张,长裤150张,短裙150张。

3.2 实验方案和评价方法

完成6组实验:不同颜色特征和 Hu 不变矩的各自单一特征的服装图像检索。对4次实验结果分析比较,选择颜色特征和形状特征进行加权处理完成第5组实验,实现对加权参数的确定。先用加权特征完成第一步检索,再使用 LBP算法进行再次检索作为第6组实验。实验时,从每个分类图像中随机选取10张图像作为查询图像,进行40次查询实验。每次的查询结果取返回的前20张图片,计算前20个检索结果平均查准率并引入排序评价方法[9]。

查准率:

式中,A—相关图像的集合,B —返回图像的集合,a —返回结果中被正确检索图像,b —返回结果中被误检的图像。

排序评价方法:假定检索输出的数目为N,在N幅输出结果里,NR—结果中相关的数量,ρr—返回结果中相关图像的排列序号,NA—实际相关数量,则评价参数定义如下[10]:

用 K1表示平均序号:

最佳情况的平均序号 K2:

其中, K2—处于最佳状态下,排列靠前的平均序号中返回结果期望图像都能够占据相应位置。如果K1/ K2的值与数值1的差值越接近于0,则意味着查询的效果越好。

3.3 实验结果和分析

以大衣的检索返回结果作为各组实验的方法展示,图样如图1所示。以服装图像中的大衣为示例进行检索的返回结果,如图 2所示。 表1是以大衣图像为例,进行颜色形状加权系数选定的参数。表2是以大衣为例检索的平均排序比值。表3是取长裤、短裙、大衣、短裤,进行实验,得出全局颜色直方图、颜色矩、累加颜色直方图、Hu不变矩、颜色形状加权、本实验方法平均查准率。

图1 待检测男性大衣图样

图2 方法检测结果

表1 以大衣的图像进行颜色形状加权系数选定的实验

表2 以大衣为例检索的平均查准率

表3 六组实验的平均查准率

由返回结果可以看出,图像中相关图像较多,相似度很高的图像在检索输出中都排序靠前,可实现良好的检索期望。由表1可以看出,不同的加权参数设置会产生较大的差异。因此,选择为20%颜色特征和80%形状特征的加权。依据表2、表3的数据分析可以看出,相较于其他的方法,本研究的检索方法有更高的查准率。由此可知,服装图像背景干扰因素对检索结果产生的不利影响。

4 结语

本研究提出了一种基于累加直方图与Hu不变矩加权特征和LBP的服装图像检索方法。实验先利用颜色形状特征加权处理的同步组合检索进行第一次检索,后利用 LBP算子进行第二次检索的检索方法具有可行性。与只使用一种特征检索的方式比较,本研究的检索方法在服装图像的场景中能提升检索的准确率。由实验结果分析可知,检索结果的精确性受到了来自服装图像的背景干扰,下一步的研究工作在于引入图像分割的方法对服装图像进行处理,并结合其他特征算子提高检索的准确率和优化检索时间。

猜你喜欢
直方图形状检索
挖藕 假如悲伤有形状……
符合差分隐私的流数据统计直方图发布
用直方图控制画面影调
你的形状
中考频数分布直方图题型展示
火眼金睛
专利检索中“语义”的表现
基于空间变换和直方图均衡的彩色图像增强方法
国际标准检索
国际标准检索