崔红静 景军锋 张缓缓 苏泽斌
(西安工程大学,陕西西安,710600)
近年来随着纺织行业的不断发展,织物背景、纹理复杂多样,织物样式呈爆发式增长,相应的纺织数据库也不断扩充。无论是织物设计、管理还是采购,判断样本图像是否存在于数据库中或者是否存在相似图像,是所有纺织企业所面临的问题。传统方法依靠人工记忆织物的特征、种类、库存位置等信息具有一定的难度,而且随着库存数据的增加,人工图像检索方式效率低下、主观性强[1],难以满足现代企业对纺织品图像快速、便捷的检索要求,因此建立一种有效的检索机制实现纺织品图像检索成为必然[2-3]。
基于内容的图像检索是以颜色、纹理、形状等作为图像的特征表达,提取这些底层特征进行特征匹配,从而实现检索。国内外许多专家学者做了相关研究。LI等提出了一种以累加直方图为特征的图像检索算法[4];方珍红等提出了一种利用模糊C均值聚类的方式构造加权主颜色直方图实现图像检索[5]。单一特征的图像检索无法全面描述图像信息,准确率较低,为了提高检索准确率,HUANG等提出将RGB颜色空间中的颜色矩与HSV颜色空间中的颜色直方图相结合进行颜色特征提取,采用灰度共生矩阵进行纹理特征提取,并将这三种特征结合起来实现图像检索,该方法只在目标区域与背景区域明显的图像上效果显著[6];CHEN等提出了一种新的基于多特征融合和稀疏编码的图像检索框架,提取图像的高斯拉普拉斯特征和SURF特征,引入稀疏表示模型衡量图像相似性,但该方法计算量较大,检索时效性较差[7];翟奥博等提出了一种改进双树复小波和灰度-梯度共生矩阵相融合的纹理图像检索新算法,没有考虑图像颜色特征,不适合纺织图像的检索[8];向忠等提出了一种综合花形边缘和颜色特征的图像检索算法,但该方法对边缘提取的质量要求较高[9];吴庆涛等提出一种融合改进的颜色直方图和灰度共生矩阵算法的新图像检索算法,但该方法仅适用于方向纹理明显的图像[10]。以上研究都证实了多特征融合检索方式的可行性,但如何在颜色、花形、纹理复杂的织物图像中实现图像检索,是纺织行业亟待解决的问题。针对织物图像具有颜色丰富且背景、纹理复杂的特点,提取单一特征很难描述其全局信息,本文提出将多特征融合的检索算法应用到纺织行业。该算法将传统的分块颜色直方图进行改进,并融合边缘方向直方图特征来实现图像检索。
本文从织物图像的视觉特性出发,提取图像的颜色特征、边缘特征,将提取到的特征进行特征融合,对待检索图像特征与数据库图像特征进行相似性度量,根据相似程度进行排序并显示检索结果。
RGB颜色空间作为工业界的一种颜色标准,无法模拟人类感知颜色的方式,应用HSV颜色空间来描述颜色符合人们的视觉习惯。在基于内容的图像检索中,根据人眼视觉特征将图像从RGB颜色空间转换成HSV颜色空间。
颜色空间量化是进行颜色特征提取之前很重要的操作,进行颜色空间量化时量化距离越小,图像检索精度就越高,但量化距离过小又会产生人眼不能分辨的颜色;量化距离越大,颜色信息的损失就越多,所以对颜色空间的H、S、V分量做非等间隔量化,构造特征矢量,分别提取HSV颜色空间3个通道的颜色特征。
颜色直方图描述不同色彩在整幅图像中所占的比重,是图像检索系统中应用较广泛的一种方法。直方图特征提取简便并容易计算,具有图像尺度不变性和旋转不变性等特点。传统的颜色直方图描述图像颜色的概率统计特征,丢失了颜色的空间分布信息,因此本文提出改进的分块颜色直方图。
传统的分块策略是3×3分块模式,该种分块方法简单且易于实现,但它并没有考虑各子块之间的内在联系,针对人的视觉注意机制,总是先注意到中心位置的图像信息,所以将一幅织物图像按图1的方式分成5个区域:左上角、右上角、右下角、左下角、图像的中心。具体分块步骤:第一步,对于一幅纺织品图像h×w,首先计算图像的中心坐标(cx,cy);第二步,将图像按照2×2模式分为4个区域;第三,选取半径分别为a=(0.75×w)/2、b=(0.75×h)/2的椭圆作为中心区域(区域5),椭圆区域的中心即为图像的中心坐标。
(a)原图
(b)分块后图像
图1 图像分块
每张图像分别提取各个子块区域的颜色特征,对颜色空间做非等间隔量化。经试验,将色调H分为8份,饱和度S分为3份,明度V分为3份时检索效果最好,即将量化后的3个颜色分量合成一个72维的特征矢量,每张图像可得到一个360维的特征向量。
边缘特征作为判断织物类别的重要特征,在基于内容的图像检索中可有效地进行区域性表达[11]。边缘方向直方图特征提取方法是基于轮廓的形状描述符,在边缘检测的理论基础上提出的一种形状边缘特征的提取方法。首先使用Canny算子对灰度化后的织物图像G(x,y)进行边缘检测,提取图像的边缘点[12];其次计算各个像素的边缘方向,计算公式见式(1);最后统计各方向像素的数目,并以此作为一组特征向量存储成特征向量库。
(1)
式中:Gx、Gy分别为x方向和y方向的导数,∠Gxy即为梯度向量的方向。
分析织物图像特点,为了更好地区分颜色分布相近但织物种类不同的图像,将提取到的边缘方向由-180°~180°量化到0°~45°,即方向被量化为8个bins。不同种类图像的边缘直方图对比如图2所示。其中,图2(d)、图2(e)、图2(f)分别为图2(a)、图2(b)、图2(c)的边缘方向直方图,图2(a)、图2(b)为相同种类的织物图像,图2(b)、图2(c)为颜色分布相似的图像。对比分析其对应的边缘方向直方图可知,本文提出的边缘方向直方图可以很好地区分颜色分布相近但形状结构不同的图像,弥补了单一颜色特征检索方法的不足,使检索精度更高。
(a)织物图像1
(b)织物图像2
(c)织物图像3
(d)直方图1
(e)直方图2
(f)直方图3
图2 不同织物图像及其边缘方向直方图
相似性度量能够反映两幅图像之间的相似程度,一般通过计算两个特征向量之间的距离来实现[13]。使用的距离定义方式不同,将直接影响检索算法的准确率。卡方距离可以有效地反映特征向量之间相对距离的变化,用卡方距离构建的相似度计算方法可以获得更优的检索性能。
卡方距离是根据卡方统计量得出的,卡方相似度为0的图像被认为是相同图像,随着卡方相似度值的增大,图像之间的相似度降低。卡方距离计算见式(2)。
(2)
式中:ai和bi分别表示待检索图像A与图库中图像B特征向量中的第i个值,D(a,b)为A和B之间的卡方距离。
颜色特征与边缘特征均利用上述卡方距离来衡量两张图像的相似度,并采用加权平均融合颜色和边缘特征的距离,则查询图像与图库中某一图像的距离见式(3)。
D(a,b)=ϖ1D1+ϖ2D2
(3)
式中:ϖ1为分块颜色特征的权值,ϖ2为边缘特征的权值,且ϖ1+ϖ2=1,D1和D2分别表示颜色特征和边缘特征的卡方距离。
为验证本文提出算法的检索性能,仿真试验在MATLAB R2014a上运行实现,计算机硬件配置为英特尔i5-4460,CPU主频3.20 GHz,4 GB内存,操作系统为Windows 10。选取工业现场采集的织物图像数据集作为试验样本,根据不同花形图案的特点,将织物大致分为点状织物、格子织物、花卉织物、条纹织物、涡纹织物、文字织物等6类图像,每类图像各200张,共1 200张。试验时从每类图像中随机抽取20幅图像进行检索,总共进行120次查询,其中每次检索都选取前10幅最相似的图像作为试验显示结果。利用查全率和查准率作为试验性能评价标准,对于每类图像而言,将其20次检索结果的查准率平均值和查全率平均值,作为该类图像检索结果的平均查准率和平均查全率。查准率及查全率的公式见式(4)、式(5)。
(4)
(5)
式中:M表示一次检索得到的相关图像数,N表示图像库中与待检索图像相关但未检索到的图像数,P表示检索到与待检索图像不相关的图像数。
在织物图像检索系统中,图像通常由多个视觉特征来表示。颜色信息是信息量最大的特征,而边缘信息可以作为另一个重要的空间特征。在该系统中,为了在颜色和边缘特征的融合中选择合适的权值,在不同权值上对上述随机抽取的120幅图像进行检索精度的测试,检索平均查准率见表1。
表1不同权值下的平均检索查准率
1,2各花形平均检索查准率/%花卉 格子 条纹 文字 涡纹 点状平均检索查准率/%0.1,0.90.2,0.80.3,0.70.4,0.60.5,0.50.6,0.40.7,0.30.8,0.20.9,0.144.545.046.062.570.086.578.568.066.043.545.552.058.068.078.067.564.062.572.082.093.594.096.598.074.567.558.548.552.058.564.568.572.062.561.558.043.046.056.056.574.076.566.564.053.546.548.059.072.072.574.068.562.558.049.6753.0860.8367.9274.9280.8369.6764.5859.42
由表1可以得出,当ϖ1=0.6 ,ϖ2=0.4时,该检索算法在各个织物种类上的平均查准率最高,平均检索查准率为80.83%,且对条纹以及花卉织物的检索效果较好,条纹织物的平均检索查准率高达98%。部分织物图像检索效果如图3所示,其中图3(a)和3(b)的检索结果理想,但图3(c)的检索结果中出现了误检现象,第9张将方格织物检索为条纹,出现此类情况的原因是由于织物中含有条纹和方格两种特征,但在检索图像库中人为将其划分为方格织物。
(a)检索1
(b)检索2
(c)检索3
图3 不同类别织物图像的检索结果
为验证本文算法的优越性,对比单一分块颜色特征与文献[14]算法,文献[14]采用改进的颜色特征融合Hu不变矩形状特征进行检索,不同检索算法的平均查准率及查全率如图4所示,检索效果如图5所示。可以看出,对于一幅点状织物图像,基于分块颜色直方图的检索算法只检索出一幅相关图像,文献[14]中算法检索到3幅点状图像,而本文算法检索出的图像均为点状织物图像。单一的分块颜色直方图特征检索只能检索出与待检索图像颜色相近的图像,受颜色特征影响较大,所以不适合颜色丰富的纺织品图像检索;与文献[14]的检索方法相比,本文算法对织物检索有较高的针对性,能获得较好的检索效果。
(a)不同算法的平均查准率
(b)不同算法的平均查全率
(a)本文算法
(b)分块颜色特征检索
本文在借鉴前人特征融合算法的研究基础上,针对织物特点,提出了一种基于分块颜色直方图和边缘方向特征的图像检索算法。该算法采用分块颜色直方图获取颜色信息,边缘检测算法提取边缘特征,最后加权融合两种特征进行检索。该检索系统有效地解决了单一分块颜色特征检索准确率低的问题,能够应用到织物图像的检索中,提高了图像检索的平均查准率。