摘 要:本文针对目前基于单一特征检索方法存在的不足,提出一种基于多特征融合的图像检索方法:首先为了融合图像的空间信息特征对图像进行区域的划分,然后对各分割区域提取颜色及形状特征。基于民族服饰的颜色特征比较重要,本文在颜色特征还采用了模糊颜色直方图的方法提取。最后采用相似性度量公式进行检索。通过实验表明,采用以上这种三个特征融合的图像检索方法,能提高图像检索的效率。
关键词:图像检索;颜色直方图;模糊颜色直方图;边缘方向直方图;少数民族服饰
DOI:10.16640/j.cnki.37-1222/t.2017.01.254
1 引言
少数民族服饰的保护与开发是民族文化传承与弘扬的重要内容之一。关于少数民族服饰以研究民族服饰文化和文化差异的居多,但是关于民族服饰数字化方向研究较少。
每个民族的服饰都有自己的民族特色。民族服饰有着显著的视觉特征,很多学者从纹样、色彩、形状图案等美学、文学、艺术角度对民族服饰进行了深入的研究。 民族服饰纹样作为一种标识性的符号,反映着非常丰富的文化内涵,是一个民族文化艺术的宝库,具有非常丰富的审美价值和研究价值。民族服饰中色彩的不同运用,显示出不同的民族心理、审美习惯和审美追求。不同的民族,其服饰的色彩也有不同的偏好。图腾作为一个氏族的标志之一,可看做这个民族的独特标志。综上所述,纹样、色彩、形状图案等特征对民族服饰辨识和认知的重要性显而易见[1]。相比普通自然图像的视觉特征,民族服饰的绚丽色彩、纷纭纹样和丰富图案的突出特点,在图像处理方面显得更具优势。其主要特征仍然表现在服饰颜色、面料纹理和图腾形状上,在此基础上,将这些底层视觉特征合理映射到服饰的抽象语义,进而利用图像特征对民族服饰图像检索。
2 基于内容的图像检索相关技术
2.1 特征的提取技术
特征提取是提取能够表征图像底层内容含义的颜色、纹理、形状、位置等视觉特征,并抽象为特征数据的过程。首先对图像中所有的像素点进行遍历,然后用通过一些方法来运算、统计,最后确定像素所属的特征。
(1)颜色特征:颜色特征是通过图像或图像区域的颜色特征来描述。颜色是人们视觉感知中基础的部分,同样也是底层视觉特征一个重要的部分。颜色特征具有对旋转、尺度、平移等变化不敏感的优点,具有很好的鲁棒性。目前广泛应用的颜色特征有颜色直方图、颜色矩、颜色集、颜色聚合向量及颜色相关图等方法[2]。本文选择颜色直方图和模糊颜色直方图。
颜色直方图:其核心思想是在颜色空间中采用一定的量化方法对颜色进行量化,然后统计每一个量化通道在整幅图像中所占的比重,获取图像的颜色组成分布。最常用的颜色空间是RGB颜色空间。具体来说,获取颜色直方图的过程:首先将颜色空间RGB三个通道分别量化划为若干个子颜色区间(假设为k个,三个通道就有k^3个),然后把三维的颜色空间转成一维的进行累加,每个颜色区间对应直方图中的一个bin。最后统计图像中所有像素颜色落在每个bin中的个数,从而获得颜色直方图。颜色直方图可用如下一维离散函数表示:
,x=0,1,...,k^3-1
其中x为直方图的子区间,f (X)为落在区间x中的像素个数,N为图像中所有像素个数。
模糊颜色直方图:在模糊颜色直方图中,选择了Lab颜色空间,是因为它是一个近似于人类感知颜色方式的统一颜色空间。在 Lab空间,L代表亮度,a表示相对绿色到红色的变化范围,b表示相对的蓝色到黄色的变化范围。a和b组件应该分别分为五个区域,a代表绿色,浅绿色,中间色,浅红色和红色。b 代表蓝色,浅蓝色,中间色,浅黄色和黄色,而L应该只分为三个区域:黑暗的、暗淡和明亮的区域。输入的模糊性是通过使用三角形状内置的(MF)三个输入组件(Lab)表示区域[4]。
应用Mamdani类型的模糊推理,在输出MFs形成模糊集决定过程是基于输入MFs的结果,此影响因素设置最小,与、或运算分别设置最大和最小。系统的输出只有10 维,见图1所示。所以,最终的模糊直方图组成只有10个通道[5],大致代表黑色,暗灰色,红色,棕色,黄色,绿色,蓝色,青色,洋红色的和白色的。
模糊连接三个组件根据27个模糊规则产生系统的输出。规则通过实证结论建立。部分规则如图2表示。
(2)形状特征:形状特征是人们识别物体的关键特征之一,并且具有一定的稳定性,对于背景颜色、亮度变化等比较鲁棒。形状一般与图像中的特定物体联系紧密,具有一定的语义信息。形状特征的好坏一般用独特性、几何不变性、完备性、灵活性及抽象性来考察。目前用于图像检索的形状描述方法主要有基于边缘和基于区域两种形状描述方法[3],本文采用基于边缘的形状描述方法。
本文先将图像的R、G、B三个分量分别与Sobel算子的两个卷积模板作卷积,可分别获得三个分量上的横向梯度和纵向梯度,再根据梯度计算图像的边缘方向。 方便计算,把的取值映射在区间,并把均匀量化为个梯度方向。然后形状特征直方图表示:
是梯度方向的量化级数,是图像中梯度方向为的像素的个数,是图像像素的总数。
2.2 距离公式及检索评价
(1)在图像检索中常用的距离公式: 距离函数,计算的是两个向量之间的距离,函数值越大表示两个向量越不相似[3]。常用的距离公式有:欧式距离、曼哈顿距离、马氏距离、直方图相交距离、明可夫斯基距离。本文采用的是改进的曼哈顿距离作为相似性度量方法。
是检索图像Q特征的第i维分量,是图像库中图像T特征的第i维分量,n是特征维数。
(2)检索评价。现有的图像检索系统的评价函数主要用查全率和查准率来衡量,前者反映的是系统检索相关图像的能力,后者反映的是系统拒绝不相关图像的能力。查准率(precision)是图像检索返回的所有结果中正确的图片数占所有返回图片数的比重。查全率(recall)是图像检索返回的所有结果中正确的结果数占图像数据库中所有与查询图像同一类的图像数目的比重。
2.3 本文特征提取的思想路线及步骤
(1)特征提取思想路线。
(2)特征提取步骤。把图像分成N*N的块,再计算每一个分块的颜色直方图、模糊颜色直方图和彩色边缘方向直方图,最后把这些直方图进行线性组合,得到最终的直方图,作为图像的特征。具体步骤:
①遍历图像的所有像素点,并判断属于哪个分块;②求子块的颜色直方图;
③求子块的模糊颜色直方图;
④求子块的彩色边缘方向直方图;
⑤把所有子块的颜色直方图模糊颜色直方图和边缘方向直方图进行线性组合得到图像的综合特征:
3 相关实验及分析(见表1)
结果分析:颜色直方图量化级数、边缘方向的量化级数、分块的大小都对结果又影响。颜色直方图随着分块的越来越细化,结果先升高后降低,说明2*2分块颜色直方图效果最好。而模糊直方图、边缘方向直方图随着分块的越来越细化,结果越来越高,但是分块越多,特征的维数越大,检索的时间也会增加。综上,取2*2分块,效果最好。
4 小结
针对民族服饰颜色比较丰富的特点,本文提出了一种融合颜色和形状特征的图像检索方法,先将图像进行分块,再提取各子块的颜色直方图、模糊颜色直方图和边缘方向直方图进行线性组合,并使用改进的相似性度量公式进行检索。实验结果表明,该方法更适合少数民族服饰的特点,检索效果比较好。因为本文中用到的少数民族服饰图像背景复杂,并且提取的是底层图像特征,因此以后将着重研究基于图像分割、基于区域和基于语义的图像检索方法。
参考文献:
[1]徐红梅.民族服饰文化传承中的图像记录研究—以互助土族服饰为例[J].民族艺术研究,2013(03).
[2]王志瑞,闰彩良.图像特征提取方法的综述[J].吉首大学学报,2011,32(05).
[3]杨杰.面向图像检索的海量图像自动聚类方法研究[D].北京交通大学,2015.
[4] Y.Liang, H. Zhai,P.Chavel,Opt.Commun.212(2002)247.
[5]M.Tico,T.Haverinen,P.Kuosmanen,in:Proceedings of the Nordic Sig. Proc. Symposium (NORSIG2000), Kolmarden,Sweden, 2000,157-160.
基金项目:云南省教育厅科学研究基金研究生项目"基于LIRE的民族服饰图像教育资源检索研究"(2016YJS047),云南师范大学研究生科研创新基金项目“少数民族服饰视觉特征抽取算法研究”(YJS201662)
作者简介:赵伟丽(1989-),女,山西吕梁人,硕士研究生,研究方向:图像处理。