一种基于HSV颜色空间的藏毯图像检索方法

2016-11-09 08:21孙琦龙张明亮
微型电脑应用 2016年4期
关键词:直方图特征提取检索

孙琦龙,张明亮



一种基于HSV颜色空间的藏毯图像检索方法

孙琦龙,张明亮

针对国内外还没有可供研究人员和公众使用的藏毯类非物质文化遗产数字化资源平台这一状况,分析了在藏毯图像中运用基于内容的图像检索系统技术的可行性。通过对藏毯图像的颜色特征分析,针对传统HSV颜色空间量化的缺陷,根据图像颜色在HSV空间153维中的相同或不同的分布特点,将其他量化点按颜色相似距离最短的原则组合为一个聚类,从而达到既能聚类出代表图像的颜色又能减少颜色数目的目的。通过查准率与时间消耗的比较,实现了一种优化的153维量化方法。

藏毯;图像;量化;特征

0 引言

藏毯在藏族传统艺术的基础上,吸收、融合了汉族、印度和尼泊尔宗教艺人的精华,并且形成了具有自己独特的藏族艺术风格的工艺美术品,其图案设计和色彩源于藏传佛教文化,艺术价值极高,是珍贵的非物质文化遗产。随着近年来非物质文化遗产保护工作的不断深入,以及非物质文化遗产数字化、信息化的科技进步,全国各地非物质文化遗产数据库建设步伐不断加快,在分析藏毯的纹理特征、色彩分布和形状特征的基础上,即可以支持基于文字以及图像属性的查询,又可以提取藏毯图像的关键特征值来实现基于内容的图像检索。利用非结构化的存储和检索技术,不仅使数据存储的类型更加灵活多样,同时提高了藏毯图像检索的效率。本文在研究基于内容的图像检索方法的基础上,经过改进,提出了一种针对藏毯图像的基于HSV颜色空间的图像检索算法,为藏毯这一非物质文化遗产的保护和继承提供了技术支撑平台。

1 基于内容的图像检索方法

基于内容的图像检索(Content-Based ImageRetrieval,CBIR)近年来已成为提高图像检索的有效手段,传统的基于文本的图像检索技术,通过图像的描述文字和用户输入的关键字进行比较,检索结果不仅效果差并且不能对未标注文本信息的图像进行检索[1]。基于CBIR技术的图像检索系统,采用相似性匹配算法计算关键图像特征与特征库中图像特征的相似度,然后按照相似度从大到小的顺序将匹配图像反馈给用户。用户可根据自己的满意程度,选择是否修改查询条件,继续查询,以达到令人满意的查询[2]。CBIR的实现依赖于两个关键技术:图像特征提取和匹配,而图像特征提取又分为低层视觉和语义内容。目前比较成熟的检索算法大部分是基于图像的低层特征,即利用图像的颜色、纹理、形状特征来检索。而在基于内容的图像检索中,颜色作为图像的一种重要视觉信息,己得到广泛应用。颜色是图像内容组成的基本要素,作为图像最直观而明显的特征,颜色特征是在基于内容的图像检索中最早、最广泛使用的视觉特征,常用的颜色特征包括颜色直方图、颜色距、颜色聚合向量、颜色协方差矩阵等。

2 HSV颜色空间

相对于其它的图像特征,颜色特征非常稳定,不局限于图像的大小和方向,并且对于旋转、平移、尺度变化,甚至各种变形都不敏感,表现出相当强的鲁棒性,因此在基于内容的图像检索中发挥着重要的作用,这也使得颜色特征成为图像检索中应用最为广泛的底层视觉特征。

2.1 颜色模型

2.1.1 RGB

在RGB模型中,红、绿、蓝这3个基本颜色的不同组合构成了所有颜色,将这3种颜色划分成256(0-255)个等级。各个分量的数值越小,亮度越低;数值越大,亮度越高。如(0,0,0)表示黑色,而(255,255,255)又表示白色。一般通过一个真彩色像素用8位表示3颜色分量时,需要24位(3个字节)来表示RGB的三种颜色,总共可以表示16777216种。RGB颜色模型通常采用单位立方体来表示,在正方体的主对角线上,各原色的强度相等,产生由暗到明的白色,也就是不同的灰度值。正方体的其它6个角点分别为红、黄、绿、青、蓝和品红,RGB颜色模型所覆盖的颜色域取决于与硬件相关的显示设备荧光点的颜色特征。

2.1.2 HSV

HSV(hue,saturation,value)模型对用户来说是一种直观的颜色模型,直接对应于人眼的视觉特征,H表示色度、S表示饱和度、V表示亮度。HSV模型对应于一个圆锥形子集,包含RGB模型中的R、G、B3个面。色度H定义为绕圆锥中心轴的角度,取值范围为0°~360°,从红色开始按逆时针方向计算,红色为0°,绿色为120°,蓝色为240°。饱和度S定义为横截面圆心到横截面圆周点的距离,取值范围为0~1,S取值越大,表示色彩越纯,取值越小,表示色彩越灰。亮度V定义为圆锥横截面的圆心到圆锥顶点的距离,表示色彩的明亮程度,取值范围为0~1。

2.2 颜色特征提取

常用的颜色特征提取方法都建立在颜色直方图的基础上,主要做法就是统计图像中各种颜色出现的频数,它不关心颜色所处的空间位置。颜色直方图将颜色空间划分为若干小的颜色区间,每个区间对应于颜色直方图的一个柄,然后统计落在每个小区间的像素数量,最终得到颜色直方图。在颜色直方图坐标中,横坐标表示颜色柄的划分值,纵坐标表示每个柄区间中包含的图像像素总和。

3 传统的HSV颜色空间量化

HSV的颜色空间包含3个分量:H、S、V,如果分别对这3个分量建立颜色直方图进行特征提取和匹配,则会带来检索的“伪相似度”和相反的结果集。所以在降低颜色数量的同时,一方面不削弱各种颜色间的关联,另一方面又能提高检索精度和检索效率,对H、S、V 3个分量进行非等间隔分割。将色调H分成8份,饱和度S的范围由圆心向圆周过渡,将其分为3份,亮度V划分为Black,Gray,White3份,各自量化区间为:

HSV颜色空间被划分为72个不同的空间区域,再将三个简化后的颜色分量合成一维特征向量值,就将整个HSV颜色空间量化为72种颜色,减少了HSV颜色空间的有效颜色数量,简化了颜色特征提取的复杂度。通过量化公式I=9H+3S+V计算,最终得到72柄的一维颜色直方图,I的取值范围为[0,71]。

4 一种改进的HSV颜色空间量化方法

4.1 聚类颜色

1、藏毯图案较鲜艳且复杂,采用颜色量化中的聚类方法,用少量的代表色代表整个藏毯图像。首先将藏毯图像从RGB颜色转换到HSV颜色空间,因为在HSV颜色空间中,根据两种颜色之间的距离来评价颜色的相似度。考虑到藏毯图像颜色特征在整个空间中的分布状况,虽然采用比较大维的量化可以提高检索效果,但考虑到计算量和存储容量的限制问题,因为数据库表中一行的容量最大为8060字节,所以只能使用量化降维方法。同时,为了避免出现某些空间中像素数量非常稀疏的情况,使量化更为有效,把HSV颜色空间量化成153维,根据图像颜色在HSV空间153维中的相同或不同的分布特点,均匀地选取若干个量化点,然后将其他量化点按颜色相似距离最短的原则组合为一个聚类,从而达到既能聚类出代表图像的颜色又能减少颜色数目的目的,经过反复实验,得到像素点分布在153维时量化降维处理结果最佳。具体处理方法为:

在实验中提取图像中每一个像素点的RGB值并转化为HSV颜色空间后,简单聚类如下:

H:H空间分为36类,取值为0~35,h均匀间隔为10,即h=(0,10,20,30……,360);

S:S空间分为4类,S取值为0~3,S均匀间隔步距0.25(0.173,0.423,0.673,0.923);

V:V空间分为4类,V取值为0~3,V均匀间隔步距0.25(0,0.25,0.5,0.75)。

然后按照以上的量化级构造一维特征矢量,把3个颜色分量合成一维特征矢量:L=4H+3S+V,这样,H、S、V3个分量在一维矢量上分布开来.根据上述公式,计算L的取值范围为[0,152],最终获得153柄的一维直方图。

4.2 平均分块策略

采用平均分块策略,将一幅图像平均分为25块,编号为H0~H24,分别存储这25个子块的颜色特征,经过处理之后用于相似度计算,同时根据采集到的藏毯图像特点决定各个子块的权重。在图像库中图像中间子块(H6、H7、H8、H11、H12、H13、H16、H17、H18)的权重较大,因此,本文中对图像中间子块的权重做加大处理。分配方式如下:中间9个子块权重为1 /3,其中每个子块的权重为1 /27,周围16个子块的权重为1 /24。本文实验中以普通藏毯图像为例,每个子块H分类的结果如下:数组中的每个数字代表该类中的像素点的个数。由于实验图像库中图像大小是400×400个像素点,平均分成25块后,每一块的像素数为6400:

H[0]:610 1113 4020 36 27 283016 6033465078200300 531 810 1086 900400 180 160 166180160 150 161200 22160 1021;

H[1]:5 0 11 20 30 8 263356 757618 25 26 1064 17 300 531 566 168100 128 188 190262 282 358400 440 527 881 460 166 16;

H[2]:1025 0 22 605066 55 20 26 36 56 76 180 667776 678900601201 569011098 112 201232 287 169 170 1866033 1020931 11 10;

H[3]:10216 101720132021 26565080166155 136169700902 1008 536366456162 9919819930020016016 10 302029 11 31;

H[4]:201012 0 0 17 628 1629 2020 30 2022 68 909280299 372 600516 160 190160420399616 689660200 186200 100 20 2013;

H[5]:10 0 20 12 16263025 20 33 23 1006416072 135 190851608090 216300606206382181 350 336 286300326 330323200506506618 2011 16 1000 10;

H[6]:1027 203002615 5037 70 86120 67 80 50 119 369 778610 268268506 156303 303518500440330 100 25 27 30 1630 16

H[7]:16 2010 18 30608090627986 101196 156 102 156296 206506600638286366368369226267196309 180109 8090102016;

H[8]:1010 26303060118 582960136 162 155 228 226 216 400506800606250280293 283 211326281 271 80 100 2019 16 6038 16;

H[9]:1610 20 21 1632 1068 72 60 66 103 185 217 216310 200 308 380 318 621 555 572 327 340 353 403 201129 160 4611 10 1810 16;

H[10]:12 20 20 26 60 3963566887 55 297 205 403 368506508335 386 516 210287 378 298297 190 267 5697 86 56 35 462836;

H[11]:10 1121 3030 38 38 6325 33 69 72 106236217336 316506668562466567313 322260170 285165 80 23 107 60 566651 22;

H[12]:12 203331 5930 1867 139 80 226 266227 209358 266 304 565 510328 231 366303 363367339 106 165 61 70106 53 60 30 1616;

H[13]:2016 4032 59 65 12035 80 105 98 222 267 292 330 220 568 560360 379 352 286290223 260 186189168118 203 8662 3028 2031;

H[14]:20 332650 4659100 68203 182 227 109215 301 306 316563 506381 368 363 288 319 333 153 216 138191 8060 50 30 20 3020 30;

H[15]:30 233640 467910268200162 120209305 211 219 336460506391 372503 388 206203 253 216 21891 18070 38 50 20 211810;

H[16]:50 303950 518411258100182 135216312305240 335400 401496300501318 200209 203 266 200109150100 30 5830 11235;

H[17]:40 365638598010050156156100198300288299 305388 400466300466 426200267 212 16819920010013550 3638203830;

H[18]:50364061 705811010210611799 210220 190287 315376399468416400340 301277 198167 210 109108168 100 8678305840;

H[19]:30524056 606290102117109167 226231 209216 308366 363445 268398406 350 261187198 156176 11198108 116 9088503852;

H[20]:28435930 897610198111121146 200 212 178198298 409 313466 398387396 370 290 156 140 168 196 101126 98 100 6078663856;

H[21]:105666 76 98 7616719890178226 212 226 278277 267 397 349 413426368 410 267 256 156 109 112 116100 100 6358765340;

H[22]:33405778109116187162198219298 200 265301 217 378 336 409398400360 307 216 189 198 160 111116 93 786060 51;

H[23]:5056 78 98 11612890200 216228 266 196 138316 286 309 316 298393 387 396 289 305 201 258 200 151126 100 685051 40;

H[24]:304088 100 117 198102198 200186199203 201323 308 313 320 299358 367 368 379 315 200187100 167109 1021686550 40。

4.3 实验结果

如表1所示:

表1 查准率比较表

综合以上结果并结合时间消耗和计算量的大小(采用652维时计算量较大),说明采用153维量化方法的检索查准率较高,并且时间消耗也不大。故本文提出改进的HSV颜色空间量化方法较为可行。

5 总结

通过对藏毯图像的颜色特征分析,各种典型的基于颜色特征的提取技术,分析了在藏毯图像中运用基于内容的图像检索系统技术的可行性。针对传统HSV颜色空间量化的缺陷,根据图像颜色在HSV空间153维中的分布特点,将其他量化点按颜色相似距离最短的原则组合为一个聚类,从而达到既能聚类出代表图像的颜色又能减少颜色数目的目的。通过实现的一种优化的153维量化方法,使藏毯图像检索的查准率明显提高,为非物质文化遗产的保护和继承提供了技术支撑平台。

参考文献:

[1] 孙浪,唐雁,何荧,谢松山,苗宗霞.一种有效的多特征图像检索方法[J].西南大学学报 2014(12):162-170

[2] 陈剑雄,张蓓.简析图像检索系统中的CBIR技术[J],《贵图学刊》2010(2):47-49

[3] 李薇,李秉茂.基于颜色、形状和纹理的多特征融合图像检索[J],航空计算技术 2013(11):88-90

[4] 赵宏伟,陈霄,石景海,马凌蛟.综合颜色和形状特征的交通标志图像检索算法[J],吉林大学学报( 工学版)2013(3):128-132

[5] 刘丽,匡纲要.图像纹理特征提取方法综述[J].中国图像图形学报 2009(4):622-635

[6] 徐慧英,袁杰,赵建民.一种基于颜色和纹理的图像检索方法[J].计算机科学 2009(5):282-286

[7] 王维兰,钱建军,杨旦春等.基于频率谱变化量的唐卡图像特征提取与表示[J].计算机工程与应用.2011(22):183-187

[8] 周明全,耿国华,韦娜.基于内容图像检索技术[M].北京:清华大学出版社,22-35

[9] 杨琤,董晓宇,邹士年.雪域高原上的地毯奇葩——少数民族特需商品传统生产工艺和技术保护工程巡礼之三[J].中国民族.2009(3):27-30

[10] 彭冬梅.面向剪纸艺术的非物质文化遗产数字化保护技术研究[D].杭州.浙江大学.2008:32-39

[11] 宋本蓉.非物质文化遗产保护视野下的传统手工技艺[D],中国艺术研究,2010,10-12

[12] 李忆湘.在发展中进行非遗保护,在传承中促进产业发展[A].2010中国文化遗产保护与传承高峰论坛专刊,2010.5.22.

[13] 赖伟权.地方高校图书馆对非物质文化遗产的数字化保护研究[J].《中国科教创新导刊》.2012(28):253-254.

Method of Image Retrieval Based on HSV Color Space

Sun Qilong, Zhang Mingliang

(Department of Computer, Qinghai University For Nationalities, Xining 810007, China)

There is still none digital resource platforms for the intangible cultural heritage of Tibetan carpet, which can be used by the researchers and the public. By analyzing the color feature of Tibetan carpet image, according to the same or different distribution characteristics of the traditional HSV color space, the other points are clustered into a cluster based on the same or different distribution characteristics in the HSV space, which can achieve the purpose of reducing the number of colors by clustering the color of the representative images. By comparing the precision and time consumption, it achieves an optimized 153 dimensional quantization method.

Tibetan Carpet; Image; Quantification; Features

1007-757X(2016)04-0009-03

TP311

A

(2015.10.13)

教育部“春晖计划”合作科研项目(项目编号:Z2014024)

孙琦龙(1970-),男,青海人,青海民族大学计算机学院,教授,研究方向:数据库、软件工程,西宁,810007

张明亮(1976-),男,青海人,青海民族大学计算机学院,讲师,研究方向:图形图像,西宁,810007

猜你喜欢
直方图特征提取检索
符合差分隐私的流数据统计直方图发布
基于Gazebo仿真环境的ORB特征提取与比对的研究
用直方图控制画面影调
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
中考频数分布直方图题型展示
专利检索中“语义”的表现
圆投影及直方图不变矩在多视角产品检测中的应用
基于MED和循环域解调的多故障特征提取
国际标准检索