王健 崔永 赵树林
摘要 随着互联网和多媒体技术的快速发展,人们所处理的信息已不仅仅是数字、符号,而是越来越多的图像信息,如何对图像进行快速、有效的检索就变得极为迫切。针对图像底层特征提取方法如何选择的问题,分别分析了基于颜色、纹理、形状特征提取方法,并对各种提取方法的优缺点进行了归纳、总结,为林业信息化建设的相关层面提供了一种新的技术。
关键词 图像信息;形状特征;提取方法;林业信息化建设
中图分类号 S127 文献标识码 A 文章编号 0517-6611(2014)05-01550-02
Abstract With the rapid development of Internet and multimedia technology,the processing of information is not just numbers,symbols,but more and more image information,how to fast,effective retrieve images becomes extremely urgent.The extraction method based on color,texture,shape features was analyzed,and the advantages and disadvantages of various extraction methods were summarized,so as to provide a new technology for the level of forestry information construction.
Key words Image information; Shape feature; Extraction method; Forestry information construction
随着林业信息化的推进,我国林业建设正逐步由传统的、人工的管理方法,向现代化、信息化、智能化的方向转变。目前我国的卫星技术已经走在世界前列,通过卫星拍摄传回地球的图片是非常珍贵,且有重要研究价值的。卫星图片对研究世界气候、环境、各种生态资源、有重要的参考价值。图像特征方法的研究是世界环境气候、生态环境的一个重要方面,也是林业信息化建设的一个研究方向。
由于基于文本的图像检索所带来的工作量巨大,如何让计算机根据图像的视觉特征进行快速准确的检索成为了研究热点,基于内容的图像检索(CBIR)由此产生。
基于内容的图像检索的关键问题是如何准确地反映图像的内容信息,这同时也是进行基于内容的图像检索的前提。目前,人们主要的研究重点是如何构建规范化的内容特征,可以从这些底层特征来构建高层特征。为此,笔者分别介绍了基于颜色、纹理、形状特征提取的常用方法,并对各种特征提取方法的优缺点进行了归纳、总结。
1 颜色特征的提取
颜色特征是描述一幅图像最简便而有效的特征,具有旋转与平移不变等特点,所以很多基于颜色特征的检索方法已被提出。通常颜色特征都采用颜色直方图的方式对图像进行特征描述。
1.1 颜色空间
目前常用的有RGB颜色空间和HSV颜色空间。RGB颜色空间分布不均匀,两种颜色点之间的距离的大小不能代表其颜色的知觉差异[1]。HSV颜色模型是一种面向视觉感知的颜色模型,它更符合人的视觉感知。
1.2 颜色特征提取的研究
在颜色特征提取方法中,基于颜色直方图的方法最为常用。Swain等最早提出了使用直方图统计各种色彩在图像中的概率,之后使用直方图的相交算子来度量图像的相似性,但是该方法没有充分地考虑到图像的空间信息[2]。为了解决此问题,stricker等提出了分块的颜色直方图,他认为图像的中心部分是有意义的区域,为此他将图像分为5块,分析各分块的颜色直方图。但是该方法在计算过程中增加了时间和空间的复杂性[3]。徐果毅等提出了基于颜色直方图熵值及分块主色的图像检索,图像的相似度通过计算图像间的熵值距离来度量,在定义图像的相似度距离时还引入一种新的分块主色距离,这种方法对于检索在相同背景下的不同颜色的相关物体时有着很好的效果[4]。为了解决分块带来的对旋转敏感问题,曲培娟提出了基于同心圆颜色特征的图像检索算法,以圆心为准进行分块,图像可以任意旋转,动态加权各分块得到图像的综合加权特征,然后进行图像相似性的匹配[5],如图1所示。
2 纹理特征的提取
2.1 纹理的定义
纹理作为任何物体的构成成分的分布,是一种图像中广泛存在的特征,具有与颜色和亮度变化无关的特性。纹理特征包含了物体表面结构组织排列的重要信息,以及和周围的联系。Castleman等认为,纹理是一种反映图像中一块区域的像素灰度级的空间分布属性,这种空间结构的固有属性可以通过邻域像素间的相关性刻画[6]。
2.2 纹理特征提取的研究
许多学者对纹理特征提取方法展开研究并对其进行分类,常用的纹理分析方法有3種:统计分析方法、结构分析方法和频谱分析方法。
2.2.1 统计分析方法。
统计分析就是研究纹理图像某些特征的统计规律,也就是使用图像的直方图描述纹理。在统计分析中,灰度共生矩阵(GLCM)是最常用的方法,此外还有灰度行程统计、灰度查分统计等方法,但由于其计算量较大,并且鉴别能力较差,并没有被广泛地利用。虽然灰度共生矩阵方法的鉴别能力很好,但是需导出14种纹理特征,这导致提取纹理的时间很长。于是,众多研究者开始注重提高纹理特征的提取效率。薄华等通过研究发现,对比度、相关性、熵3个特征对纹理有着很好的分辨能力并且不相关[7]。Ojala等提出了 LBP方法,该算法通过用一个二进制的数字来量化每个像素点与其邻域内其他各点的灰度值的差异[8]。为了解决灰度共生矩阵计算量大的问题,龚家强等提出了基于灰度共生混合结构和离散傅立叶变换的方法来实现纹理特征的提取,对傅立叶变换后的频谱图进行分块计算,降低了计算时的灰度级,提高了运算速度[9]。
2.2.2 结构分析方法。
结构分析就是利用模式基元和特定排列规则来描述纹理,利用纹理基元分析纹理特征,认为纹理是由纹理基元所组成,纹理基元类型的不同、方向的不同以及纹理基元的数量等,决定了纹理的不同。结构分析方法主要有两种:句法纹理分析,数学形态学法。然而,由于大多数纹理是不规则的,因此结构法在使用时受到了很大的限制,导致了结构分析方法没有被广泛地使用。
2.2.3 频谱分析方法。
主要通过频率来对图像的纹理进行描述。通常人在面对一幅图像时,会对其进行频度分析,这很符合分析图像的纹理特征。典型的方法有傅里叶变幻,用频谱分布来表现纹理。自从1989年小波变换被提出之后,许多小波变换的方法陆续被提出用于纹理特征提取中。小波变换是通过母函数在其尺度上的伸缩和时间上的平移,得到一种能够适应各种频率成分的有效信号分析的方法。小波变换最开始是二进制的小波变换,但是由于二进制小波缺乏处理多频段的特性,多进制小波变换的方法被提出,多进制小波可以分辨出更多的频段。除了多进制小波变换,金字塔小波变换、树结构小波变换等也被提出。
3 形状特征的提取
形状是图像重要的可视化特征,能够准确地刻画物体。形状特征不会随图像的颜色、纹理、背景的改变而变化,具有一定的稳定性。定义形状特征主要有两个方面:①图像中目标的分割;②形状特征的描述。目前,图像分割的常用方法主要有遗传算法分割、Rorberts边界检测算子、几何常量、多边形顶点数、孔径数、曲率等。形状描述方法主要分为两类:基于区域的形状描述符和基于边界的形状描述符[10]。
3.1 基于区域的形状描述方法
Hu在1962年提出了几何矩的方法来描述形状特征,由7个矩组成描述形状的不变矩组[11]。该不变矩组对区别形状起到很好的作用。它具有平移、旋转、尺度不变性,但是计算复杂。
Teague首先提出了Zernike矩定义。Zernike矩就是以图像的型心为原点,把坐标映射到单位圆内得来的,使得仅仅使用一组很小的Zernike矩特征向量就可以对目标进行形状描述。但是Zernike矩获得的颈向特征原型特征是不一致的,这导致了无法对形状进行多分辨率分析,同时由于圆形光谱特性无法在各个权值均匀获得,会导致有利于对形状进行描述的特征信息丢失[12] 。
Zhang等提出了通用傅里叶描述符(GFD),它包含了图像像素点的灰度信息,同时具有旋转和比例不变性,克服了Zernike的上述缺点,但是对噪声比较敏感[13]。
章志勇等提出了把多尺度分析和通用傅里叶描述子相结合,得到多尺度通用傅里叶描述子。该方法不仅能克服图像灰度噪声带来的干扰,并且具有旋转、比例不变性,在灰度图像检索中取得较好的效果[14]。
3.2 基于边界的形状描述方法
Freeman等提出链码对图像边界点进行表示的方法,通过一系列具有特定长度和方向的相连直线段对目标的边界进行表示[15]。但是目标的旋转会造成链码发生变化,改进的办法是利用链码的一阶差分来重新构造一个序列,该差分通过相邻两个方向数相减得到。
傅里叶描述子适合描述封闭的曲线,它主要是将经过离散傅里叶变换后的边界作为形状特征,具有很好的平移、旋转、缩放等几何不变性,非常适合于构造形状的边界信息。但是它很难从直观上对变化进行预测。
曲率尺度空间描述符根据人们在认知物体时,倾向于将物体的形状分解成凹和凸的部分来进行比较这一特性而提出的方法。曲率尺度空间描述符具有平移、旋转、尺度不变性,而且描述符紧凑。
4 结语
图像特征提取是进行基于内容的图像检索中重要的一步,该研究分别介绍了基于颜色、纹理、形状的特征提取方法,并对各种提取方法的优缺点进行了归纳、总结。随着图像特征提取算法研究的深入,基于内容的图像检索的准确性也将逐渐提高。
参考文献
[1] 姜兰池,沈国强,张国煊.基于HSV分块颜色直方图的图像检索算法[J].机电工程,2009(11):54-57.
[2] SWAIN M J,BALLARD D H.Color indexing[J].Journal of Computer Vision,1991,7(1):11-32.
[3] STRICKER J,KAFRI O.A new method for density gradient measurements in compressible flows[J].AIAA,1982(20):820-823.
[4] 徐果毅,朱宁波,朱晓林,等.基于颜色直方图熵值及分块主色的图像检索[J].计算机工程与科学,2008,30(9):44-46.
[5] 曲培娟.一种新的基于颜色特征的图像检索方法[J].兰州理工大学学报,2010,36(2):88-92.
[6] CASTLEMAN K R.数字图像处理[M].朱志刚,译.北京:电子工业出版社,1999.
[7] 薄华,马缚龙,焦李成.图像纹理的灰度共生矩阵计算问题的分析[J].电子学报,2006,34(1):155-158.
[8] OJALA T,PIETIKAINEN M,MAENPAA T.Multire solution gray scale and rotation invariant texture classification with local binary patterns[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24:971-987.
[9] 龚家强,李晓宁.基于共生矩阵纹理特征提取的改进算法[J].计算机工程与设计,2011,32(6):2068-2071.
[10] 李钰,孟祥萍.基于Gabor滤波器的图像纹理特征提取[J].長春工业大学学报,2008,29(1):78-81.
[11] 肖旭光,肖刚,敬忠良.空间目标融合识别算法及实验研究[J]. 计算机工程与应用,2011,47(8):154-160.
[12] 聂生显.基于形状特征的图像检索研究和应用[D].成都:电子科技大学,2011.
[13] ZHANG L C,DING X M,ZHANG Y Q,et al.Embedded online palmprint verification system[C]//2nd International Congress on Image and Signal Processing.Tianjin:IEEE,2009:1-5.
[14] 章志勇,潘志庚,张明敏,等.基于多尺度通用傅里叶描述子的灰度图像检索[J].中国图象图形学报,2005,10(5):611-615.
[15] LEVIN A,SAND P,CHO T S,et al.Motion-invariant photography[J].SIGGRAPH,2008,2008,27(71):1-9.