目标形状特征提取方法

2013-04-18 08:40:24柴华
计算机与现代化 2013年4期
关键词:描述符轮廓特征提取

柴华

(国家知识产权局专利局专利审查协作北京中心,北京 100190)

0 引言

形状特征提取是将输入的图像数据转换为形状特征序列的过程。目标图像中包含大量的数据,然而,图像通常被认为是冗余的,因此,需要将输入的图像数据转换为简化的表示形状特征的序列。利用形状特征可以非常直观有效地进行目标区分,因此,可以大大提高图像检索的精度和效率。形状特征通常和特定的目标对象联系在一起,因而含有一定的语义信息,是目标图像中最显著的核心特征;图像中感兴趣的目标区域,可以通过形状特征有效地进行表达和描述。在计算机视觉、图像分析以及模式识别等领域中,二维目标图像的形状特征提取算法的研究发展很快,应用非常广泛[1]。形状特征可以从形状的轮廓或者形状所包含的区域里获得,分别称为基于轮廓的形状特征提取和基于区域的形状特征提取,常用的算法包括傅里叶描述符、统计矩、中轴变换、尺度空间、几何参数法等。形状特征提取目前还没有公认的数学模型,多数形状特征提取算法涉及的数学方法有计算几何、统计学、变换域(傅里叶变换、多尺度变换)等,根据不同的空间域或变换域的相互关系,获得具有不同性质的形状特征[2]。

形状描述符可以定义为用以描述给定形状的一些数字集合,目标图像的形状可能无法利用形状描述符进行完全重构,但是对于不同的目标形状,形状描述符的差别应该足够大,以便有效地对不同的目标形状进行区分[1]。有效的形状描述符还应该使用一定的相似性测度,对于显著不同的目标形状,相似性测度应该越大;而对于相似的目标形状,相似性测度应该越小。此外,有效的形状描述符对于目标形状的平移、尺度变换、旋转、仿射变换和非刚性变换应该具有良好的鲁棒性;同时对于部分遮挡、形变、噪声引起的干扰具有一定的抵抗能力[3]。

1 形状特征提取算法分类

目标图像的形状可以用图像的轮廓、区域或者有限点集进行表示。基于轮廓的形状描述符仅仅利用了目标图像的边界信息,而忽略了图像的内容信息,因而这种方法不能很好地表示下列物体:内部带有空洞的物体、部分遮挡的物体以及具有不连续区域的结构较为复杂的物体;基于区域的形状描述符则利用了目标图像的边界信息以及内部信息,区域的分割与轮廓的分割相比,更加容易实现,但是基于区域的方法提取的特征维数一般较大,这就导致了特征提取和相似性测度计算量的增大;基于有限点集的形状描述符表示的是采样点集,该采样点集来自于应用在目标图像的边缘检测算子的输出数据,这些采样点集不需要进行排序,因此在实际应用中很容易实现。

形状描述符根据形状特征表达的形式可以分为:

(1)基于轮廓的形状描述符:利用形状的目标区域轮廓信息,表示边界轮廓的像素集合;

(2)基于区域的形状描述符:利用形状的目标区域整体信息,表示目标区域所有的像素集合。

每类方法还可进一步划分为基于结构和基于全局的方法[4]。

通过对近年来形状特征提取的热点算法进行实验和对比[3],按照图形图像处理方法可以将形状特征提取算法分为以下7类:

(1)轮廓一维函数表示法,又称为形状签名,是用一维函数表示形状的某些特征。其中包含累积切线角函数[5]、轮廓曲率函数[6]、扇形面积函数、归一化部分面积向量[7]、三角形面积表示法[4]、弦长函数[8]等。该类方法具有明确的函数表达式,非常有利于后期的相似性测量;计算量小,并且很容易与多尺度分析相结合,从而有利于提高表达准确度和计算速度。但该类方法对于噪声较敏感,要求有较高的形状分割质量和较复杂的预处理技术。对于目标形状的平移,轮廓一维函数表示法需要在进行相似性测度时解决这一问题。一个替代的方法是使用该类方法提取特征后,一般还需要进一步处理以增强特征的鲁棒性,同时也减少特征匹配时的负担。

(2)多边形近似方法,通常采用融合算法或分裂算法,是在一定的近似准则下采用首尾相连的直线段来近似目标形状的轮廓。多边形近似方法可以用较少的数据和较为简洁的形式来表示和描述轮廓。距离门限算法、隧道算法以及多边形进化算法是实际应用中常用而有效的多边形近似方法。该类算法自然模糊掉目标形状的微小变化,捕捉了目标形状的主要特征,使用的度量准则通常有最小误差、最小多边形周长、最小多边形内部面积以及最小多边形外部面积等;该算法在抗噪声方面有着突出的性能,然而目标图像中形状的仿射变换以及部分遮挡对于该类算法进行形状特征的提取将引起巨大的影响。目前,对于多边形近似方法没有固定的评价标准。

(3)空间关系特点算法,是描述形状轮廓或区域上的点、曲线间相互关系的算法。该类算法包括自适应栅格分解算法[9]、限定盒算法[10]、凸壳算法[11]、平滑曲线分解[12]、弦角统计算法[13]、形状上下文[14]、弦分布表示法[15]、弦长上下文[3]等。根据不同的空间相互关系特点获得的形状特征具有不同的性质,其中形状上下文法对非刚性变形物体形状特征表现出卓越的鲁棒特性,已经成为形状特征提取算法研究中的热点。

(4)矩不变法,是通过计算目标图像中形状的轮廓或者区域的各阶矩来获得形状特征的方法。在实际应用中使用不同的基函数可以得到不同的矩特征,有不变矩、代数不变矩、Zernike矩、径向Chebyshev矩等。不变矩是图像的一种统计特性,是利用图像灰度分布的各阶矩来描述图像灰度的分布特性。实际上,不变矩的构造是利用了二元齐次多项式系数的函数具有的不变性,因此可以根据代数不变性为目标图像的矩特征建立起完善的数学模型。矩不变法表示形状简明、稳定且容易计算,因此在模式识别和目标分类中得到非常广泛的应用。然而由于它描述的是目标图像中形状的全局特征,当部分形状被遮挡时,目标形状的矩特征将发生较大的变化,同时,将高阶权值矩与目标形状的物理特征进行关联还是非常困难的任务。

(5)尺度空间近似法,是利用多尺度分析理论,将目标图像中形状投影在尺度空间域,在该域中提取形状特征。典型的算法有曲率尺度空间和交叉点映射算法等。尺度空间近似法既可以描述形状的细节,又获得了形状的概貌特征,可以较好地消除噪声干扰,并且与人类的感知行为模型比较一致,具有良好的应用前景。其中,曲率尺度空间描述符已经成功应用于目标形状特征的描述以及检索中。目前,该描述符已成为MPEG-7标准中轮廓描述的一种方法。由于尺度空间近似算法对目标图像的形状采用滤波的方法进行处理,因此,使用尺度空间近似算法提取的形状特征稳健性较好,但是在进行相似度测量时,一般计算量较大。

(6)形状变换域法,是将形状投影到不同的基函数上,用其系数表示形状特征,包括傅里叶变换描述符[16]、小波变换描述符、径向角变换算法、形状标志和谐嵌入算法、改进型Radon变换等。使用这类算法一般是将闭合轮廓线上的任意一点位置看作为一个周期函数,因此该轮廓线可以用不同的变换函数进行展开,低频信息对应于目标形状轮廓的概貌,高频信息对应于目标形状轮廓的细节。该类算法使用不同数量的系数可以获得不同精确度的形状描述,从而可以方便地在描述精确度和描述复杂度上进行平衡。

(7)基于形状轴的表示算法,表示形状常用的轴包括长轴、短轴、最小惯量轴以及中轴等,典型的基于轴的形状表示方法包括基于最小惯量轴的符号表示法、束堆图等。这些基于形状轴的形状描述符均与旋转、平移和尺度放缩无关,提取的特征可以同时利用目标图像中的边界信息和区域信息,但是这些特征的提取依赖于目标图像的分割结果,而且目标图像中的边界变化和噪声干扰也会对最终的结果造成很大的影响。

2 形状特征提取算法分析与展望

形状是目标图像中包含丰富信息的内在特征,人们对于一幅图像的理解很大程度上依赖于对图像中目标形状的区别和感知。形状的描述和识别在计算机视觉和图像分析的研究中占有十分重要的地位。目标图像中形状特征的表示和描述是目标识别的基础;形状的表示可能是一系列外部边界坐标的集合,也可能是利用二维函数表示的区域(轮廓)。对于二维图像,形状特征提取阶段生成用于图像形状匹配时所需的描述信息,也就是说,形状特征提取的目的是获得形状描述符;形状描述符是用于表示形状特征的一系列数据集合。一般来说,目标图像中形状的表示和描述要求尽可能地被压缩,以便满足高效存储和检索要求;同时特征描述符需要整合特征信息,以满足区分形状的要求,但是,这个问题一直是非常困难的任务。

在目前的实际应用中,提取形状特征的方法对目标图像预处理的要求比较高,主要是要求有较高的图像分割质量,而这一点的难度相当大,因此自动而准确地提取目标图像中的形状特征非常困难,特别是对于大规模的图像数据集以及高维数的图像特征,这个问题严重制约着形状特征在实际中的应用[10]。由于图像中目标形状的自动获取比较困难,因此,目前基于目标图像形状特征的应用一般仅限于比较容易识别的目标物体[1]。尽管在文献中提出很多形状特征提取的方法和技术,然而这些方法和技术还存在一些难以解决的问题;同时,已有的方法和技术还远远不能满足人们实际应用的要求。

3 结束语

由以上的分析可以看出,在实际的应用中,直接利用目标图像的形状信息还存在许多困难,主要集中在以下两个方面:

(1)同一个物体,在不同的视角下观察,获得的目标形状可能有很大差别——仿射变换或投影变换问题。

(2)对于生物体或者关节相连的物体发生相对移动(如剪子、钳子等)时,物体自身的状态变化,可能会引起形状发生巨大变化——非刚性或刚性变形问题。

所以形状特征提取的焦点在于,如何有效利用形状的轮廓信息和区域信息,挖掘图像的内在特性,从而获得具有抗仿射变换、抗投影变换、抗噪声、抗非刚性变换和抗关节相对移动的形状鲁棒性特征。

[1]汪彦龙,李金龙,刘金华,等.基于内容的图像检索方法[J].电视技术,2005(4):9-12.

[2]陈晞,杨轶,董育宁.用于图像检索的MPEG-7形状描述子[J].电视技术,2003(4):18-21.

[3]Yang Mingqiang.Shape-based Feature Extraction and Similarity Matching[D].Institut National des Sciences Appliquées,France,2008.

[4]Alajlan N,KamelM S,Freeman G.Multi-object image retrieval based on shape and topology[J].Image Communication,2006,21(10):904-918.

[5]Zhang D S,Lu G.A comparative study on shape retrieval using Fourier descriptors with different shape signatures[C]//Proceedings of the International Conference on Intelligent Multimedia and Distance Education(ICIMADE01).2001.

[6]Kauppinen H,Seppanen T,Pietikainen M.An experimental comparison of autoregressive and Fourier-based descriptors in 2-D shape classification[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1995,17(2):201-207.

[7]Yang M,Kpalma K,Ronsin J.Affine invariance contour descriptor based on iso-area normalisation[J].Electronics Letters,2007,43(7):379-380.

[8]Zhang D S,Lu G.A comparative study of Fourier descriptors for shape representation and retrieval[C]//Proceedings of the 5th Asian Conference on Computer Vision.2002:646-651.

[9]Chakrabarti K,Ortega-Binderberger M,Porkaew K,et al.Similar shape retrieval in Mars[C]//Proceedings of the 2000 IEEE International Conference on Multimedia and Expo.2000,2:709-712.

[10]Bauckhage C,Tsotsos JK.Bounding box splitting for robust shape classification[C]//Proceedings of the 2005 IEEE International Conference on Image Processing.2005,2:478-481.

[11]Gonzalez R,Woods R.Digital Image Processing(2nd Edition)[M].Pearson Education North Asia Limited,Publishing House of Electronics Industry,2002.

[12]Berretti S,Del Bimbo A,Pala P.Retrieval by shape similarity with perceptual distance and effective indexing[J].IEEE Transactions on Multimedia,2000,2(4):225-239.

[13]Arica N,Vural F.BAS:A perceptual shape descriptor based on the beam angle statistics[J].Pattern Recognition Letters,2003,24(9-10):1627-1639.

[14]Mori G,Belongie S,Malik J.Shape contexts enable efficient retrieval of similar shapes[C]//Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition.2001,1:723-730.

[15]Smith SP,Jain A K.Chord distributions for shapematching[J].Computer Graphics and Image Processing,1982,20(3):259-271.

[16]Zhang Shaoting,Zhan Yiqiang,Zhou Yan,et al.Efficient sparse shape composition with its applications in biomedical image analysis:An overview[C]//Proceedings of the 9th IEEE International Symposium on Biomedical Imaging.2012:976-979.

[17]柴华.基于改进的弦长关联形状特征提取算法研究[D].济南:山东大学,2011.

猜你喜欢
描述符轮廓特征提取
轮廓错觉
基于结构信息的异源遥感图像局部特征描述符研究
测绘学报(2022年12期)2022-02-13 09:13:01
基于实时轮廓误差估算的数控系统轮廓控制
基于Daubechies(dbN)的飞行器音频特征提取
电子制作(2018年19期)2018-11-14 02:37:08
Linux单线程并发服务器探索
利用CNN的无人机遥感影像特征描述符学习
Bagging RCSP脑电特征提取算法
在线学习机制下的Snake轮廓跟踪
计算机工程(2015年4期)2015-07-05 08:27:39
基于MED和循环域解调的多故障特征提取
基于PDIUSBD12的USB接口设计应用研究