陈宏
(西安欧亚学院 陕 西 西 安 7 10065)
近年来,随着计算机和网络技术的迅速普及,信息量与日俱增。随着多媒体技术和数字设备的出现,大量的图像信息涌入人们的生活,如何有效地管理和访问图像信息已成为人们亟待解决的问题,因此,人们迫切需要一种能够快速地、准确地检索图像的技术,这就是图像检索技术。基于内容的图像检索技术(Content-based Image Retrieval,CBIR)克服了基于文本的图像检索方法的不足,根据图像自身的视觉信息进行检索,使检索更符合人对图像的认知特性,具有广阔的应用前景,是一个具有强大生命力的研究方向。基于内容图像检索的核心是图像特征的提取和特征的相似性度量。其检索是通过提取图像的视觉特征来进行相似性度量,从而获得用户需要的检索结果,达到检索的目的。形状特征作为图像的重要视觉特征之一,它不随周围的环境如亮度等变化而变化,是物体的稳定信息;人们对图像的理解也在很大程度上依赖于对图像中物体形状的感知和区别。但是,形状特征本身的特殊性使形状检索的实现具有一定的难度,因此基于形状的图像检索技术研究是基于内容图像检索中一个极具挑战性的课题,具有十分重要的研究意义。
提取图像的边缘是统计图像边缘方向的关键步骤,图像边缘提取效果的好坏将直接影响到图像形状特征的提取结果。常用的边缘检测算子[1-2]有Roberts边缘算子、Prewitt边缘算子、Sobel边缘算子、Kirsch边缘算子和Laplacian边缘算子等。
本文通过对上述边缘算子的研究,分析得到以下结论:Roberts边缘算子定位比较精确,能够提供较好的不变性边缘取向,但对噪声敏感,同时由于采用偶数模板,对点所求的梯度值偏移了半个像素。Prewitt边缘算子和Sobel边缘算子都是对图像进行差分和滤波来检测边缘,只是平滑部分的权值不同,因此对噪声都具有平滑作用,但边缘定位的精度不高,易产生伪边缘,对灰度渐变、低噪声的图像检测效果较好。Krisch边缘算子对边缘进行8个方向上的检测,具有较好的边缘定位能力,对噪声也有一定的抑制作用,但运算量比较大。Laplacian边缘算子作为一个二阶导数,对噪声具有无法接受的敏感性,其幅值容易产生双边缘,且不能检测边缘的方向[3]。
边缘方向直方图特征提取方法是基于轮廓的形状描述符,是在边缘检测的理论基础上提出的一种形状边缘特征的提取方法。该方法首先要剥离出原始图像的边缘,并计算出每个边缘点的方向,然后统计每个方向上的边缘点数目构成边缘方向直方图,以此作为图像的形状特征,提取步骤如图1所示。
图1 边缘方向直方图特征提取步骤示意图Fig.1 Schematic diagram on steps of extracting the edge direction histogram features
所谓边缘是指其周围像素灰度急剧变化的象素的集合,与色调无关。生活中的数字图像一般都是24位真彩色图,即图像的每个象素用R、G、B 3个分量表示。因此,本文在对彩色图像提取图像中目标的边缘前,首先将彩色图像转化为灰度图像[4-5]。具体做法是将R、G、B看成三维空间的X、Y、Z轴,则图像中每一点的像素值(r,g,b)与坐标(Y,Y,Y)距离最小时的Y即为该点的灰阶值,公式如下:
其中,R表示红色分量,G表示绿色分量,B表示蓝色分量。
在对边缘算子的研究基础上,本文总结了图像边缘检测的步骤:
1)去除图像噪声,减少图像虚假边缘的产生;
2)计算图像梯度的幅值,位于边缘上的像素点梯度幅值较大;
3)设定梯度幅值的阈值,取出真实的边缘点像素。
根据以上原理,本文实现了图像边缘的检测,收到了较好的检测结果。具体方法如下:
1)去除图像噪声
去除图像噪声的目的是防止产生伪边缘。消除图像噪声可以通过图像处理技术中的平滑来实现。选择的滤波器应该在各个方向上的平滑程度相等,且每一邻域像素点的权值应该随着该点与中心点的距离单调递减。因此,作者采用了具备以上两个特性的二维零均值离散高斯函数作为平滑滤波器。函数表达式如下:
其中,σ是高斯滤波器的宽度,用来控制平滑程度,f(x,y)为原始图像,G(x,y)为通过高斯函数平滑后的图像。
通过对图像平滑可以获得两个效果,一个是模糊,另一个是消除噪声。随着σ越大,平滑的程度就越好,图像就越模糊。本文在图像特征分量模糊与平滑图像中由噪声所引起的过多不希望突变量之间取得折衷,对比分析后选择了σ=1.0,使平滑后的图像尽可能地去除或减弱图像中的噪声,同时又较好地保留了图像的边缘信息。
2)计算梯度幅值
图像一阶导数的幅度值反映了图像的灰度变化情况,研究发现灰度不连续的位置处存在一个向上的阶跃,这表明可以用一阶导数的幅度值来检测边缘的存在。由于求导的计算是复杂的,本文则利用一阶差分卷积模板来近似计算梯度的幅值和方向,使计算变得简单化。本文选用3×3邻域模板,根据8连通区域,将边缘方向量化到圆周的1/8扇区,以0°、45°、90°、135°等为中心角度。对整个坐标系而言,梯度向量共分为8类,利用中心对称原理,作者分析后认为只需要4个方向,如图2所示。作者通过计算这4个方向上的一阶差分来确定梯度幅值,不仅能够有效控制噪声,而且边缘定位准确。
图2 边缘方向示意图Fig.2 Schematic diagram on edge direction
各方向梯度的计算公式如下:
0°方向偏导数
45°方向偏导数
90°方向偏导数
135°方向偏导数
梯度幅值
表示为模板形式:
图3 算子模板Fig.3 Operator template
3)阈值的设定
由上步计算出的图像梯度幅值反映的是图像灰度值的显著变化程度。由于目标和背景的边缘处像素之间的灰度值差别较大,而目标和背景内部像素之间的灰度值差别较小,所以边缘像素点的梯度幅值相对较大,而内部的梯度幅值相对较小。由此,可设定一个合适的阈值T,如果像素点的梯度幅值 M(i,j)大于等于 T,则该点为边缘点,并将 Edge(i,j)的值标记为 255;如果像素点的梯度幅值小于 T,则将 Edge(i,j)值计为0。这样便勾勒出了原图像的边缘(即所有Edge(i,j)=225的像素点)。
阈值T的取值直接影响到边缘点的选取,本文采用了梯度值直方图来确定阈值。在一幅图像中,非边缘点数目在图像像素点总数目中占有一定的比例,对应的比例因子表示为LOW。根据图像梯度值对应直方图,从低梯度值等级开始逐步累加图像点数目,当累加数目达到图像总像素数目的LOW时,对应的图像梯度值设置为阈值T,文中中设定LOW为0.7,经测试得知图像边缘的定位更准确,细节处理得更好,为提取图像的边缘方向直方图打下了良好的基础。
由上可知,Edge(i,j)=225 处的点均为边缘点,其边缘方向为:
其中,θ(i,j)的范围为[0.360)。
在360个角度方向上,统计每个方向上边缘点的个数,构成边缘方向的直方图。由于统计的是边缘的方向,因此该特征具有平移不变性。对得到的边缘方向直方图进行了归一化处理,使特征具有了尺度不变性。
考虑到提取出的图像边缘方向直方图特征向量虽然具有平移和尺度不变性,但对旋转是敏感的。因为当图像内的目标或景物发生了旋转变换,所有边缘像素的方向也都发生相应旋转,它对应了边缘方向直方图的周期循环移位。因此,在进行图像特征匹配时,采用边缘方向循环移位最小值来计算图像间的距离,有效消除了图像特征匹配中的旋转易变性。修改了的欧式距离公式如下:
其中,H为查询例图的边缘方向直方图,HS是图像库中待查图像的边缘直方图,HSl是对HS平移l个单位所得到的直方图,Hi和HSli分别为H和HSl中第i个特征分量。
为了更好地评价算法的检索性能,选择了MPEG-7 ShapeB标准形状测试集[6]。测试集中有1 400幅图像,被分成70类,每类20幅图像。图像库内的图像均为灰度图像,且每幅图像目标唯一、背景单一,其中目标为白色,背景为黑色。在该测试集的基础上从几何不变性和检索性能两个方面设计了实验。
1)几何不变性
几何不变性实验重在检查算法对平移、尺度和旋转不变性的有效性。从测试集中选择了两幅图像,对第一幅图像进行了平移变换、尺度变换和旋转变换等相应的几何变换。采用本文方法进行检索,通过计算第一幅图、几何变换后图像和视觉特征不同的另一幅图像间的距离进行测试。测试数据表明该算法具有平移不变性、尺度不变性和旋转不变性。
2)检索性能
对性能的评价,采用“查准率”对本章算法输出的结果与人们期望结果的一致性进行比较。将P(G)(即输出近似图像的数目)分别选择为10和20。具体实验步骤如下:以MPEG-7 ShapeB形状库为基础,从中选择10类作为本实验的测试形状库,其中每类包含了20幅图像,这些图像的分类是基于语义的分类,具体分类如图4所示,其中每一类中所包含的图像在视觉上是相似的,一些不同类之间也有相似性,如camel和elephant。对每一类图像随机抽取10幅分别作为关键图像,用查准率公式计算出P10和P20,然后对每类计算平均查准率P10和P20,本章算法检索查准率结果如表1。
图4 测试库分类及示例图Fig.4 Test library classification and examples
表1 算法检索准确率Tab.1 Algorithm retrieval accuracy
实验表明,基于边缘方向直方图的形状检索算法在基于内容的图像检索方面具有较好的平移、尺度和旋转等几何不变性,在检索性能上也取得了较好的表现,尤其是在规则形状检索方面,如hammer、jar类的图像检索,准确率能达到80%左右。
基于内容的图像检索技术旨在研究如何由图像自身提取特征,如何利用提取出的特征对图像数据进行检索。图像的特征包括颜色、纹理、形状和语义等,基于形状特征的图像检索是基于内容图像检索的一个十分重要的方面。通过对该技术的研究,提出了一种基于边缘方向直方图的轮廓形状检索算法,该方法首先用改进后的边缘检测算子检测出图像的边缘,然后统计各方向上的边缘点数目构成特征向量,最后采用边缘方向循环移位最小欧式距离作为相似性度量。实验表明,算法在检索背景单一的图像上取得了较好的效果,但对于背景复杂的图像检索效果略显不足。
[1]冈萨雷斯.数字图像处理[M].北京:电子工业出版社,2005.
[2]张洁.数字图像边缘检测技术的研究[D].安徽:合肥工业大学,2009.
[3]胡学龙.数字图像处理[M].北京:电子工业出版社,2011.
[4]Mark S.Nixon,Alberto S.Aguado.计算机视觉特征提取与图像处理[M].北京:电子工业出版社,2013.
[5]李勇.基于内容的图像检索技术研究[D].吉林:吉林大学,2009.
[6]L.J.Latecki.Shape Data for the MPEG-7 Core Experiment CE-Shape-1, [EB/OL](2002)[2013-06-26]http://www.cis.temple.edu/~latecki/TestData/mpeg7shapeB.tar.gz.