许唯玮
(张家口市电化教育馆,河北 张家口075000)
随着Internet与数字视频设备的高速发展,数字图像信息海量增加,如何帮助用户迅速有效地找到最需要的数字图像,已成为当前一个研究热点.基于内容的图像检索(Content Based Image Retrieval,CBIR)是指除了利用传统的数据库进行存贮管理外,还利用图像的颜色、纹理、形状等特征进行检索.与这些常见的特征检索相比,尺度不变的特征具有旋转、缩放和仿射的不变性,因而在图像匹配、图像检索领域得到越来越广泛的应用.在尺度不变的特征点提取算法中,较为经典的便是SIFT算法,把图像转化为灰度图像,再进行特征点提取.
在2004年David G.Lowe总结了现有的基于不变量技术的特征检测方法,并正式提出了一种基于尺度空间的,对图像缩放、旋转甚至仿射变换保持不变性的图像局部特征描述算子-SIFT算子,其全称是Scale Invariant Feat ure Transform,即尺度不变特征变换,一幅图像SIFT特征向量的生成算法总共包括4步:
(1)尺度空间极值检测,以初步确定关键点位置和所在尺度.
(2)通过拟和三维二次函数以精确确定关键点的位置和尺度,同时去除低对比度的关键点和不稳定的边缘响应点(因为DoG算子会产生较强的边缘响应),以增强匹配稳定性,提高抗噪声能力.
(3)利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性.
图1 SIFT特征向量描述
(4)生成SIFT特征向量.首先将坐标轴旋转向关键点的方向,以确保旋转不变性.接下来以关键点为中心取8×8的窗口.图1左部分的中央黑点为当前关键点的位置,每个小格代表关键点邻域所在尺度空间的一个像素,箭头方向代表该像素的梯度方向,箭头长度代表梯度值,图中的圈代表高斯加权的范围(越靠近关键点的像素梯度方向信息贡献越大)然后在每4×4的小块上计算8个方向的梯度方向直方图.在实际计算过程中,为了增强匹配的稳健性,对每个关键点使用4×4共16个种子点来描述,这样对于一个关键点就可以产生128个数据,即最终形成128维的SIFT特征向量.
当两幅图像的SIFT特征向量生成后,取被检图像中的某个关键点,将关键点特征向量的欧式距离来作为两幅图像中关键点的相似性判定度量,并找出其与图像库中图像欧式距离最近的前两个关键点.在这两个关键点中,如果最近的距离除以次近的距离少于某个比例阈值,则接受这一对匹配点.降低这个比例阈值,SIFT匹配点数目会减少,但更加稳定.将所有匹配点达到一定阈值的两幅图像的欧式距离之和除以图像分辨率系数为这两幅图像的距离.计算图像库中所有图像与检索图像的距离并排序,返回前n项结果即完成检索过程.由于这一检索过程运算量较大,实际操作过程中将特征值存入数据库中,使用最近邻算法进行特征值的查找.
本文使用包含1200副5类图像的li ff图库进行试验,使用SIFT算法进行检索,其中第一幅图为待检索图像,检索结果如图2所示.从实验结果可以看出,上图关于建筑类图像在SIFT算法检索出的前7幅图中,有4幅是相关图片.下图关于植物类图像检索出的7幅图中,有1幅是相关图片.可见该算法检索在人工目标的检索情况时,效果还是比较令人满意的,但对于自然景物的检索结果较差.这说明SIFT特征对于人工目标比对自然景物更加敏感.加入颜色信息和全局信息,在检索中可以提高的检索效果.在实际应用中,可以再加入一些反馈信息,比如感兴趣区域.一副图像我们想要的可能只是其中的某个区域或某个对象,这时候可以让用户用鼠标选取一个矩形区域作为感兴趣区域,然后以感兴趣区域作为待检索对象,忽略其他区域,结合了感兴趣区域可以使检索的结果更接近用户的预期.
图2 检索结果图
本文提出了一种能在目标发生一定变化的情况下很好实现检索的方法.该方法将图像转化为SIFT特征向量的集合,再计算对应特征向量之间的欧式距离实现匹配.实验表明能对图像进行内容检索,具有缩放、平移、旋转不变性.
[1]David G.Lowe,Distinctive Image Features from Scale-Invariant Keypoints.International Journal of Computer Vi-sion,2004.5
[2]赵垒,侯振杰,一种改进的SIFT图像配准方法,计算机工程,2010.6
[3]Ritendra Datta,Dhiraj Joshi,Jia Li,and James Z.Wang Image Retrieval:Ideas,Influences,and Trends of the New Age,ACM Computing Surveys,Vol.40,2008.4