自底向上的图像显著性检测综述

2015-05-04 09:07李京卫董水龙张朝立
数字技术与应用 2014年12期

李京卫++董水龙++张朝立

摘要:随着数字图像数据急剧增长,图像分类识别领域得到了广泛关注,是当前计算机视觉领域的研究热点。本文针对图像分类识别领域,重点对近几年国际上有影响的自底向上的图像显著性检测算法进行了分类介绍,并且利用目前最为流行的两个显著性检测数据库MSRA1K和ECSSD对这些算法分别进行了实验,最终对比得出目前算法的优势与不足。

关键词:图像显著性检测 全局对比度 局部对比度 背景先验知识

中图分类号:TP391.41 文献标识码:A 文章编号:1007-9416(2014)12-0220-02

1 引言

计算机通过图像理解周边环境是目前计算机视觉研究的首要目标, 要实现此目标,获得图像视觉显著性信息是最为基础的一步。

通常情况下,由于图像中包含有效目标区域的特殊视觉刺激分布模式,导致其拥有较高优先级,当我们将仅由外界环境视觉刺激所驱动的自底向上的选择性视觉注意机制,引入图像显著性检测过程中时,我们发现是非常有用的。自底向上的图像显著性检测就是在这种思想基础上提出来的。

2 自底向上的图像显著性检测

自底向上的图像显著性检测方法关键是求每个像素或超像素与其他像素或超像素之间的差别。二者差别越大,显著性越大。目前求对比度的方法主要分为三大类:局部对比度先验知识、全局对比度先验知识和背景先验知识。

2.1 局部对比度先验知识

局部对比度先验知识的基本思想是:每个像素或超像素,只与图像局部中某些像素或超像素比较,从而获得对比度。常见的有三种形式:(1)将像素或超像素,仅和他相邻的像素或超像素比较。(2)将目标像素运用滑动窗口的方法与窗口内其他像素求差异度。(3)利用多尺度方法求得对比度。此外还有中心—周边区域对比度,由于其也是在局部进行对比,因此本文也将其纳入局部对比。近几年比较具有代表性的算法主要有:

(1)IT算法:1998年,Itti等人[1]提出基于中央-周边环绕算子的显著模型(IT 模型),其主要包括特征提取、最终显著性图像合成、视觉注意焦点选择和转移三个阶段。

(2)GB算法:2000年Wang[2]等人通过在马尔科夫链上的随机游走获得检测结果。

(3)SR算法:2006年Harel等人[3]通过归一化Itti等人[1]的特征图,突出了图像的显著区域,并且计算所得的显著图可与其它显著图像进行结合。

(4)FT算法:2009年,Achanta等人[4]提出一种基于频率调整的算法,以此获取多尺度的显著性区域检测结果。

2.2 全局对比度先验知识

全局对比度的基本思想是:将目标像素或超像素与图像中其余所以像素或超像素进行特征差异度计算,最后将这些差异度累加作为目标像素或超像素的全局对比度。近几年主要的全局对比度算法有:

(1)SF算法:2012年Perazzi等人[5]提出基于颜色对比度的显著目标检测算法,该算法将原来仅在值域空间计算颜色对比度的方法,改进为在值域和空域上,有效结合了全局对比度和局部对比度。

(2)GC算法:2013年由Cheng[6]等人提出,其首先使用高斯混合模型对图像像素点进行聚类,然后对得到的区域二次聚类,获得更大区域,最后分别在高斯混合模型得到的区域上计算全局对比度。

2.3 背景先验知识

2012年Y.C.Wei[7]等人首先提出了背景先验,并将区域的显著性定义为该区域到图像四周的最短距离。算法的主要思想就是首先检查出背景区域,进而得到目标区域。

(1)GS算法[7]:假定图像的边缘节点即是背景节点,然后分别计算各个节点与边缘节点在颜色特征上的差异获得各节点的显著性值。

(2)AMC算法:2013年Jiang等人[8]将图像中边缘节点定义为吸收节点,内部节点定义为转移节点,利用在吸收马尔科夫链上的随机游走,将各个节点的吸收时间定义为图像超像素节点的显著性。

(3)MR算法:2013年Yang[9]等人同时利用背景和前景先验,流行排序分别以图像的四边的节点为基准,进行第一轮排序,再将得到的显著图进行二值化作为第二轮排序的基准,最终得到显著图。

(4)SO算法:2014年Zhu[10]等人定义了边缘连续性,同时对超像素区域与图像边缘的关系进行了定义,利用背景先验知识对图像的显著性进行了定义。

此外,还有LR算法:2013年 Fu等人[4]提出了新的适用于多幅图像的联合显著性检测方法

3 实验结果与分析

为了对各种主要算法的性能有更加清晰的直观认识,我们对上述算法进行了综合对比,结果如图1。

实验中我们采用公开的MSRA1K和ECSSD显著性检测数据库,其中MSRA1K包含一千张图片,是目前最常用的显著性目标监测数据库之一;ECSSD也包含一千张图片,但是其结构相比MSAR1K要复杂。参照我们上述实验结果我们可以得知,目前对于简单图像我们是可以达到较好的检测效果的,但相同算法用于复杂图像,则还有较大改进空间。

参考文献

[1]Itti L,Koch C, Niebur E. A model of saliency-based visual attention for rapid scene analysis.IEEE Transactions on Pattern Recognition and Machine Intelligence (PAMI),1998,20(11):1254-1259.

[2]Wang J, Zucker J D. Solving multiple-instance problem: A lazy learning approach[C] 2000:1119-1125.endprint

[3]J. Harel, C. Koch, and P. Perona, “Graph-based visual saliency,” in proc. NIPS. MIT,2006:545-552.

[4]R. Achanta, S. Hemami, F. Estrada,“Frequency-tuned salient region detection,” in CVPR,2009:1597-1604.

[5]F. Perazzi, P.Krahenbuhl, and Y. Pritch,“Saliency filters: Contrast based filtering for salient region detection” in CVPR,2012:733-740.

[6]M.-M. Cheng, J. Warrell, W.-Y. Lin, S. Zheng, and N. Crook, “Efficient salient region detection with soft image abstraction,” in ICCV,2013:1529-1536.

[7]Y. Wei, F. Wen, W. Zhu, and J. Sun, “Geodesic saliency using background priors,” in ECCV,2012,vol.7574,:29-42.

[8]B. Jiang, L. Zhang, H. Lu, and M.-H. Yang,“Saliency detection via absorbing markov chain,”inproc.ICCV.IEEE,2013:1665-1672.

[9]C. Yang, L. Zhang, H. Lu, and M.-H. Yang,“Saliency detection via graph-based manifold ranking,”in proc. CVPR. IEEE,2013:3166-3173.

[10]W. Zhu, S. Liang, Y. Wei, and J. Sun, “Saliency optimization from robust background detection,”in proc. CVPR.IEEE,2014:2814-2821.

[11]Fu H, Cao X, Tu Z. Cluster-based co-saliency detection[J]. IEEE Transactions on Image Processing, 2013:3766-3778.endprint