基于目标轮廓增强的GrabCut图像分割方法

2020-06-09 12:20杨国萍刘本永
软件 2020年2期

杨国萍 刘本永

摘  要: 针对传统GrabCut算法需要人工初始化而引起图像分割效率低的问题,结合目标轮廓增强技术,提出一种自动GrabCut算法。首先对图像进行谱残差计算,以获取目标轮廓增强的视觉显著图;其次,对显著图进行预分割并通过快速连通区域分析进行前景估计并获取掩膜,将获取的掩膜代替人工交互初始化GrabCut算法,最后实现自动分割。实验结果表明,该方法克服了手动的缺点,并在处理前后景颜色相似的图像时,分割结果要优于传统方法。

关键词: 图像前后景分离;GrabCut算法;显著图;轮廓增强

中图分类号: TP391    文献标识码: A    DOI:10.3969/j.issn.1003-6970.2020.02.006

【Abstract】: The traditional GrabCut algorithm needs to be manually initialized and thus it is inefficient in image foreground and background separation. Aiming at this problem, we present an automatic version,by combining target edge enhancement with the traditional GrabCut algorithm. Firstly, the saliency map with the target edge enhancement is obtained by acquiring the spectral residual of an image. Secondly, the foreground of the image is estimated by adopting the fast connected region analysis method for achieving the mask and then used to initialize the GrabCut to realize automatic segmentation. Experimental results show that the proposed algorithm surmount the defects of manual operations, and the separation results are better even when the foreground and background of an image are similar in color.

【Key words】: Image foreground and background separation; GrabCut algorithm; Saliency map; Edge enhancement

0  引言

图像前背景分离[1]是计算机视觉的基础环节,其目的是把图像中人们感兴趣的区域(前景)从背景区域中提取出来,使图像更加简单、便于理解和分析。其效果好坏对后续图像分析和图像理解有着重要影响,因此提高图像分离效率和精度具有重要意义。

现有图像分离方法一般采用传统图像分割方法实现,其种类较多,主要分为监督分割法[2,3]、非监督分割法[4,5]和交互式分割法[6-8]。其中交互式方法借助于人工介入,以提高分割准确性。Rother等提出

的GrabCut算法具有简洁的交互性及较为理想的分割结果[9],因此该方法在图像前后景分离中具有广泛的应用。但是该方法存在需要人工介入进行初始化的缺点,因此国内外学者展开对GrabCut自动化改进算法的研究[10-12]。Pourjam通过主动形状模型(Active Shape Model, ASM)训练得到感兴趣目标的轮廓位置[13],但是其分离结果受限于训练模型的选取。王告等人采用K-means算法获取目标区域并进行GrabCut初始化[14],具有良好的分离结果,但是当感兴趣目标与背景颜色相近时,该算法容易对目标产生错误的判定,造成较差的分离结果。

人类视觉系统检测视觉显着性[15]的能力非常快速且可靠,依靠這种视觉显著性机制可在观察场景时从大量的信息中快速找到自己感兴趣的区域,因此,视觉显著性机制和传统的图像分割方法相结合[16]可以使人工交互的分割方法变成非监督分割方法。在获取图像显著区域方法的研究中,Itti和Koch提出的显著图为一幅亮度分布图[17],它与原图像大小相同,并且以亮度大小表示原图像中对应位置的显著性程度,后来Walther[18]等对该显著性模型进行了扩充,并且成功应用于目标识别。Hou等人提出谱残差模型,通过图像频谱相减和Fourier逆变换获取轮廓增强后的显著区域[19],该方法具有简单快速的优点。

针对以上问题,本文提出结合目标轮廓增强的自动GrabCut算法,该方法不需要人工交互,不仅能够实现图像的自动前后景分离,还能够解决已有算法在处理前后景颜色相近的图像时无法有效进行前后景分离的问题。

Gibbs函数反映像素对于前景、背景的符合程度,还是判断一幅图像相邻像素之间相似程度的标准。如果像素被赋予了一个更加接近真实的标签,结果会使总能量函数减小,因此可以将图像分割问题转化为二元划分问题,由模型参数的迭代来实现能量最小化,再用最大流最小分割方法求取有向图的最优解,得到分割结果。

3  改进的自动GrabCut图像分割

综合SR算法与原始GrabCut分割方法,提出基于目标轮廓增强的自动GrabCut分割方法,步骤如下:

(1)采用谱普残差算法对图像进行处理,获取目标轮廓增强的显著图。

(2)采用γ变换[23]对显著图进行图像增强处 理,用自适应阈值法[24]进行二值化处理。

(3)经过二值化处理后的图像会出现空洞而影响后续的操作,采用形态学进行处理。

(4)对形态学处理后的二值图像进行连通区域分析,自动获取目标区域最小外接矩阵及矩阵四角的点坐标。

(5)根据获取的目标位置信息在原图像上进行GrabCut算法的初始化,得到分割结果。

各个步骤具体效果如图1所示。

4  对比实验

将传统的GrabCut方法与所提方法进行比较,对比结果如图2所示。比较第(Ⅱ)列和第(III)列,可以看出所提方法能够达到原始的GrabCut算法分离效果,同时,在实验中发现,由于人工选取掩膜时存在人为因素的影响,如框取区域太大,可能使得分割结果未能达到预期效果。所提方法较好地解决了此类问题。

如图3,第(1)列是原图像,第(2)列是[6]中用K-means聚类方法对图像内像素进行二分类,第(3)列为[6]中方法(以下称为KM-G)经过形态学处理后的二值图,第(4)列是所提方法获取轮廓增强后的显著图,第(5)列是所提方法形成的二值图。所提方法主要利用形成的二值图进行目标区域标注和初始化GrabCut,KM-G方法用K-means算法对图像进行预分割,同样利用形成的二值图进行目标区域标注和初始化GrabCut算法,因此获取目标二值图的完整程度对后续的分割有重要影响,由第(3)列和第(5)列可以看出,[6]的方法在处理简单并且前后景颜色差异较大的图像时,具有较优的效果,但是在处理前后景颜色相近的图像时,所提方法获取目标二值图要优于KM-G方法,可以更好地获取目标区域。表1表示两种算法分别处理200张前后景颜色相近图像(SC)和200张前后景颜色差异较大的图像(DC)时计算平均准确率和平均召回率的对比结果。

其中,召回率越高,表示目标被分割的越完整,而准确率越高,表示分割的结果中所含的背景部分越少,由表1可以看出,本文所提方法在处理前后景颜色相近的图像时,拥有更高的召回率和准确率,

表明本文所提方法在处理前后景顏色相近的图像时,图像分割效果明显优于已有的算法。

5  结语

图像分割一直都是模式识别和图像处理领域的热门研究课题,传统的GrabCut分割需要人机交互,效率较低。针对此问题,提出了一种基于目标轮廓增强的自动GrabCut算法。首先利用SR算法对目标轮廓增强,获取感兴趣目标的粗略位置,然后经过形态学获得二值化图像,再进行连通区域分析得到初始化掩膜,最后用获取的掩膜在原图中对GrabCut算法初始化,得到最终的分离结果。本文所提算法实现了GrabCut算法自动化,对背景简单的图像有较好的前后景分离效果,且在处理前后景颜色相近的简单背景图像时,效果要优于已有的一些算法。但是对于复杂图像的处理效果较差,在后续的实验中还需要进一步改进。

参考文献

丁亮, 张永平, 张雪英. 图像分割方法及性能评价综述[J]. 软件, 2010, 31(12): 78-83.

Arbeláez P, Maire M, Fowlkes C, Malik J. Contour detection and hierarchical image segmentatio-n. [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 33(5).

姜全春, 王宁, 李雷, 蒋林华. 一种新的基于超像素聚类的图像分割算法[J]. 软件, 2019, 40(06): 44-48.

李 健, 牛振山. 基于第2代 Curvelet的非监督式纹理缺陷分割[J]. 中国图象图形学报, 2011, 16(10): 1812-1817.

陈洁, 胡永, 刘泽国. 基于标记的分水岭图像分割算法研究[J]. 软件, 2012, 33(9): 115-117.

Jifeng Ning, Lei Zhang, David Zhang, Chengke Wu. Interactive image segmentation by maximal similarity based region merging[J]. Pattern Recognition, 2009, 43(2).

李斌, 李蓉, 周蕾. 分布式K-means聚类算法研究与实现[J]. 软件, 2018, 39(01): 35-38.

王栋, 唐晶磊. 一种改进的One-Cut交互式图像分割算法[J]. 计算机工程与科学, 2018, 40(06): 1111-1118.

Rother C. GrabCut: Interactive foreground extraction using iterated graph cuts[J]. Proceedings of SIGGRAPH '04, 2004, 23.

刘辉, 石小龙, 漆坤元, 等. 融合深度信息的Grabcut自动图像分割[J]. 小型微型计算机系统, 2018, 39(10): 2309- 2313.

梁耀, 黎双文, 刘鑫磊, 李丰果. 复杂背景下目标树叶自动分割的GrabCut算法[J]. 华南师范大学学报(自然科学

版), 2018, 50(06): 112-118.

陈骏, 刘晓利. 基于分形的改进Grabcut目标自动分割[J]. 计算机工程与应用, 2017, 53(01): 163-167+177.

Pourjam E, Ide I, Deguchi D, et al. Segmentation of human instances using grab-cut and active shape model feedback[C]// MVA. IAPR Intern-ational Conference on Machine Vision Appli-cations. Kyoto: MVA, 2013: 77-80.

王告, 俞申亮, 巨志勇, 馬素萍. 一种改进Grabcut算法的彩色图像分割方法[J]. 软件导刊, 2019, 18(06): 171-175+2.

王文冠, 沈建冰, 贾云得. 视觉注意力检测综述[J]. 软件学报, 2019, 30(02): 416-439.

张巧荣, 景丽, 肖会敏, 等. 利用视觉显著性的图像分割方法[J]. 中国图象图形学报, 2011, 16(5): 767-772.

Itti L, Koch C, Niebur E. A model of saliencybased visual attention for rapid scene analysis[J]. IEEE Trans-actions on Pattern Analysis and Machine Intelligence, 1998, 20(11): 1254-1259.

Walther D, Itti L, Riesenhuber M, et al. Attentional Selection for Object Recognition - a Gentle Way[M]//Biologically Motivated Compu-ter Vision. Springer Berlin Heidelberg, 2002.

Hou Xiaodi, Zhang Liqing. Saliency detection: a spectral residual approach[C]//Computer Vision and Pattern Recognition, 2007: 1-8.

BOYKOV Y, JOLLY M P. Interactive graphcuts for optimal boundary and region segmentation of objectsin N-D images[C]//IEEE International Conference on Computer Vision, 2001: 105-112.

Blake A, Rother C, Brown M, et al. Interactive Image Segmentation Using an Adaptive GMMRF Model[M]// Computer Vision - ECCV 2004. Springer Berlin Heidelberg, 2004.

Wren C R, Azarbayejani A, Darrell T, et al. Pfinder: Real- time tracking of the human body[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 1997, 19(7): 780-785.

朱铮涛, 萧达安. 基于非线性调整的伽马校正图像增强算法[J]. 计算机工程与设计, 2018, 39(09): 2822-2826+2866.

郭璇, 郑菲, 赵若晗, 等. 基于阈值的医学图像分割技术的计算机模拟及应用[J]. 软件, 2018, 39(3): 12-15.