基于阈值的图像分割算法研究综述:原理、分类及典型算法

2023-04-29 00:00:00杨林蛟

摘 要:随着计算机技术的飞速发展,图像处理技术在各个领域都得到了广泛应用,如产品质量检测、医学图像处理、军事目标的定位与跟踪等。作为图像处理技术和计算机视觉技术的研究基础,图像分割技术目前已出现了大量不同类型的算法,并在各个领域的应用中发挥着重要的作用。其中,基于阈值的图像分割算法因具有简单有效、计算量小、性能稳定等优点而受到了人们的普遍青睐。首先,对图像分割技术按照不同的划分方式进行了简单的分类;其次,对阈值分割算法的基本原理、分类及最典型的Otsu算法的基本思想进行了详尽的介绍;最后,对阈值分割算法目前存在的问题进行了阐述,并对算法未来的发展趋势进行了展望。研究工作可为图像处理技术的进一步发展提供理论借鉴。

关 键 词:图像处理; 阈值分割; 阈值选取; 算法

中图分类号:TP391 文献标志码:A

doi:10.3969/j.issn.1673-5862.2023.06.007

A review of threshold-based image segmentation algorithms: Principles, classification and typical algorithms

YANG Linjiao

(College of Chemistry and Chemical Engineering, Shenyang Normal University, Shenyang 110034, China)

Abstract:With the rapid development of computer technology, image processing technology has been widely used in various fields, such as product quality detection, medical image processing, military target positioning and tracking. As the basis of image processing technology and computer vision technology, a large number of different types of algorithms has emerged, and these algorithms play an important role in various fields of application. Among them, threshold based image segmentation algorithm has been welcomed because of its advantages of simple,effective, little computation and stable performance. Firstly, the image segmentation technology is simply classified according to the different partitioning ways. Secondly, the basic principle, classification, and the basic idea of the most typical Otsu algorithm of threshold segmentation algorithm are introduced in detail. At last, the existing problems of threshold segmentation algorithm are described, and the future development trend of this algorithm are forecasted. This work can provide theoretical reference for the further development of image processing technology.

Key words:image processing; threshold segmentation; threshold selection; algorithm

图像处理技术一般是指利用计算机对图像进行分析,以达到所需结果的技术,又可称为影像处理。图像处理技术主要包括图像的数字化、图像的增强和复原、图像的分割和识别、图像的数据编码等。其中,图像分割在计算机视觉中起着至关重要的作用,是图像处理技术的基础。图像分割的目的是使图像得到简化或改变图像的表示形式,图像经过分割后会形成一些特定的、具有独特性质的区域,这里的独特性质一般指像素的灰度、颜色和纹理等。其过程就好比把图像中的每一个像素打上一个特定的标签,使得具有相同标签的像素具有相同的视觉特性,从而用来定位图像的物体和边界。

图像分割技术一直是计算机视觉研究的热点之一,历经数十年的发展,大量的分割算法被人们相继提出并得到广泛应用[1。其中,基于阈值的图像分割算法因具有实时、有效、自动、应用广泛等优点而受到人们的广泛关注。

本文首先对现有的图像分割技术进行了简单的划分,接着对基于阈值的分割算法的原理、分类及最典型的Otsu算法进行了系统的介绍,以期为图像处理技术的进一步发展提供理论借鉴。

1 图像分割技术的分类

目前,人们对图像分割技术进行了大量的研究,并取得了卓有成效的研究成果,开发出了很多算法。如图1所示,如果按照图像类型划分,图像分割技术可分为灰度图像分割和彩色图像分割,灰度图像分割主要用于处理非自然图像,彩色图像分割则主要用于处理自然图像;按照是否存在用户交互,可将图像分割技术分为监督式分割和非监督式分割,监督式分割主要用于对图像和视频进行编辑,非监督式分割则主要用于处理图像背景较为单一的文本图像、工业图像等;按照表示方式的不同,图像分割技术又可分为基于像素级的分割和超像素级的分割,目前大多数的分割算法属于基于像素级的分割技术,其通常具有较高的处理精度;按照图像的另一种表示方式,图像分割技术则分为单一尺度的分割和多尺度分割,单一尺度的分割是在原始尺度空间上构建相关的分割模型,而多尺度分割则可充分挖掘图像的基本信息;从属性来划分,图像分割技术可分为单一属性的分割和多属性分割,前者只对灰度、颜色、纹理等特征中的一种属性进行分割,后者则能综合运用图像的多种属性;从操作空间来划分,图像分割技术可分为利用图像特征信息的分割和利用空间位置信息的分割,其中前者主要包括阈值分割算法和聚类算法等,后者主要包括水平集分割算法、活动轮廓算法等;从驱动方式划分,图像分割技术可分为基于边缘的分割和基于区域的分割。

2 阈值分割算法

阈值分割算法主要利用图像的特征信息对图像进行分割,目前已有上百种算法被陆续提出。其主要思想是不同的目标具有不同的诸如颜色、灰度、轮廓等特征,根据特征间的细小差别,通过选取特定的阈值将目标物与背景划分开来,进而实现快速的图像分割。

2.1 阈值分割算法的基本原理

阈值法的基本原理是先确定一个阈值[2,然后将所有像素按照其特征值与阈值的大小关系划分为2个类别。当特征值大于阈值时,该像素被归为目标类;反之,被归为背景类。通过选择合适的阈值,可以实现对图像目标与背景的有效分离。

设原始图像为f(x,y),在f(x,y)中找出特征值T,将原始图像分割为2个部分,得到分割后的图像为

若取b0=0(黑),b1= 1(白),即为图像的二值化。

2.2 阈值分割算法的分类

根据利用信息种类的不同,可将阈值分割算法分为以下几类:

1) 基于直方图形状的方法。该类方法主要根据直方图的形状属性来划分像素,其又可分为“凸壳”法、“峰谷”法和形状建模法3类。1997年,Carlotto[3对图像的概率密度进行了多尺度分析,并以此估计最佳阈值;1998年,Cai和Liu[4利用Prony谱分析法得到了图像多重指数信号能量谱的近似值;之后,Guo和Pandit[5提出了一个全极模型。

2) 基于熵的方法。该类方法利用灰度分布的熵信息来划分像素。Johannsen和Bille[6最早对熵算法进行了研究。之后,很多学者对这一算法进行了改进,如Pal[7在交叉熵的基础上建立了一种对前景和背景后验概率密度的模型;Sun[8依靠“模糊事件熵”的最大化,采用了Zadeh的S隶属度函数。

3) 基于聚类的阈值分割方法。该类方法又可分为迭代法、聚类法、最小误差法和模糊聚类4类,其主要通过对灰度数据进行聚类分析来获取阈值。其中,聚类法是通过将前景和背景的加权方差最小化来获得最佳阈值,是阈值分割算法中较为经典的算法之一。Liu和Li[9将聚类法扩展到了二维,景晓军等[10将聚类法扩展到了三维。

4) 基于对象属性的方法。该类方法通过度量原始图像与二值图像间的诸如灰度片段、形状紧密性、纹理等的属性特性来选取阈值。基于对象属性的方法可分为片段保存法、边缘匹配法、模糊相似法、拓扑固定态法、最大信息法和模糊紧密性增强法6类。

5)基于空间的方法。该类方法又可分为同现方法、高次熵法、基于随机集合的方法和二维模糊划分法4类,其选取阈值的方式是度量灰度分布和邻域内像素的相关性。Chang等[11在确保源图像与二值图像的同现概率以最低程度发散的条件下建立了阈值;Brink[12认为空间熵可由二元熵在所有可能间隔的总和来计算。

6)局部自适应方法。局部自适应方法可以克服其他阈值算法的许多缺陷,受到了人们的普遍关注,其主要的2种形式分别为邻域法和分块法。邻域法一般会受到邻域范围的制约,因而对文字等狭长目标比较敏感,但对平坦的大块前景或背景容易造成误分;分块法的适用范围会更广,但分块之间结果的不连续是该方法的缺陷之一。

2.3 典型阈值分割算法介绍

Otsu阈值分割算法,也可称为最大类间方差算法,是最常用的一类阈值分割算法,也是阈值分割领域各类文献中被引用数量最多的算法之一。该算法选取使得类间方差最大的灰度值作为划分背景和前景的最佳阈值,其基本思想如下:

用σ2B表示类间方差,其表达式为

最佳分割阈值t*即为使得类间方差σ2B最大的阈值t:

上述Otsu算法又称一维Otsu算法,它在不对概率密度函数做出假设的情况下,以均值和方差的概率密度为基础对图像的分割状态进行描述,可以在很大程度上提高算法的运算速度。后来,人们又发展了二维Otsu阈值分割方法,它是在原来一维算法灰度值的基础上加入了像素邻域平均灰度作为第二维,因而提高了一维算法的抗噪声能力。Otsu阈值分割算法的分割效果如图2所示。

2.4 阈值分割算法目前存在的问题

虽然阈值分割算法在国内外研究者们数十年的努力下已经取得了长足的进步,但目前仍然存在着如不均匀光照、噪声干扰、文本图像“劣化”等问题亟待解决。其中,不均匀光照会使直方图中的目标波峰与背景波峰混杂在一起,从而降低直方图阈值法的效果;噪声对图像处理的整个过程都有影响,去噪已成为图像分割领域的一个研究重点;长时间保存的纸质文档会出现背面字迹浸透、字迹污染等现象,从而造成分割时产生大量的误分。

3 结论与展望

图像分割是计算机视觉的基础技术,分割效果将直接影响如目标定位、目标识别、目标跟踪、场景分析等的后续处理。在众多的图像分割算法中,阈值分割算法一直以其实时、高效等特点受到人们的普遍关注。但从目前来看,阈值分割算法仍面临着许多难以解决的困难,可行的解决方法是从更高的图像语义出发,对图像内容进行抽象分析,然后指导低层次的图像分割,重复这样的操作若干次,可以逐步提高分割的精度。目前,对该种分割方式的研究仍处于探索阶段。

参考文献:

[1]SEZGIN M,SANKUR B. Survey over image thresholding techniques and quantitative performance evaluation[J]. J Electron Imaging, 2004,13(1):146-168.

[2]阴国富. 基于阈值法的图像分割技术[J]. 现代电子技术, 2007(23):107-108.

[3]CARLOTTO M J. Histogram analysis using a scale-space approach[J]. IEEE Trans Pattern Anal Mach Intell, 1997,9(1): 121-129.

[4]CAI J,LIU Z Q. A new thresholding algorithm based on all-pole model[C]∥Proceedings of the 14th International Conference on Pattern Recognition. Bribane: IEEE, 1998:34-36.

[5]GUO R,PANDIT S M. Automatic threshold selection based on histogram modes and a discriminant criterion[J]. Mach Vision Appl, 1998,10:331- 338.

[6]JOHANNSEN G,BILLE J. A threshold selection method using information measures[C]∥Proceedings of the 6th International Conference on Pattern Recogn. Munich: Germany, 1982:140-143.

[7]PAL N R. On minimum cross-entropy thresholding[J]. Pattern Recogn, 1996,29(4):575-580.

[8]SUN C Y. A novel fuzzy entropy approach to image enhancement and thresholding[J]. Signal Process, 1999,75:277-301.

[9]LIU J Z,LI W Q. The automatic thresholding of gray-level pictures via two-dimansional Otsu method[J]. Acta Automatica Sin, 1993,19:101-105.

[10]景晓军,李剑峰,刘郁林. 一种基于三维最大类间方差的图像分割算法[J]. 电子学报, 2003,31(9):1281-1285.

[11]CHANG C,CHEN K,WANG J,et al. A relative entropy based approach in image thresholding[J]. Pattern Recogn, 1994,27(9):1275-1289.

[12]BRINK A D. Minimum spatial entropy threshold selection[J]. IEEE Proceedings, 1995,142(3):128-132.