□ 黄 旭 □ 张世义 □ 李 军
重庆交通大学 机电与车辆工程学院 重庆 400074
图像识别来源于模板匹配,从人类自身的视觉识别中演变而来。人类自身视觉识别的思路为,将眼前的物体和脑海中的印象进行对比,完成对眼前物体的定义。图像识别也是如此,对原图像提取特征,和需要的目标特征进行对比,从而达到识别的效果。图像识别在现代科技中扮演着至关重要的角色,许多领域,如无人驾驶、人脸识别、导弹跟踪等,都离不开图像识别。随着时代的进步、科技的发展,图像识别技术不断完善,发展到今天主要有统计识别、模糊集识别、神经网络识别、模板匹配识别、结构识别、支持向量机识别等方法。此外,在某些特殊情况下,还有利用辅助靶标的识别方法。基本上所有图像识别技术都离不开图像预处理、图像分割、特征提取、特征匹配识别等步骤。其中,图像分割指为了节约计算资源,将图像根据某些参数分成不同的区域,进而剔除无效区域。基于阈值、区域、边缘的分割方法,以及超像素分割方法,都是如今常见的图像分割方法。
图像分割在图像识别中起至关重要的作用,选择合理的分割方法,可以大大缩短图像识别的时间,节省计算资源。如在自动驾驶车辆领域,通过图像分割可以快速识别出车道线、指示牌、交通信号灯等重要交通信息。可见,图像分割非常重要。
基于阈值的图像分割法是一种常见的图像分割方法,主要思想为,不同的目标具有不同的特征,如颜色、灰度、轮廓等,利用特征间的细微差别,选取阈值划分为目标物与背景。阈值分割能够快速地实现图像分割,常用于目标与背景相差较大的情况,对于复杂环境识别难度较大。
刘睿等[1]基于灰度值最大类间差算法对图像进行二值化处理,利用不断变化的阈值使不同分类之间的灰度值差异较大,能够更加准确地进行图像识别。
李成等[2]在进行目标识别时采用红外成像技术获得初始图像。考虑到红外图像的缺点,通过复合去噪和对比度增强等手段进行处理,用于保障后续操作的连续性。考虑到红外图像的灰度变化明显,采用阈值分割法来进行分割。选取高亮区的比例、灰度标准的偏差值、长宽比、复杂度、紧凑度等参数作为特征向量,结合模糊综合评判法完成图像目标的识别。
Troya-galvis等[3-4]提出采用多阈值相结合的方法进行单一目标分类分割的框架,由多个框架共同运作,达到精确分割的目的。
阈值分割能够较为快速地完成图像的分割,但是需要目标和周围环境具有明显的灰度值差异,因此往往需要进行对比度增强等处理。由于对复杂图像难以进行准确的分割,因此人们常用阈值分割进行初步分割,在此基础上再运用边缘检测分割、区域增长分割等方法,可以节约计算资源。
基于区域的图像分割法分为区域生长和分裂合并两种类型。对于区域生长类型,先选取一个像素,然后不断合并具有相似特征的像素,从而达到图像分割的目的。对于分裂合并类型,将整个图像作为出发点,逐渐排除或合并相似的像素,最终完成图像的分割。和传统阈值分割方法相比,区域分割在像素的相似性和空间的邻接性上更有优势,可以明显减小噪声的干扰,具有更强的鲁棒性。
李文静等[5]在进行室内识别时,考虑室内场景的复杂性,结合欧氏聚类算法高效率分割的特点和区域生长对复杂环境适用度高的优点,利用区域生长将物体分割出来,应用欧氏聚类算法对归属物品分割,与标志库进行对比,最终完成物体的识别。
王丹丹等[6]针对早期的苹果体型小,不易识别的问题,提出了区域分割和全卷积网络相结合的识别方法,首先通过深层次神经网络提取苹果的典型特征,然后进行区域识别定位,从而克服复杂背景、果实重叠等干扰因素,提高识别的准确率。
金旭辉[7]对交通指示牌进行识别,在色调、饱和度、亮度颜色空间中,结合颜色分层技术和简单阈值处理,利用区域分割快速找到对应颜色的指示牌区域,通过数学形态学手段对区域形状进行完善,提高识别准确性。
基于边缘的图像分割法利用不同区域中像素灰度值不同,以及区域边界像素灰度值变化比较大的特点,检测到边界点,并将各个边界点连接起来,从而完成区域分割。Roberts、Sobel、PreWitt、坎尼等都是常见的边缘检测方法。
Wang等[8]对图像进行二值化处理,根据目标灰度值和环境灰度值相差较大的特点,采用小波多尺度边缘检测法提取车辆的边缘信息,从而进行分割,并结合矩不变量的特征和改进反向传播神经网络完成对车辆的识别。
陈强等[9]在兴趣区域中考虑钢轨附近的灰度值分布在数值较小的区域,采用对数变换图像增强的处理方法使需要的数值区间被拉大,压缩无用的数值区间,提高识别度,并利用坎尼算子和概率霍夫变换提取轨道线。
王红雨等[10]为减小光线条件差和噪声污染的影响,将模糊理论和局部二值模式算子相结合,得到改进的边缘提取算法,以此提高图像的边缘连续性和识别的速度。但是,由于这种方法产生的边缘粒子较粗,因此难以进行精准识别。
Wang等[11]在对手势识别时,采用双边滤波对图像进行处理,利用优化彩色视频信号颜色空间的椭圆模型提取手部肤色,加入Sobel算子完成对手势的分割,以此达到对手势的精确图像识别。
超像素图像分割法指将图像中具有相似特征的局部连续像素聚合在一起的方法。和传统方法相比,超像素分割有利于图像局部特征的提取,减小了处理对象的规模,便于计算。
王璨等[12]为了提高农作物与杂草识别的准确性,在超像素分割的基础上,提出了基于卷积神经网络提取多尺度分层特征的识别方法。应用这一方法,首先建立神经网络模型提取分层特征,通过特征对图像进行识别;然后进行超像素分割,将每个超像素内全部像素的平均类别作为像素的类别;最后将相同的像素类别合并,实现图像的分割,从而达到快速识别。
曹正文等[13]采用基于线性谱聚类的超像素分割对电子计算机断层扫描图像进行分割,根据同一个超像素具有相似性的特征,对图像进行降维处理,得到视觉概要图,有利于图像中胰腺器官的分割。
杨飞等[14]通过无监督分割均值漂移对图像进行分割,得到多个尺度的超像素分割,每个超像素代表一个尺寸,并在此基础上建立道路分割模型。试验表明,这一模型具有良好的道路检测性能。
刘艳等[15]为解决传统视差图的毛刺现象,将二进制与超像素分割相结合,使视差优化时的边缘保持平滑。
对于自动驾驶汽车,往往需要快速分割出感兴趣的区域,缩减后续操作空间,节约计算资源,达到快速识别的目的。对于道路交通指示牌的分割识别,目前的技术主要是通过目标颜色生成相应的灰度图像,然后进行迅速分割,结合目标形状锁定区域进行识别。目前技术仍受形状相似或颜色相似干扰,在未来的发展中需要提高。
Agarwal等[16]在对交通信号灯进行识别时,为防止被发光二极管灯等光元素干扰,围绕三种不同颜色的信号灯分别生成二值图像,并利用边缘检测法提取轮廓,从而完成对交通信号灯的识别,流程如图1所示。
图1 交通信号灯识别流程
Tedjojuwono等[17]为了快速对车牌进行识别,采用一种互联图像分割,首先对原图像进行对比度增强和降噪等预处理,然后采用坎尼算子提取车牌轮廓,从而使图像分为几个不同的区域,最后对几个不同区域的轮廓进行比较,得到车牌区域。
宋文杰等[18]对图像进行预处理增强对比度,根据标志特征,结合色相、饱和度、明度和色彩空间进行色彩分割,快速提取目标轮廓,并应用中值滤波消除噪点,利用膨胀腐蚀原理完善目标轮廓,从而达到分割的效果。
Zaklouta等[19]根据标志颜色,采用对应色彩增强的方法处理图像,利用全局阈值法对图像快速分割,锁定标志位置,结合梯度直方图与支持向量机检测器检测三角和圆形符号,以此达到实时识别交通标志的目的。
Khan等[20]在亮度-颜色分量空间色度层上提取颜色特征,利用K均值聚类算法分割出感兴趣区域,根据数据库对形状进行匹配识别,找出指示牌并对其进行识别分析。
笔者主要介绍了四种不同的图像分割方法,每种分割方法都有优劣。基于阈值的图像分割法能够快速分割图像,但对于复杂图像难以进行有效分割。基于边缘的图像分割法容易产生虚假的边缘或者孤立的线段。基于区域的图像分割法会对无目标物的空白区域进行分割,浪费计算资源。超像素图像分割法难以在计算速度和计算精度之间达到很好的平衡。图像分割技术发展至今,一般同时采取多种分割方法,如利用阈值分割和边缘分割速度快的特点,先确定大致区域,再进行区域分割,以此缩短计算时间,提高效率。如今图像分割技术已经基本成熟,今后将会围绕分割速度进行研究。