王建林,潘建平
(重庆交通大学 土木工程学院,重庆 400074)
随着我国经济的高速发展,桥梁建设十分迅速,大跨径的斜拉桥更是被广泛采用。拉索是斜拉桥的主要受力部件之一,其耐久性和可靠性直接影响桥梁的安全和使用寿命,拉索表面因长期暴露于自然环境中并承受交变载荷,会出现不同程度的老化和损坏[1]。在桥梁运营期间,需要对拉索表面做年度检测来确定拉索表面状况和估计内部钢丝状况,并形成检测报告[2]。目前的实际生产工作中,亟待破解桥梁拉索表面缺陷自动化检测技术。
当前,桥梁拉索表面缺陷检测包括视频采集和视频处理。在视频处理环节,相关单位主要采用人工浏览和截取图像的方式进行,而自动化视频处理尚处于研究试验阶段[3]。国外的一些高校和研究机构对桥梁拉索视频处理方法进行了研究[4-5],但目前未见在实际生产应用中的相关报道和产品;国内方面,重庆大学[6]、东南大学[7]和华南理工大学[8]也作了相关研究,在自动化视频采集方面取得了一定成果,但视频数据自动化处理技术仍不够成熟。
桥梁拉索表面缺陷图像背景分割是自动化视频处理的关键技术环节,它将视频图像中的拉索区域与背景分割开,为后续的病害识别提供优质图像。据此,本文提出了一种利用掩模处理来对桥梁拉索表面缺陷图像进行背景分割的方法。
将图像在Lab颜色空间利用阈值法进行分割,再利用数学形态学去噪,最后进行掩模处理完成图像的分割。
1.1.1 RGB颜色空间
颜色空间是用数学方法将颜色形象化表示的彩色模型,RGB颜色空间是最常见的一种颜色空间。用RGB颜色空间表示颜色的方法简单,但是不是均匀的颜色空间,不符合人的感知心理。在RGB颜色空间要改变一个颜色时,3个通道的值都需要修改,RGB颜色空间上的距离并不代表人眼视觉上的颜色相似性[9]。因此,在数字图像分割中很少直接在RGB颜色空间进行,而是转换到其它颜色空间进行处理。
1.1.2 Lab颜色空间
Lab颜色空间是一种与设备无关的颜色空间,也是一种基于生理特征的颜色空间,即用数字化的方法来描述人的视觉感应,因此在数字图像分割中具有优势[10]。Lab颜色空间中明度和颜色是分开的,如图1所示,L分量用于表示像素的亮度,取值范围是[0,100],表示从纯黑到纯白;a表示从红色到绿色的范围,取值范围是[127,-128];b表示从黄色到蓝色的范围,取值范围是[127,-128]。
图1 Lab颜色空间立方体
1.1.3 RGB颜色空间转Lab颜色空间
RGB颜色空间无法直接转换到Lab颜色空间,需要先转换到XYZ颜色空间再转换到Lab颜色空间[11],即RGB—XYZ—Lab。因此该颜色空间转换分两部分进行,具体步骤如下所示:
1)RGB颜色空间—XYZ颜色空间
假设r、g、b为3个颜色通道的值,取值范围均为[0,255],转换式如式(1)所示:
(1)
其中,gamma函数是用来对图像进行非线性色调编辑,目的是提高图像的对比度,该函数不是唯一的。
2)XYZ颜色空间—Lab颜色空间
假设L、a、b是最终的Lab颜色空间3个通道的值,转换式如式(2)所示:
(2)
其中X、Y、Z是RGB转XYZ后计算出来的值,Xn、Yn、Zn的默认值一般为95.047,100.0,108.883[11]。
阈值分割方法直观、简单、计算速度快,且其处理过程性能稳定,因此图像阈值分割方法是目前最受青睐的一种图像分割方法。常用方法包括直方图法、Otsu法、分水岭法等。
1.2.1 阈值分割原理
设原图像为f(x,y),经过分割后的图像为g(x,y),单阈值分割的目的是确定一个阈值T,将大于T的像素点的值置为1,小于T的值置为0,如式(3)所示:
(3)
单阈值分割后的图像仅有灰度级为0和1的两类像素,该分割方法适用于仅将图像分割为目标和背景两部分,且灰度级范围分布明显不同的情况。
1.2.2 直方图阈值分割法
图像的灰度级直方图反应了一幅图像中灰度级分布信息,是阈值选取的重要参考依据[12]。直方图法分割形式简单,按照一定的规则找到一个阈值T即可完成分割,该方法可以通过选取一个初值,然后进行迭代找出最佳阈值,也可根据直方图人工选取最佳阈值。
数学形态学的语言是集合论,数学形态学中的集合表示图像中的对象,在二值图像中,所有白色像素的集合是该图像的一个完整的形态学描述[13-14]。数学形态学的基本思想是基于结构元SE的操作。
1.3.1 数学形态学基本操作
数学形态学的基本操作有腐蚀、膨胀、开操作和闭操作。腐蚀是一种消除边界点,使边界向内部收缩的过程;膨胀是将与物体接触的所有背景点合并到该物体,使边界向外扩张的过程;开操作一般会平滑物体的轮廓,断开较窄的狭颈并消除细的突出物;闭操作会弥合较窄的间断和细长的沟壑,消除小的孔洞,填补轮廓线中的断裂。
1.3.2 连通分量的提取和孔洞填充
从二值图像中提取连通分量是自动图像分析的核心。如式(4)迭代过程可以完成连通分量的提取,其中,A是包含一个或多个连通分量的集合,并形成一个阵列X0,B是一个8或者4连通域的结构元。
Xk=(Xk-1⊕B)∩A(k=1,2,3…).
(4)
当Xk=Xk-1时,迭代过程结束,Xk包含输入图像中的所有连通分量。
一个孔洞被定义为由前景像素相连接的边界所包围的一个背景区域,由式(5)迭代过程来完成孔洞的填充。
Xk=(Xk-1⊕B)∩Ac(k=1,2,3…).
(5)
其中,当Xk=Xk-1时,迭代过程结束,Xk包含所有被填充的孔洞。Xk和A的并集包含所有填充的孔洞及这些孔洞边界。孔洞填充能够填充图中所有被边界包围的孔洞,但是不能填充与边界相邻的区域。
掩模处理的实质是图像乘法运算,是图像代数运算的一种。图像代数运算是指将两幅或多幅图像通过对应像素之间的加、减、乘、除运算得到输出图像的方法[15]。其中,乘法运算主要屏蔽图像的某些部分来完成图像掩模处理,或者乘以一个常数,改变图像的亮度。其具体运算如式(6)所示:
C(x,y)=A(x,y)*B(x,y).
(6)
其中,A(x,y)和B(x,y)表示进行代数运算的两幅图像,C(x,y)表示A(x,y)和B(x,y)运算后的结果图像。
通过分析爬索机器人获取拉索图像数据的原理,发现对于同一根拉索,由同一台摄像机拍摄的图像中拉索目标的位置固定。据此本文将针对同一根拉索,由同一台摄像机获取的图像作为一个处理单元。
根据以上分析,提出了基于Lab颜色空间与掩模处理的图像分割方法对桥梁拉索表面缺陷图像进行背景分割。其主要思想是在一个处理单元中先通过阈值分割获取一幅图像的背景掩模,然后利用该掩模对处理单元的其它图像作掩模处理,完成桥梁拉索表面缺陷图像的分割。具体过程包括以下三个方面,其技术路线图如图2所示。
1)选择一幅图像,将该图像从RGB颜色空间转换到Lab颜色空间,在Lab颜色空间进行阈值分割;
2)对分割后的图像进行数学形态学处理,得到该图像的背景掩模;
3)利用该背景掩模对该处理单元所有图像进行掩模处理,得到所有图像的目标区域,完成拉索图像背景与目标的分割。
图2 拉索图像分割技术路线图
为了使实验结果具有可比性,所有的实验都在处理器为Intel(R) Xeon(R) CPU E3-1231 v3,主频为3.40 GHz,内存为8.0 GB的PC机上,以MATLAB 2013A为平台进行。
本次实验数据由爬索机器人在野外实际获得,具有实际应用价值。实验一共选取了512幅桥梁拉索表面缺陷图像,每幅图像大小约10 KB,是同一根拉索,由同一摄像机获取视频中的一部分图像,将其作为一个处理单元。包括了无损伤的图像、轻微刮伤的图像、严重损坏的图像和有污迹的图像等,具有很强的代表性。
2.2.1 基于Lab颜色空间的单阈值分割
首先将一幅原始桥梁拉索表面缺陷图像从RGB颜色空间转换到Lab颜色空间,然后在L通道进行直方图单阈值分割,分析直方图模式,并优化设置分割阈值,得到初步的拉索目标区域。如图3所示为试验中的一幅桥梁拉索表面缺陷图像,图4是该图像在RGB颜色空间中R、G、B3个通道的直方图和Lab颜色空间中L、a、b3个通道的直方图模式对比图。
图3 拉索表面缺陷图像
图4 RGB-Lab颜色空间3个通道直方图对比图
对比直方图模式,在RGB颜色空间3个通道的直方图都呈正态分布,信息分布广泛,在Lab颜色空间,只有L通道呈正态分布,信息分布广泛,而a、b两个通道信息全部集中于中间部分。桥梁拉索表面缺陷图像分割的目标是将其分为目标区域和背景两部分,因此,在Lab颜色空间选择L通道直方图单阈值分割方法进行分割,能够快速准确地分割出目标区域和背景区域。在该试验中,通过综合分析与优化,将分割阈值设置为105,其最终分割结果如图5所示。
图5 Lab颜色空间阈值分割结果
2.2.2 数学形态学去噪
数学形态学处理的具体流程为:
1)对阈值分割结果用结构元为3×3的全1矩阵 进行开运算,去除较窄的狭颈和消除细的突出物,完成轮廓的平滑,得到开运算二值图像如图6(a)所示;
2)标记开运算二值图像的所有连通分量,求图像中所有连通区域的面积,选取面积最大的连通域,即为拉索目标区域图像,如图6(b)所示;
3)对最大连通域图像进行孔洞填充,填充位于拉索目标区域的背景,得到填充孔洞后的二值图像,如图6(c)所示;
4)对填充孔洞后的二值图像做逻辑非运算,提取所有连通分量,选取面积最大的两个连通域,去除与边界相连的噪声,即可得到拉索目标区域掩模;
5)对拉索目标区域掩模做逻辑非运行,得到最终的背景掩模,如图6(d)所示。
2.2.3 掩模处理
本文方法的关键是图像掩模处理。在一个处理单元中,获取其中一幅图像的背景掩模,利用该背景掩模对处理单元的所有图像进行掩模处理,即可完成该处理单元所有图像的背景分割。
图6 数学形态学去噪结果图
2.3.1 处理结果
常规方法首先对图像进行颜色空间变换,然后采用直方图阈值分割对变换图像进行分割处理,并结合数学形态学方法消除分割结果的噪声影响。本文与常规方法进行了对比实验,如图7所示。图7(a)为严重损伤的桥梁拉索表面缺陷图像,因为损伤严重,导致了拉索与背景的边缘模糊;图7(b)为常规方法分割的结果,分割结果不理想;图7(c)为本文方法分割的结果,成功地完成了分割。实验结果表明,本文的方法能够成功分割桥梁拉索表面缺陷自动化检测过程当中难以分割的图像。
图7 损伤严重的拉索图像分割对比图
在该处理单元的512幅图像中选择具有代表性的4幅图像进行分割效果展示,如图8所示,图8(a)、图8(c)、图8(e)、图8(g)为分割前的4幅图像,分别为无损伤的图像、轻微刮伤的图像、有污迹的图像和严重损坏的图像;图8(b)、图8(d)、图8(f)、图8(h)为运用本文方法对该处理单元进行分割的结果,每一幅图像的分割结果都较理想。
图8 处理单元分割前后对比图
2.3.2 时间与效率
表1统计了利用常规方法和本文方法进行批量处理的时间成本。对两种处理方法的时间成本进行对比分析发现,图像数量越多,本文方法的优势越明显,效率是前者的6倍左右,如图9所示。在实际的桥梁拉索表面年度检测过程中,其图像数量非常大,因此利用本文方法能够显著地提高检测效率。
表1 两种方法计算时间对比 s
图9 两种方法时间成本对比图
本文通过分析爬索机器人获取数据的原理,以及当前桥梁拉索自动化检测所存在的问题,提出了一种利用掩模处理的桥梁拉索表面缺陷图像背景分割的新方法。该方法在Lab颜色空间进行阈值分割,并结合数学形态学进行去噪处理得到背景掩模,然后利用背景掩模对原始图像进行掩模处理,最终完成拉索表面缺陷检测图像分割。
本文方法成功地实现了桥梁拉索表面缺陷图像的背景分割,相对常规方法,本文方法具有分割速度快、抗干扰能力强和分割效果好的优点,具有一定的实用价值,为后续的病害检测和识别提供了条件。但是本文方法要求图像中拉索目标区域变化不大,使该方法应用具有一定的局限性。后续需要进一步研究对分割方法的适应性。