刘 娣,周武能,张详位
(东华大学信息科学与技术学院,上海 201620)
从20世纪70年代中期开始,计算机技术和人工智能、思维科学研究的迅速发展,人们开始研究运用计算机系统解释图像,数字图像处理的先决条件是将图像转化为数字形式,存储在计算机中,然后按特定的目标,运用特定的操作来“改造”图像[1]。
传统的绕绳包装破损检验借助于人的视觉、主观判断能力或硬件设备,因而占用大量的人力,而且长时间劳动易产生视觉疲劳造成误检[2],严重影响出厂产品质量,流通出去也会对生产厂商的企业形象造成负面影响[3]。与传统工业检测相比,数字图像处理减少了成本,提高了检测的准确性。近年来工业检测中运用数字图像处理增强图像的特征信息,灰度图像的变换主要涉及直方图均衡化、边缘检测、阈值分割、对比度拉伸等,由于灰度图像丢失了彩色图像中的许多信息,其检测结果准确性不高。对于彩色空间的图像处理,主要涉及小波变换[4-6]、Retine x理论[7-9]、彩色边缘等方式。这些算法都能增强图像的特征信息,但容易受环境干扰,影响检测的准确性,不能满足工业绳团包装的实时检测。
针对这一情况,本文提出一种基于计算机视觉的薄膜破损检测方法:在取连续2帧图像的基础上,运用Hough变换分割出ROI区域,将对应的ROI区域通过小波变换,图像融合后转化到HSI(色度、饱和度、亮度)空间进行阈值分割,判断是否存在破损。
本文的算法实现了工业绳团包装中破损的实时检测,能够有效地降低时间,节约成本,提高检测的准确性。
本文中,计算机视觉就是运用计算机、摄像头等成像系统代替视觉器官作为输入敏感手段,由计算机代替大脑完成处理和解释,实现对透明薄膜包装的实时检测。
本文针对透明塑料薄膜的工业检测,设计出一套检测薄膜破损方案,具体流程如图1所示。
图1 检测流程图
如图1所示,利用计算机视觉代替传统的人工检测,当匀速传送带将包装绳团传送至碗状光源正下方时,进行连续2帧图片的拍摄。首先运用Hough变换提取感兴趣区域(ROI),由于拍摄时间隔时间很短,分割后的区域是互相对应的,其次参考各个像素点的能量和可见度,最大限度地增加特征区域和背景区域的对比度,运用连续的2幅图像进行处理,可以减少噪声对结果产生的影响,同时增加破损区域和周围区域的对比度,最后在S空间进行阈值分割,判别透明薄膜是否存在破损。
该方案中,包装材料是透明塑料薄膜,包装过程采用热处理,因此拍摄视频时,需要在暗黑的环境中,运用广角镜头、同轴光源和碗状光源进行拍摄。同轴光源可以有效地减少薄膜反射率,碗状光源主要是自动设置光源模式,将绳团和光线对比,拍摄效果更好[3]。即当绳团为红色时,碗状光源可设置为蓝光,当绳团是蓝色时,设置光源模式为红光。
霍夫变换(Hough)是图像处理中识别几何形状的一种方法,霍夫变换不受图形旋转的影响,易于进行几何图形的快速变换[10]。最基本的霍夫变换是从黑白图像中检测直线(线段)[9]。图像中的一个点对应参数平面中的一条正弦曲线,图像中的一条直线对应参数平面中的一个点。对图像上所有的点作霍夫变换,最终检测出的直线是在参数平面中直线相交最多的那个点所对应的直线。但在进行Hough变换时,所检测的几何形状必须为规则图形,不然结果会产生错误。
绳团的工业检测中,在同轴光源上方拍摄视频,同轴光源的可视区域是规则圆形,绳团在其圆内,可以运用Hough变换对连续2帧进行圆分割。这样可以更有针对性地对ROI区域进行处理,在进行图像处理时,减少了非感兴趣区域的像素干扰。
Hough圆变换的基本原理是将影像空间中的曲线变换到参数空间中,通过检测参数空间的极值点,确定出该曲线的描述参数。
对于图像中任意确定的一点均有参数空间的1个三维的锥面与之对应。对于圆周上的任何点集合{(xi,yi)},这些三维锥面构成圆锥面簇。若集合中的点在同一个圆周上,则这些圆锥簇相较于参数空间上的某一点,这点恰好对应于图像平面的圆心坐标及圆的半径。对于数字图像,则可写为:
其中ξ是考虑到对图像进行数字化和量化的补偿。
运用Hough变换提取出圆区域,对于后续的图像处理降低了干扰,减少了运行时间,提高了运行效率,更有利于孔洞破损的检测。
小波分析的数学思想来源于调和分析,其形成于20世纪50年代初的纯数学领域。“小”是指其具有衰减性;称之为“波”则是指它具有波动性,其振幅呈正负相间的震荡形式。小波变换有利于增强图像细节,突出特征区域。
采用二维离散小波进行图像增强,即对二维图像信号在水平和垂直方向做一维离散小波变换[14]。
进行二维变换时,需要一个尺度函数φ(x,y)和3 个二维小波 ΨH(x,y),ΨV(x,y)和 ΨD(x,y)。小波度量函数ΨH,ΨV,ΨD,表达了图像沿列方向的灰度变化(例如水平边缘),沿行方向的灰度变化(例如垂直边缘),沿对应对角线方向的灰度变化[18]。和可分离的“方向敏感”小波
定义一个尺度和平移基函数:
其中,上标i指出式(2)~式(4)中的方向小波。i是假定值H,V和D的上标。于是,大小为M×N的图像f(x,y)的离散小波变换是:
WiΨ(j,m,n)系数对尺度 j≥j0附加了水平、垂直和对角方向的细节。通常令j0=0,并且选择,因此有j=0,1,2,…,J-1 和 m=n=0,1,2,…,2j-1。给出式(5)和式(8)中的Wφ和,f(x,y)可通过小波反变换得到:
二维DWT可以使用数字滤波器和下取样器来实现。先简单地取f(x,y)的行的一维FWT,然后,取结果列的一维FWT,可以得到水平、垂直和对角线细节系数,得到基于小波变换的子图像和在每个尺度处的方向特征。反向进行处理,近似子图像和细节子图像被上取样,并在行和列上和一维滤波器进行卷积,得到j+1的近似,重复该过程,直至重建原图像。如图2所示。
图2 图像增强过程
图2中,↓2表示间隔性的采样,↑2表示在每个样本点间插入0值。
工业绳团包装中的破损为闭合图像,ΨH(x,y),ΨV(x,y),ΨD(x,y)保留原图像中的各个边缘等细节部分,突出了破损检测中的细节部分。
图像融合是把从同一场景获得的多幅图像综合成一幅图像的图像处理技术[12]。图像融合可以根据需要有效地突出源图像的共有部分、特征部分,强化融合后图像的对比度信息。本文中,图像融合采用连续的2帧,这样在图像融合时可减少噪声的干扰,并且较少了图像中有用信息的丢失,对图像的特征增强起到了叠加作用,更有利于进行图像判别。
小波变换后的图像f(x,y)是大小为M×N的数字图像,二维傅里叶变换(DFT):
截止频率在距频率矩形中心距离为D0的滤波器传递函数如下,其中D0是一个正常数,D(u,v)是频率域中点(u,v)与频率矩形中心的距离:
其中,令P=2M,Q=2N,在该滤波中,低频分量减少,高频分量未发生改变,高频是感兴趣特征。
在分割出的ROI区域中,绳团包装中可能存在的孔洞破损是高频分量,运用高频滤波可淡化背景区域的影响,突出高频与背景部分的差异。
作为显著性特征,源图像中像素的梯度能量作为图像融合的系数值[15]。通过比较分析,拉普拉斯能量(Energy of Laplacian,EOL)比梯度能量更能有效地增加感兴趣区域的清晰度,拉普拉斯能量越大,放映的局部图像越清晰,本文是以小波变换后的图像为主,利用像素的EOL和可见度(Visibility,VI)进行图像融合。可见度反映了ROI区域局部灰度对比度,可见度越大,ROI区域的灰度对比度越大。
像素点(x,y)处的EOI和VI定义为:
在EOL公式中,有:
其中,f(u,v)为(u,v)处的像素值,w 是以(x,y)为中心大小为l×l的窗口(l一般为3或5),mk为窗口w中所有像素灰度平均值,N为窗口w中像素总数,α为常数(0.6 ≤α ≤0.7)。
图像加权平均融合g(x,y)规则算法:
1)将小波变换后的 RGB 图像 f(x,y),g(x,y)进行归一化处理。
2)将大小为M×N的图像f(x,y)与图像g(x,y)填充为(M+2)×(N+2),分别在上下2行,左右2列进行填充,填充部分的像素值为:
g(x,y)也采用如下形式填充,f(x,y),g(x,y)填充后的图像记为 f'(x,y),g'(x,y),进行填充的主要目的是为了使融合后的图像和ROI区域的大小一致。
3)计算 f'(x,y),g'(x,y)中各像素点的 EOL 和VI,进行归一化处理后,记为 Efij,Vfij和 Egij,Vgij,将其作为图像融合的各点系数强度值。
4)记输出图像为O1,融合过程中的图像为:
其中 i,j分别表示 ROI图像 f(x,y),g(x,y)中像素点的位置。融合后的图像O1=w1g1ij+w2f1ij,其中w1+w2=1,w1=w2=0.5。
5)将融合后的RGB图像转化到HSI空间,记为HSI_RGB。
6)将HSI_RGB图像在H,S,I空间进行阈值分割,设定阈值T=0.15时,效果最好。
输出图像结合了图像中的拉普拉斯能量和可见度作为加权融合的系数,加强了图像中的特征信息以及边缘细节,使人眼更容易识别。
自然情况下的彩色图像运用RGB(红、绿、蓝)彩色模型,该模型中3个分量组成了日常生活中最常见的彩色图像。HSI(色调、饱和度、亮度)空间模型是由人为制定的,解除了图像中颜色和灰度信息的联系,更符合人类描述和解释颜色的方式[16]。本文将融合过的RGB空间图像运用HSI空间,图像的结果更加直观,更便于阈值分割,进行破损判别,在HSI空间中,H是描述纯色的属性,S能够表示纯色被白光稀释的程度,I表示图像红、绿、蓝分量的平均值。
HSI空间的颜色系统更能接近于人们视线的感知,得到的图像结果更直观,检测的准确性更高。
为比较融合后的图像效果,运用Matlab进行了大量的仿真实验,实验结果取得了一定效果,由于篇幅的限制,给出一组结果来进行分析。
如图3所示,将分割后的ROI区域,即图3(a)、图3(b)两幅图像进行融合,找出其中的破损,见图3(c)。
图3 不同算法图像对比
图3(a)、图3(b)对应2幅原图中的ROI区域,图3(c)采用的是普通像素级的融合方法,图3(d)将对比度拉伸后进行图像融合,图3(e)将均衡化的图像进行融合,图3(f)为运用本文算法融合后的图像,图3(g)为融合后图像的HSI空间。图3(h)为在HSI空间进行阈值分割后的图像。
目前评价图像融合效果的方法主要可以分为2类,即主观评价方法和客观评价方法[13]。主观评价方法是由人直接对图像进行质量评价,具有简单直观的特点,但是人的主观意识可能会影响评价效果。
客观评价融合后的图像,需要将融合后的图像与原图中所包含的信息量进行比较,找出2幅图像中相关性或一幅图像包含另外一幅图像的信息量,如果相关性越大,则证明图像的融合质量越好。
对于图像质量的评价,本文采用不同图像融合算法,比较结果如表1所示。
表1 融合效果性能评价指标
通过数据分析,运用本文算法的图像经融合后在信息熵、标准差、平均梯度上的交互信息量的总和均比前3种方法大,图像在边缘、能量以及可视度方面均取得了很好的效果。如图3(f)所示,融合后的图像更有利于人眼对破损的判别。
数字图像处理将模拟图像信号转换为离散的数字信号并利用计算机对其进行处理,目前在航空航天、生物医学工程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等众多领域取得发展。
传统检测破损中很多运用的都是硬件检测[11]。硬件检测的准确率高,速度快,但硬件检测也有其自身的缺陷,如占地空间大、成本高、通用性低等[12]。本文将图像处理技术运用于工业产品的检测,首先对拍摄的光源有要求,是运用同轴光源、碗状光源、广角镜头来拍摄图像,减少了塑料透明薄膜表面的反射率。其次对图像的分割,将Hough变换与小波变换,图像融合相结合,减少了计算机的运行时间,加强了抗干扰性,提高了检测效率和检测结果的准确性。在该方法中,笔者运用软件进行判别。这一判别节约空间、节约成本、通用性强、易操作、综合运用各个领域的知识,设计具有综合性等优点。将数字图像处理运用到工业检测,虽然现在这一领域未得到广泛运用,但是其发展具有广阔的前景。
在实践中,笔者运用软件算法来代替硬件的检测。这要求必须了解算法的原理,在此基础上进行编程,再将得出的结果进行比较,除了考虑图像的处理效果,在图像处理系统中,需要考虑的一个最基本、最重要的问题就是图像实时处理需要的时间。所以需要进行算法的设计,不然会因为时间问题而不能实时采用。因此,对于本文的研究,笔者将不断改进,开发出高速率、高准确率检测的图像处理实时检测系统。
[1]黄爱民,安向京,骆力.数字图像处理与分析基础[M].北京:中国水利水电出版社,2010:6-9.
[2]刘朋瑞.数字图像预处理的硬件设计实现方法[D].上海:上海交通大学,2007.
[3]代勤,王延杰,韩广良.基于改进Hough变换和透视变换的透视图像矫正[J].液晶与显示,2012,27(4):1-59.
[4]Huang Kaiqi,Wang Qiao,Wu Zhenyang.Natrual color image enhancement and evaluation algorithm based on human visual system[J].Comput.Vis.Image Underst.,2006,103(1):52-63.
[5]李天刚,王素品,秦辰.基于信息熵窗的小波低频子带弱目标图像的增强[J].西安交通大学学报,2006,40(2):187-190.
[6]何宏,唐志航,张细致,等.基于小波多尺度积的图像增强新算法[J].计算机应用与软件,2007,24(3):163-165.
[7]景晓军,周贤伟,付娅丽.图像处理技术及其应用[M].北京:国防工业出版社,2008:6-33.
[8]李小霞,李铖果,邹建华,等.一种新的低照度彩色图像增强算法[J].计算机应用研究,2011,28(1):22-25.
[9]Ding C,Ren X F,Zha H,et al.Spectral min-max cut for graph partitioning and data clustering[C]//Proc.of the IEEE Conference on Data Mining.2011:51-55.
[10]Soille P.The Analysis Principles of Morphological Image and Applications[M].Publishing House of Qinghua Universiy,2011.
[11]刘松涛,周晓东.图像融合技术研究最新进展[J].激光与红外,2006,36(8):627-631.
[12]狄红卫,刘显峰.基于结构相似度图像融合质量评价[J].光子学报,2009,33(6):728-731.
[13]倪国强.基于视觉神经动力学的图像融合与处理技术若干新进展[J].激光与红外,2005,35(11):817-821.
[14]周金萍.图像处理与应用实例[M].北京:科学出版社,2010.
[15]苗启广,王宝数.一种自适应PCNN多聚集图像融合新方法[J].电子与信息学报,2006,28(3):466-470.
[16]张猛,余仲秋,姚绍文.手写体数字识别中图像处理的研究[J].微计算机信,2006,22(6):256-258.
[17]Rafael C Gonzalez,Richard E Woods.Digital Image Processing[M].Third Edition.Publishing House of Electronics Industry,2010:89-91.