洪汉玉 董彬 时愈 华夏 邹连英 程莉 熊俊俏
摘要:针对重轨生产线钢坯检测所涉及到的钢坯定位问题,提出一种基于投影不变量特征的字符定位方法。利用钢坯字符呈线性排列的特征,提出投影不变量的测量值定义;利用基于多级滤波的最大类间方差的递归分割方法,寻找满足投影不变量测量值的条件,快速寻找到钢坯字符所在的区域(即图像感兴趣区域)。最后,对感兴趣区域进行投影法的坐标定位,进而完成钢坯字符的定位问题。实验结果表明,与均值漂移的字符定位方法相比,该方法能够准确地完成字符的定位,具有良好的稳定性和准确性,提高了字符定位的正确率。
关键词关键词:投影不变量;线性排列;感兴趣区域;字符定位
DOIDOI:10.11907/rjdk.151060
中图分类号:TP317.4
文献标识码:A文章编号文章编号:16727800(2015)002014504
0引言
国内钢铁集团和大型轧钢厂目前主要靠人工检测来识别钢坯端面的字符,为了满足重轨生产线的需求,提高生产率,开发钢坯自动检测系统尤为必要。但由于高速重轨生产线场景复杂,以及钢坯本身存在的缺陷,使得钢坯检测系统在理论和方法上存在以下难点\[1\]:①外部环境复杂。生产线外部环境严重影响钢坯字符的正确识别,如生产线高温、高热,光照不均等;②钢坯字符缺陷。钢坯字符存在字体间发生粘连、部分断裂及字符变形;③受输入设备影响。输入设备的鉴别率、光学畸变、量化过程会产生大量的噪声。这些现象都会对字符的定位、切分、识别造成很大影响。
钢坯图像的定位在钢坯检测识别系统中有着重要作用,是后续字符切分、识别的前提条件。现场环境恶劣、光照复杂、钢坯运动容易导致字符区域变化较大,加大了钢坯字符定位的难度,影响钢坯字符识别率,因此定位出复杂场景中的钢坯字符非常必要\[2\]。而对于一幅图像,首先必须分清楚目标和背景。所谓目标就是图像中感兴趣的部分,剩下部分即为背景\[3\]。只有将目标和背景完美分割出来,才能有效地进行后续操作。目前常用的字符定位方法有:基于特征的字符定位算法\[4\];Dai Ruwei等\[5\]提出的基于Niblack二值化算法;基于均值漂移(Mean Shift)字符定位方法\[6,7\]等。上述方法在光照环境变化大,对比度不稳定的生产线场景中,定位结果并不理想。本文方法是基于目标字符的特征,在生产线复杂背景下,目标是不变的。
1投影不变量
为解决钢坯字符定位这一难题,在观察了大量生产线场景下的图像后,发现无论生产线背景如何变化,钢坯端面字符的投影是不会改变的,且字符呈线性排列,可充分利用这一特征来提取出目标字符信息。
投影不变量是指在投影变换中保持不变的特征。目前,投影不变量这一概念大多应用于目标跟踪算法上,使其计算简单方便。而在字符定位中鲜有运用,为在定位中充分利用钢坯字符线性排列这一特征,本文提出投影不变量这一概念并给出定义如下:
定义1:投影不变量M是钢坯字符有效的行投影和列投影波形个数。可以定义为3个特点:①它依赖于分割图像的投影波形,显示了投影波形的合理性;②每个存在的波形都是封闭的;③它寻找的波形具有一定的固定宽度,如图1所示。
将钢坯目标字符的投影不变量M值作为一种有效的判据,调用这个判据可以检测出复杂场景中钢坯端面字符的有效特征。如果图像分割比较理想,可以很容易地得到钢坯端面字符区域的坐标信息,从而定位出钢坯字符。所以需考虑如何在复杂场景下准确地分割出钢坯端面图像,从而确保投影不变量M值的可靠性。
2基于投影不变量判据的递归分割与多级滤波
在轧机重轨生产线复杂场景下的钢坯端面字符分割中,由于受到现场复杂光照环境的影响,用传统的最大类间方差(Otsu)分割方法\[7\]得到的阈值会向较大的波峰方向移动,导致目标字符的分割不完全甚至是没有被分割出来。因此,在分割钢坯图像时,一般采用基于多级滤波的Otsu递归分割方法\[1\],如果字符区域不能在第一次分割时被发现,应继续分割图像,利用上述定义中的投影不变量M值作为判据,直到出现想要的分割结果为止。
本文将每一次分割后的图像对X轴和Y轴进行投影,寻找投影不变量M的测量值。对于钢坯端面的目标字符,投影不变量M的值随着递归分割次数的不同而不同,当分割图像中出现钢坯端面的目标字符时,可得到投影不变量M值。当图像在分割过程中连续出现2次相同的投影不变量M值时,将第一次出现的分割图像作为最终的递归分割结果。该算法流程如图2所示。
(1)第一次分割:先将整幅钢坯图像的像素点当成灰度值的点集T,利用最大类间方差分割方法对图像进行阈值分割,得到一个阈值Th1,将大于Th1的点集T1当作目标,小于Th1的点集B1当作背景。寻找投影不变量的值M是否等于2或者等于3,若是,则停止分割;否则,进行第二次分割,此时:
T→T1+B1(1)
式(1)中,T代表原图像点集;T1是灰度值较高点集;B1是灰度值较低点集。
(2)第二次分割:第一次分割并不能准确地分割出钢坯端面的字符信息。此时,由于目标字符的灰度值比较高,应该继续对点集T1进行最大类间方差分割,产生新的阈值Th2,并且将点集T1中大于阈值的点集T2当作目标,而小于阈值的点集B2当作背景,当投影不变量M值与第一次分割的M值相同时,则停止分割;否则,进行第三次分割,此时:
T1→T2+B2(2)
式(2)中,T1是第一次滤波后的点集;T2是灰度值较高点集,B2是灰度值较低点集。
每一次阈值分割后,将灰度值高的点集保留下来进行下一次阈值分割,将图像中低于阈值的点集作为背景进行抑制和滤除。由于生产线现场环境复杂,分割不一定很理想,目标点集区域中可能包含很多杂质和伪目标,此时利用像素点的八连通域算法扫描区域,统计连通区域的个数及每个区域所含的像素点,得到每个区域的面积、高度和宽度,将不符合钢坯字符目标特征的区域判定为伪目标进行滤除,从而置为背景。
(3)第n次分割:经过上述步骤后,判断分割图像是否满足递归分割的终止条件,即是否能得到投影不变量M值。若不满足条件,则继续分割图像,将灰度值较低的点集Bn-1滤除,将第n-1次分割后的点集Tn-1进行第n次最大类间方差分割,并滤除不满足目标字符特征的连通域。直到满足递归分割的最终值条件为止,此时,可以得到最终的点集Tn和Bn,即:
Tn-1→Tn+Bn(3)
式(3)中,Tn是灰度值较高点集,且包含了目标字符的信息,Bn是灰度值较低点集。
通过上述处理后,利用水平和垂直投影,采取调用投影不变量M值的方法可以检测出复杂背景中感兴趣区域的有效特征。将感兴趣的区域提取出来,然后通过基于投影特征的方法根据投影的坐标信息可以快速定位出钢坯字符坐标,识别出钢坯字符信息,即钢种号、钢坯号和钢流号。
3实验结果与分析
为验证本算法的效果,从轧机重轨生产线现场采集大量的钢坯图像进行测试,并与现有算法进行比较。本文在Visual C++6.0开发环境下,对不同算法进行实现和比较。
实验一:采用本文基于多级滤波的最大类间方差分割方法寻找投影不变量M的测量值。M测量值及定位结果如图3、图4所示。图3中,(a)是原始图像,(b)、(c)、(d)和(e)分别表示在不同分割阶段的投影波形。图3(b)的分割图像在水平或垂直投影中没有有效波形,所以投影不变量M=0;(c)中只出现1个有效波形,即投影环变量M=1;相比之下,图3(d)和(e)中字符分割已经比较清晰,在水平投影中有3个符合波形特征的投影,此时应该停止分割,取图3(d)的阈值结果,且投影不变量M=3。
图3钢坯图像不同分割次数的结果
实验二:相比于Mean Shift字符定位中用阈值门限来判断聚类特征,投影不变量方法在一定程度上提高了分割图像的准确性,因为在一些特殊光照条件下,Mean Shift字符定位中会丢失最佳阈值而产生过分割和欠分割的现象。而本文提出的方法,根据投影不变量M值,能够更加快速、准确地提取出目标字符的理想分割图。图5是采用不同定位方法的最终钢坯分割图。
实验三:钢坯图像定位结果对比如图6所示。由于图5(b)中分割不理想,导致钢种号没有分割出来,进而将钢种号所在的连通域当成伪目标去除,使得定位结果只有钢坯号和钢流号,对后续字符的识别产生了很大的难度。
4结语
针对轧机重轨生产线钢坯字符定位,提出了基于投影不变量的钢坯字符定位方法,利用目标字符的特征来弥补其它方法的不足之处。实验结果表明,所提出的基于投影不变量特征的字符定位算法能较好地针对钢坯端面字符的分割和定位,具有良好的实时性和准确性。本算法有效地减少了算法的迭代次数,算法总的运算速度也有所提高,能够满足实际应用需求。
参考文献参考文献:
\[1\]洪汉玉.现代图像图形处理与分析\[M\].武汉:中国地质大学出版社,2011.
\[2\]杨义军,洪汉玉,章秀华,等.重轨生产线钢坯字符识别方法\[J\].武汉工程大学学报:自然科学版,2012,34(5):7172.
\[3\]张铮,王艳平,薛桂香.数字图像处理与机器视觉\[M\].北京:人民邮电出版社,2010.4.
\[4\]杨卫平,李吉成,沈振康.车牌目标的自动定位技术\[J\].中国图象图形学报, 2002, 7A(8): 835839.
\[5\]DAI RUWEI, LIU CHENGLIN, AND XIAO BAIHUA. Chinese character recognition: history status, and prospects \[J\]. Frontiers of Computer Science in China, 2007, 1(2): 126136.
\[6\]俞喆俊,洪汉玉,章秀华,等.生产线复杂场景钢坯检测识别的定位方法研究\[J\].光电工程,2012,39(1):5461.
\[7\]OTSU NA. Threshold selection method from gray level histogram\[J\]. IEEETrans,1979,SMC9(1):6266.
\[8\]HONG HANYU,WANG JIN,ZHANG TIAN YU,YI XIN JIAN.Study on acceleration technique of circulation iterative restoration algorithm for infrared target images\[J\].Journal of Infrared and Millimeter Waves,2008,27(2):115118.
责任编辑(责任编辑:陈福时)