洪汉玉,王 澍,朱 浩,俞喆俊
(武汉工程大学图像处理与智能控制实验室,湖北 武汉 430205)
钢铁行业的智能化发展日新月异.由于传统的喷印型字符(见图1(a))在运输与存放过程中容易因外界原因导致损毁,造成字符识别工作中出现非算法原因的检测错误,严重影响了实际检测的稳定性,于是嵌入型钢坯字符被提出运用到实际生产中去.嵌入型钢坯字符(见图1(b))在钢坯出炉阶段由机器打印嵌入钢坯母体,能够长时间稳定地保持字符特征,对钢坯生产线的智能管理有着长远的意义.在新型生产线上,已实现对钢坯端面的精准定位,将图像锁定在端面范围内,工作的重点是对钢坯端面上字符信息的提取.由于嵌入型钢坯字符区域对比度很低,灰度值与端面背景基本一致,使得传统的递归分割方法无法完成其字符信息的提取工作,因此对字符边缘轮廓信息的提取是解决问题唯一的途径.轮廓提取工作的主要困难是由嵌入型钢坯号边缘本身较低的对比度、打印时形成的无效边缘及钢坯端面过多的背景噪声带来.用于边缘信息检测的经典方法有:Marr 和 Hildreth提出的LoG算子[1-3],John Canny提出的Canny算子[4]等.上述方法是基于实际边缘的边缘检测算法,对有特定提取要求的图像有很大的局限性,运用于嵌入型钢坯号轮廓提取的结果很不理想.
针对上述问题,利用基于轮廓测度的LoG算子获得闭合的字符轮廓信息,将闭合区域填充后对提取出的候选区域建立定量筛选模型,根据字符与非字符区域形态学特征上的差异提取出目标字符区域.研究结果表明,基于轮廓测度的LoG算子有着很好的稳定性和准确性,解决了低对比度条件下嵌入型钢坯字符提取的关键技术问题.
图1 喷印钢坯字符与嵌入型钢坯字符Fig.1 Printed billet characters and embedded billet characters
高斯型拉普拉斯算子(Laplacian of Gaussian)主要利用图像二阶导数的零交叉点来获取图像边缘,检测到的边缘强度较好,但对有特定提取要求的图像有较大的局限性.钢坯字符主要由阿拉伯数字与英文字母组成,其信息主要分布在水平、竖直和倾斜的几个大方向,对此提出了基于轮廓测度的LoG算子.
LoG算子的主要原理是把拉普拉斯算子与高斯平滑[5]滤波器结合起来进行边缘检测.首先对图像进行高斯平滑滤波,再对滤波过后的图像求二阶导数的零交叉点来确定图像的边缘.二维高斯函数和它的二阶偏导如式(1)所示:
轮廓的测度主要体现在图像与滤波器作卷积的模版选取上.根据公式(4)对原图f(x,y)取水平与竖直,倾斜45°与倾斜135°的卷积模版分别与h1(x)h2(y)+h2(x)h1(y)作卷积:
其中,i的取值为1与2两个数,则有:
图2(a)为在方向D上一个理想的边缘状况的示意图,在边界点灰度值从a跃升到b.通过LoG算子进行卷积处理后,求取到图像的二阶导数,边缘情况如图2(b)所示.图像边缘情况表现为零交叉点:低灰度值部分h(x,y)>0,高灰度值h(x,y)<0,相素的值分布在0上下较小的范围内.
图2 基于LoG算子的边缘响应示意图Fig.2 Response of edges to LoG masks
基本的零交叉点检测方法为如相邻2个相素点的符号异同或者如当前点像素值为0,并在其四领域中有两个像素符号相反,则定义像素值绝对值最小的点为边缘.本文采用基于Predicate的3×3邻域谓词模版[6],将其与定义好的4种中不同情形的模版相比较,如果匹配就在正确的相素位置上确定边缘.
在对卷积图像中零交叉点的检测即是边缘检测.因此,通过以上的处理可获得钢坯字符的边缘轮廓信息.目标区域基本信息的完好表达与对背景噪声的有效抑制是边缘提取的基本要求.
通过对零交叉点的检测,获得闭合的边界轮廓.通过极点判别法[7]对闭合的轮廓区域进行填充,基本原理是经轮廓跟踪得到轮廓点,利用轮廓点与其前后邻点的位置关系将轮廓分为极点和非极点,再对扫描线上的非极点进行两两配对和填充.
由于端面图像定位的关系,有时检测出的图像中会出现端面的边界,并且钢坯字符在打印时会形成一些无效的边缘.所以待处理的噪声主要可分为端面的边界、端面上的离散噪声和无效边缘.按照文献[8]中基于联通域算法的区域测量思想,根据填充后噪声区域与字符区域形态学特征上的区别提出了适用的去噪方法,基本原理如公式(6)所示:
其中C[k]为当前联通域的长宽比,L[k]为联通域长度,W[k]为联通域宽度,n[k]为联通域中相素个数.当C[k]满足给定条件时,计算此联通域的相素比重Ar[k],将Ar[k]与设定的阈值作比较,判断其是否为噪声,从而提取目标字符区域.
通过上述步骤得到基本的字符信息后,通过基于智能多代理的字符切分处理方法[9]对字符进行切分,然后通过形态学处理将切分后的字符变为标准字符.根据标准字符模版的对应信息即可获得图像中的字符信息.字符标准化的主要步骤为:1)从输入的字符中心处将其等分为四分,取每部分的形心为基准往周围上下左右四个方向投影.2)根据投影的情况结合字符形态学规律进行判断,得到标准化字符.最后根据标准化字符对应的数字模版完成识别工作[10].
上述算法在计算机(3.09GHz,3.2GB)上使用VC+ +6.0编程,利用灰度CCD相机(相机型号:MVC900DAM-GE30-01Y23)采集图像.为验证算法的性能进行了喷印型钢坯字符与嵌入型钢坯字符的分割对比、嵌入型钢坯字符的轮廓提取、目标区域提取等实验,并对算法的性能进行了测试与分析.
实验一:字符分割对比试验.在传统的喷印型钢坯字符检测上,采用的是局部递归分割算法[11].图3(a)为端面背景较为复杂的喷印型钢坯字符,通过多级分割滤波处理钢坯字符被完整的表达出来,结果如图3(e)所示.图4(a)为嵌入型钢坯字符,从其递归分割的主要过程可以观察到钢坯字符区域始终没有被有效地分割出来.实验结果表明此方法并不适用于嵌入型钢坯号.
实验二:字符轮廓信息的提取.图5(a)是分辨率为1248×832的钢坯端面灰度图像,对其运用Canny算子、LoG 算子、DoG 算子[12-13]及提出的方法进行嵌入型钢坯号轮廓提取实验.图5(b)为运用了Canny算子对原图进行轮廓提取的结果,可以观察到该算子对噪声敏感度较高,信噪区分度过小.图5(c)为运用LoG算子进行处理的结果,从图5(c)中可以发现高斯平滑对噪声具有较好的抑制效果,但同时也削弱了字符边缘信息,关键区域的轮廓信息缺失严重.图5(d)为使用DoG算子对原图处理的结果,DoG算子的主要原理是对图像求取两个高斯函数的差值,从图5中可以观察到虽然字符边缘轮廓信息提取得较好,但不能有效地将字符轮廓与噪声边缘分离.图5(e)中运用的是本文提出的基于轮廓测度的轮廓提取方法,可以观察到字符轮廓的信息表达基本完整,与噪声区分度大,能够满足后续对字符提取工作的要求.
图3 喷印型钢坯号递归分割示意图Fig.3 Recursive segmentations of printed billet characters
图4 嵌入型钢坯号递归分割示意图Fig.4 Recursive segmentations of embedded billet characters
图5 轮廓提取比较Fig.5 Comparison of edge detection methods
实验三:区域填充与目标提取.如图5(d)所示,因为改进的LoG算子提取出的字符轮廓区域为闭合轮廓区域,所以在此基础上可对其进行区域填充,图6(a)为填充的结果.根据公式(6)计算每个联通域的长、宽、长宽比、面积与面积比重,通过设定的对应阈值将单个分离的噪声联通域消除,保留字符联通域.图6(b)为字符提取结果.表1为对待处理的联通域的分类与形态学特征的统计与分析,通过对离散噪声、端面边缘、无效字符边缘及目标字符边缘区域的数据分析:字符区域的提取阈值 C[k]应取 0.15/3.0 或者5/7.5;Ar[k]应取0.15/0.3或者0.5/0.8.
图6 区域填充与去噪Fig.6 Region filling and extraction results
表1 联通域域特征分析Table 1 Analysis of connected domain
实验四:字符的切分与标准化处理.得到基本的字符信息后,首先要对其进行分割与切分获取单个字符,其次分别对单个字符进行标准化处理,最后对照标准化字符的模版完成识别工作.图7(a)为字符的切分结果与标准化的效果,图7(b)为软件的识别结果.
实验五:算法性能测试.图8(a)为试验中所采用的嵌入型钢坯端面图像;图8(b)为运用本文方法提取的结果.表2为对相机采集的随机100张图像进行识别测试的结果.通过测试可知,在实际运行中算法表现优异,鲁棒性强,运行时间能够满足实际工程需要(钢坯生产线上的实际检测周期为10s).
图7 字符的标准化与识别Fig.7 Billet character extraction
图8 典型的嵌入型钢坯字符图像的检测结果Fig.8 Detection results of some typical images
表2 字符识别率测试Table 2 Character recognition test
以上针对嵌入型钢坯字符对比度很低、边缘干扰信息强的特点,将基于轮廓测度的LoG算子运用于嵌入型钢坯字符图像的轮廓信息检测中.结合区域填充算法并通过区分度高的形态学特征进行了字符信息的提取.实验结果表明,本文检测方法识别效率高、参数较少、抗噪声边缘干扰性强,可以准确的提取出图像中的字符信息,且对镜头焦距长短和倾斜角度要求较小.检测结果保留了原有的字符特征,并拥有字符各自的位置和形态特性,解决了将嵌入型钢坯字符应用于实际生产线的关键技术难点.
[1]Ulupinar,Faith.Refining edges detected by a LoG operator[J].Computer Vision Graphics Image Process,1990,51(3):275-298.
[2]Oie,Takhiro.Adaptive Laplacian-Gaussian filter method for edge detection and diameter estimation of coronary arteries on cineangiograms:Applications to phantom profiles[J].Stems and Computers in Japan,1992,23(12):55-65.
[3]贺强,晏立.基于LOG和Canny算子的边缘检测算法[J].计算机工程,2011,37(3):210-212.
[4]Accame,Marco.Edge detection by point classification of Canny filtered images [J]. Signal Processing,1997,60(1):11-22.
[5]张天序.成像自动目标识别[M].武汉:湖北科学技术出版社,2005.
[6]Andres Huertas,Gerard Medioni.Detection of intensity changes with subpixel accuracy using Laplacian-Gaussian Masks[J].IEEE Transaction Pattern Analysis and Machine Intelligence,1986,8(5):644-651.
[7]吴章文,杨代伦.区域填充极点判别算法[J].计算及辅助设计与图形学学报,2003,15(8):979-983.
[8]李仪芳,刘景琳.基于连通域算法的区域测量 [J].科学技术与工程,2008,9(8):2492-2494.
[9]洪汉玉,杨义军.基于智能多代理的复杂场景钢坯字符切分算法[J].光电工程,2012,39(5):91-100.
[10]杨义军,洪汉玉,章秀华,等.重轨生产线钢坯字符识别方法 [J].武汉工程大学学报,2012,34(5):64-67.
[11]洪汉玉,俞喆俊,章秀华.复杂光照条件下钢坯字符检测方法[J].武汉工程大学学报,2012,34(6):65-68.
[12]洪汉玉.现代图像图形处理与分析[M].武汉:中国地质大学出版社,2011.
[13]VanVliet,LucasJ.Edge localization by MoG filters:multiple-of-Gaussians[J].Pattern Recognition Letters,1994,15(5):485-496.