蒋丽洁, 柴晓冬, 李立明
(上海工程技术大学 城市轨道交通学院, 上海 201620)
接触网立柱作为铁路电网的承重装置有属于其本身的身份标识-杆号,所以杆号的识别是定位接触网的最关键步骤之一。现有研究中,陈忠革[1]采用霍夫直线检测实现支柱定位,后续采用HOG 特征和支持向量机(SVM)实现字符识别。朱挺[2]采用CCD高速摄像和LED光源技术拍摄线路两侧立柱支柱号,该方法利用支柱号牌本身带有的荧光,在车顶 LED 光照射情况下,相机成像的只有带荧光的支柱号牌。郭瑞等人[3]分析了立柱号牌的特点。根据其特点,提出了基于OpenCV的数字识别方法。利用HOG特征和支持向量机分类训练算法实现立柱定位。
为研究接触网立柱标志牌定位的问题,本文提出了利用显著性检测的方式来定位接触网立柱杆号区域。显著性检测是目前备受学界关注的主要研究算法,研究目标是人类视觉中的明显物体,是模拟人类视觉注意力机制的技术[4]。Liu等人[5]利用每一个超像素内的运动直方图和颜色直方图,提取这些局部特征并级联成为全局特征,建立了基于超像素的显著性模型。Singh等人[6]提出生成从不同角度的显著性模型,并利用线性SVM加权融合这些显著图。多元化特征的来源是聚类成块或时间超像素的颜色、运动和边界等。本文提到的简单线性迭代聚类(SLIC)算法是一种高速度、分割性能好、边缘黏附度高的超像素分割算法,通过采用K-means聚类以类似于文献[7]的方式生成超像素。虽然非常简单,但是SLIC在Berkeley基准[8]上产生显示出对图像边界的最好效果。
本次实验的研究对象为列车运行过程中手机拍摄的轨道定位标志牌。初始的采集图像如图1所示,自然光线下列车车窗也会出现轻微反光的现象,由于相机一直处于不断运动的状态,手持拍摄会随着列车震荡有轻微的晃动,所以得到的图像序列干扰因素比较复杂。针对传统算法对负责图像处理速度缓慢并不精确的问题,本文提出了融合超像素分割与基于FT改进算法的一种图像处理方法。具体处理流程如图2所示。
图1 原始图像
图2 接触网立柱标志牌定位流程图
在视频采集过程中,无可避免地会出现图像模糊,程度较小的图像模糊在小区域放大后也会对后续处理产生大的影响。本文利用基于模糊集的图像增强方法对标志牌区域预处理。研究可知,模糊逻辑推理可以通过模糊化、模糊推理和解模糊化来实现。基于模糊集的图像增强方法的流程步骤可做阐释分述如下。
(1)模糊特征提取。从数学角度讲,模糊集使元素与隶属度一一对应,通过隶属函数能实现特定元素到合适隶属度的映射。对应数学公式可表示为:
(1)
其中,Fe=128;Fd=0.8;gmax为最大灰度值;gxy对应的则是图像中(x,y)像素点的灰度值。
(2)模糊推理。通过式(2)变换来修正隶属度:
(2)
模糊增强的关键在于,模糊增强算子使得隶属度值大于0.5的更大,而隶属度值小于0.5的则更小。
(3)模糊与反变换。解模糊化是对模糊推理输出进行解模糊判决,图像中新灰度级的产生利用的是模糊域的反变换,从而实现了数据的模糊域与图像空间域的转变。对应数学公式可表示为:
(3)
(4)灰度图转换为RGB。函数先将灰度图像扩展到三通道(复制通道),提供原始图像作为本次转换的调色板,再将2张图像转为YUV空间("Y"表示明亮度(Luminance或Luma),也就是灰阶值;而"U"和"V"表示的是色度(Chrominance或Chroma),可用于描述影像色彩及饱和度,及用于指定像素的颜色)。在此基础上,通过一个二重循环来逐像素生成RGB结果图。RGB与YUV分量的对应关系为:
R=Y+1.14V,G=Y-0.39U-0.58V,B=Y+2.03U.
(4)
利用模糊集对图像预处理后的效果如图3所示。
图3 基于模糊集的图像增强
SLIC超像素分割算法是2010年提出的一种基于K-means聚类的图像分割算法,是在Lab颜色空间与(x,y)组成的五维向量空间中运算的。Lab色彩模型中,L表示的亮度(Luminosity)值域由0(黑色)到100(白色);a表示从洋红色至绿色的范围。a为负值指示绿色,正值指示品红;b表示从黄色至蓝色的范围。b为负值指示蓝色,正值指示黄色。此后,就是对五维特征向量构造距离度量标准,对图像像素进行局部聚类的过程[9]。
SLIC算法流程图见图2,而将K-means算法应用于图像像素的聚类中主要算法步骤则将详述如下。
(1)将图像转换为Lab颜色空间。
(2)初始化聚类中心:假设图片总共有N个像素点,设定超像素块个数K,将聚类中心均匀地分配到图像中。如果所有的超像素块有相同尺寸,那么各块的大小为(N/K),近似的相邻聚类中心的距离(步长)为:
(5)
(3)遍历操作。将每个像素块的中心点的坐标(x,y)及其Lab的值保存起来,加入到事先定义好的集合中。算法中,使用中心点的8邻域像素点,计算获得最小梯度值的像素点,并将其作为新的中心点,这里计算梯度的公式可写为:
Gradient(x,y)=dx(i,j)+dy(i,j),
(6)
研究中,为了节省时间,只遍历每个超像素块中心点周边的2S*2S区域内的像素点,具体如图4所示。
图4 SLIC的2S*2S搜索区域
(4)由于SLIC中的聚类是在[Labxy]五维空间中生成超像素的,简单定义欧式距离D将导致不同超像素大小的聚类行为不一致。因此,使用如下公式的距离尺度来定义,即:
(7)
(8)
(9)
公式(9)中通过2个参数m和S来协调2种距离的比例分配。参数S即是式(8)计算得出的每个像素块的长度值,而参数m为Lab空间的距离可能最大值,建议可在为[1,40]范围内来选取。
(5) 对分割后的超像素块进行预处理。由于后续的分割操作是在灰度图进行的,在载入超像素分割完成的图像后,将每个超像素块的平均灰度值一一分配给对应的超像素块。例如像素块分别为500和1 000的处理结果则如图5所示。
(a) 分割尺度500 (b) 分割尺度1 000
FT 算法是2009年Achanta 等人[10]提出针对频域的一种显著性检测算法,此方法利用颜色特征的中央-周边算子来得到显著图,通过保留来自原始图像的更多频率内容来保留图像边界,从而输出具有明确定义边界的全分辨率显著图,该算法的优势在于设计简单,计算速度快。
令ωlc为低频阈值,ωhc为高频阈值。低频信息对应的是图像中的显著性区域,高频信息对应的是噪声或纹理特征,为了获得图像中的目标区域,捕获显著对象,低频阈值、即ωlc应尽可能低,高频阈值ωhc应尽可能高,甚至舍去。算法采用DOG算子为低通滤波器,运算时参见如下公式:
(10)
其中,DOG算子是高斯函数的差分,σ1,σ2是高斯分布的标准差,分别决定了ωlc,ωhc。不同的高斯差分对应不同的频率检测范围,当所有高斯差分被执行时,所有频率被检测以获得不同尺度空间的边界。所以使σ1无穷大以检测整幅图像,σ2无穷小以减少高频噪声。
设图像大小为m*n,在Lab色彩空间中,L,a,b各特征的整体均值分别为:
(11)
同时对各特征进行高斯平滑,运算公式可表示为:
LG(x,y)=L(x,y)*Gq*q,
aG(x,y)=a(x,y)*Gq*q,bG(x,y)=b(x,y)*Gq*q,
(12)
在实际进行计算时, FT方法使用窗口5*5的高斯平滑来实现对最高频的舍去。
FT方法在Labxy坐标空间图像像素的显著性公式为:
S(x,y)=‖IG(x,y)-Iμ‖.
(13)
为了使算法运行速度加快,保证各特征值数据的收敛,对各特征值的归一化处理及改变权重系数是本文对FT基本算法的优化。由于在Lab颜色空间中,L,a,b变化快慢不同,在原FT算法计算过后,对各特征值做归一化处理,消除因为各特征对应的显著值不在一个数量级上,从而突出某一特征的不良影响,即:
(14)
其中,i=L,a,b分别计算出SnL,Sna,Snb。
最终定义新的显著值算法如式(15)所示:
(15)
其中,ωi对应各特征的权重系数。
调整对应特征的权重系数可以更为可靠地突出所需的图像特征。
本次实验的研究旨在针对初始采集图像能在本文提出的算法处理流程下可定位标志牌区域并对标志牌的数字定位进行提取。
在SLIC图像分割过程中采用的超像素数量越大,聚类效果越好,但分割时间越长,灰度赋值以后立柱区域不明显,如图5所示。所以本文算法中最终确定像素块为250。如图6(b)所示,蓝色部分为需要下一步处理的标志牌区域。
对图6(b)区域做特征选择,由于图像大小保持不变,标志牌区域包括区域面积、区域的长度宽度在内的特征值有基本统一的阈值。经过特征选择得到单一的蓝色区域后,在原始彩色图像上做外接矩形的裁剪,得到只含有标志牌的图像如图6(c)所示。基于此再利用改进的FT算法对增强后的图像做显著性检测,得到一个噪音少、数字边界明显的结果图像见6(d)。最终数字见图6(e)。
利用本文方法对多个标志牌进行测试,显示结果如图7所示。
(a) 超像素分割图像 (b) 腐蚀后区域显示
(c) 标志牌原图 (d) 显著性检测 (e) 数字显示
(c) Original sign (d) Saliency test (e) Digital display
图6 立柱标志牌定位结果图
Fig. 6 Column sign positioning result map
(a) 标志牌 (b) 显著性检测 (c) 数字显示
基于模糊集的图像增强算法可以使立柱的模糊图像清晰程度更高;基于SLIC的超像素分割使得包括标志牌在内的整个立柱区域与背景分割开来;综合前述研究后,再利用改进的FT算法对标志牌区域做数字提取。该方法能够有效定位标志牌的数字部分,为后续数字识别打下基础。