基于Haar- like 特征分类器的列车受电弓智能定位研究

2023-11-20 10:59吴连军
科学技术创新 2023年26期
关键词:电弓矩形分类器

邱 岳*,吴连军

(中车工业研究院(青岛)有限公司,山东 青岛)

引言

随着轨道交通的快速发展,列车受电弓作为从接触网导线上受取电流的关键装置,在列车运行中发挥着重要作用[1]。然而,受电弓的准确定位是列车故障诊断中的关键问题。受电弓的错位或故障可能导致供电中断、设备损坏甚至事故发生。因此,开展列车受电弓的智能定位研究,对提高轨道运输的安全性和可靠性具有重要意义[2]。

近年来,随着计算机视觉和机器学习等技术的快速发展,基于图像处理的方法在列车受电弓定位研究中得到了广泛应用。而Haar-like 特征分类器,作为一种有效特征表示方法,具有对图像灰度变化的良好描述能力和鲁棒性[3]。通过利用Haar-like 特征分类器,可以对监测图像中受电弓位置进行检测,从而为其故障诊断和维护提供重要依据。

本研究旨在基于Haar-like 特征分类器,开展列车受电弓智能定位的研究工作。通过采用积分图计算方法高效提取Haar-like 特征,并结合Adaboost 级联分类器的训练和检测算法,实现对列车受电弓位置的实时监测和定位。最后通过实验验证,提高列车受电弓定位的准确性和稳定性,为轨道交通系统的安全运行及受电弓的故障检测提供可靠的支持。

1 检测方案组成及其原理

本文所提出基于Haar-like 特征分类器的列车受电弓智能定位技术原理如图1 所示。首先,采用多样化和全面的训练样本集,综合考虑了受电弓的识别特征和背景条件。同时对图像样本进行了预处理,以确保数据的质量和一致性。其次,使用四类高效的Haarlike 特征模板对受电弓的特征进行提取。同时利用积分图实现了Haar-like 特征值的计算,降低了计算复杂度并提高了处理速度。再次,采用Adaboost 学习算法对提取的Haar-like 特征进行训练,生成强分类器。Adaboost 算法能够有效地结合多个弱分类器,提高分类器的性能和准确性。在线上实时识别过程中,对实时采集到的受电弓图像进行预处理。包括图像预处理、Haar-like 特征提取和特征值的计算。最后,将提取的特征输入训练完毕的强分类器中,以实现对受电弓目标的准确识别。

图1 基于Haar 特征分类器的列车受电弓智能定位技术原理流程图

1.1 特征分析

由于受电弓的工作环境复杂多变,为了更为全方位多角度地分析受电弓的特征,本研究采用综合分析策略,从颜色、形态、空间、纹理等目标固有特征,光照和背景等外部特征进行分析。通过上述分析策略,能更好地满足受电弓图像采样的需求,并更为有效地选取合适的图像特征。

图像选取方面,考虑到受电弓遮挡、复杂背景、光照影响等影响因素。在颜色特征方面,除了在黑暗背景下,受电弓在不同背景下能够与背景明显区分开来。通过图像观察,可以清楚地看到受电弓在其他背景条件下具有鲜明的颜色特征,如图2 所示。但不能排除天空及隧道中其他颜色因素的干扰。形态特征方面,受电弓以固定的弓形形态特征点呈现,受电弓各个时间段内结构呈现大致相同的特征。

图2 受电弓颜色特征

空间关系特征方面,主要考虑受电弓同天空背景中线缆、电杆、山体和建筑物的关系,如山体重叠、线杆遮挡。其中线杆遮挡是一个常见的难题,特别是线杆的颜色与受电弓的颜色特征相差不大。这种情况下,仅仅通过颜色特征很难对受电弓和线杆进行区分,如图3 所示。因此,在受电弓特征选取时,需要综合考虑颜色、形态、空间关系和纹理等多个特征,并充分理解各个特征的优势和局限性。通过综合选取这些特征,增强受电弓的识别能力,克服线杆遮挡等困难问题,并提高受电弓识别的准确性和鲁棒性。

图3 受电弓空间特征

1.2 受电弓Haar-like 特征提取

Haar-like 特征作为一种常用的计算机图像视觉领域特征描述算子。它最初定义了水平特征、垂直特征和对角线特征三种基本特征结构,如图4 所示。这些特征结构可以视为滑动窗口,在图像上以步长为1 的方式进行滑动,覆盖整个图像。通过计算滑动窗口内的像素值之差或像素值之和,可以得到Haar-like 特征的矩形特征值。这些特征值即可用于后续的特征分类任务。

图4 Haar-like 特征基本特征结构

随着Haar-like 特征的广泛应用,研究者根据不同研究对象的特殊性,进一步对特征结构进行了扩展,取得了良好的效果,扩展后的Haar-like 特征结构如图5所示。目前常用的Haar-like 特征主要包括线性特征、边缘特征、点特征(也称为中心特征)和对角线特征。

图5 扩展Haar-like 特征结构

Haar-like 通过定义一系列特征结构来捕捉图像中的局部特征。特征值的计算基于矩形内白色区域像素值的总和减去黑色区域像素值的总和。这种特征值反映了图像中的灰度变化,能够有效地提取颜色、形状、纹理等特征,用于描述和识别目标。为了获取多样化的特征,可通过改变特征结构的大小和位置,生成大量不同位置和尺度的矩形特征,提取相应的特征值。

为了实现受电弓的智能定位识别,本文采用了四类Haar-like 特征矩形[4,5]。这些特征矩形分别被分类为A 类、B 类、C 类和D 类。A 类特征矩形是边缘特征,它能够捕捉到受电弓边缘的细微变化,帮助我们区分受电弓与周围环境的边界。B 类特征矩形是线性特征,它关注受电弓的线性结构,可以识别出受电弓的形状、轮廓等特征。C 类特征矩形是中心特征,它聚焦于受电弓的中心部分,捕捉到中心区域与周围区域的灰度差异,从而帮助我们准确地定位受电弓。D 类特征矩形是扩展Haar-like 特征,它通过进一步扩展和变形特征矩形,能够捕捉到更加复杂和多样化的受电弓特征。通过综合利用这四类特征矩形,能够有效地描述和区分受电弓的特征,实现精准的受电弓定位识别。

1.3 积分图计算和Adaboost 分类学习

1.3.1 积分图计算

为了提高Haar-like 特征的计算速度和算法的实时性,在获取矩形特征后,引入了积分图算法进行快速特征提取。积分图的概念如图6 所示。

图6 积分图

对于坐标A(x,y),其对应的积分图是以图6(a)其左上角为起点的矩形区域内所有像素值的累加和。即积分图中的每个像素值表示了原始图像中相应位置以左上角为起点的矩形区域内像素值的总和。

式中ii(x,y)代表积分图,i(x′ ,y′)代表原始图像。通过A,B,C 和D 区域端点的积分图可计算相应区域的像素值。在图6(b)中,A,B,C 和D 区域分别用ii(1),ii(2)-ii(1),ii(3)-ii(1),ii(4)-ii(2)-ii(3)+ii(1)表示。因此通过使用积分图,可以在只遍历一次原始图像的情况下,计算出特定区域的像素值。

以D 类特征矩形为例,利用积分图来计算其特征值。在图6(c)中,将D 类特征矩形所覆盖的区域分为四个子区域,分别标记为A、B、C、D。通过积分图,可以得到每个子区域的像素灰度值的累加和。

1.3.2 Adaboost 分类学习

Adaboost 算法是一种集成学习方法,通过改变数据的分布来提升分类器的性能[6]。它根据每个样本的分类准确性以及前一轮分类器的整体准确率,来确定每个样本的权重。通过调整样本权重,新的数据集被送入下一级分类器进行训练。最后,所有训练得到的分类器被结合起来,形成最终的决策分类器[7]。在使用Haar-like 特征时,每个特征的判别阈值被视为一个弱分类器[8]。通过Adaboost 算法的学习过程,可以得到一个测试样本集,其中不同样本的分布权重不同。每次训练过程都会增加误分类样本的权重,减少分类正确样本的权重。将经过权重调整的样本与其他新样本组成新的训练样本集,进行下一轮的学习训练。经过T次迭代循环后,会得到T 个弱分类器,最终将这些弱分类器的权重进行级联,得到一个强分类器。Adaboost算法的关键在于通过迭代训练不断调整样本权重,使得分类器能够重点关注那些难分类的样本,从而提高整体分类性能。具体流程步骤如下所示:

(1) 样本构建,将训练样本编号,其中有效正样本为“1”,其他非有效负样本为“-1”,得到一个样本标签向量Y。然后,按照样本编号的顺序,将从图像中提取的Haar-like 特征值组合成特征矩阵X。

式中,D 为样本集,(xi,yi)为样本,n 为样本数,i=1,2,…,T。

(2) 初始化权值矩阵,训练学习之前样本应具有相同的权值:

式中,D(i)为各样本的初始权值。

(3) 迭代循环T 次,表达式如下:

式中,Dt(i)为t 次迭代时i 样本的权值,t=1,2,…,T,εt为t 次迭代时的被误判分类的样本权值之和,ht为t 次迭代时的阈值。迭代前利用误判率εt最小原则,对当前阈值ht进行更新。利用更新的阈值,可得到此次迭代生成的弱分类器ht(xt)。更新后的样本权值Dt+1 为

(4) 构造强分类器H(x),即

Adaboost 算法通过改变数据的权重分布来进行训练。在每一轮训练中,根据上一轮的分类准确率和每个样本的分类结果,调整样本的权重。分类错误的样本会被赋予更高的权重,而分类正确的样本权重会减小。这样,后续的分类器会更加关注错分的样本,以提高整体的分类性能。

2 受电弓区域定位的实验验证

为验证本文所提出检测器的有效性和精度,本文采用2 段真实的受电弓监控视频流进行说明。该视频流来源于固定在动车组车顶上的受电弓监视摄像头,其中列车1 由深圳北站驶往虎门站,行驶时长16 min;列车2 由咸宁北站驶往岳阳东站,行驶时长10 min。列车运行过程中,监控摄像机所采集到的背景复杂多样,包含白天、夜晚、大雾、隧道等,见图7。

图7 数据集中所包含的典型样本

依据帧频,将上述视频流划分为连续帧图像,其中,与列车1 相对应的视频帧划分为训练集,而与列车2 相对应的视频帧划分为测试集。相关数据集详细信息见表1。

表1 数据集信息

图8 展示了在白天强光干扰、夜晚光照不足等环境下的受电弓区域检测案例,可以看出,即便在较强干扰下,本文所提出的基于Haar-like 特征分类器的列车受电弓智能定位技术也能智能定位出受电弓位置。从图中可以看到,总体上受电弓定位的召回率较高,没有发生漏检,然而,在定位精度方面稍低,检测到的受电弓区域中包含较多的背景噪声,后续将从数据增强、鲁棒性特征提取等角度以增强检测器的抗干扰能力。

图8 受电弓区域检测案例

3 结论

受电弓区域的准确定位检测是实现动车组受电弓相关故障检测的一个重要前处理步骤,可减少外界复杂多变的环境所带来的相关干扰。因此本文对受电弓的智能检测工作进行了研究,充分利用Haar-like特征反映图像灰度变化、像素分模块求差值的特点,利用四类Haar-like 特征模板以进行特征提取。同时,运用积分图计算方式来高效完成受电弓监控视频流的Haar-like 特征值,以适应工程应用中实时检测的实际需求。最后将提取的Haar-like 特征进行Adaboost 学习训练以生成用于受电弓在线识别的强分类器,极大抑制弓网线缆、天气背景等因素的干扰,实现了复杂背景噪声下受电弓区域的准确有效定位。

猜你喜欢
电弓矩形分类器
两矩形上的全偏差
化归矩形证直角
BP-GA光照分类器在车道线识别中的应用
高速动车组用受电弓概述
从矩形内一点说起
受电弓滑板异常磨耗分析
动车组受电弓风管故障分析及改进措施
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别