刘瑞军,司 瑾,史红梅
(1 神华铁路装备有限责任公司, 北京 100120;2 北京交通大学 机械与电子控制工程学院, 北京 100044)
中国铁路货车的检修制度以“日常检查、定期检修”的计划预防修为主,现有检修规程的更新相对滞后于车辆技术水平的发展,普遍存在过度检修的现象,实现货运列车状态修(CBM)已成为列车维修模式的必然发展趋势。一般而言,CBM 的主要目标是对设备状况进行实时评估,以便做出维修决策,从而减少不必要的维修和相关费用[1],提高维修效率。
轴承是承受最高载荷的铁路车辆的组成部分[2],其健康状况直接影响列车的安全。然而目前在对车辆轴承进行日常检查时,工人工作量大且没有针对性,难以准确发现具有安全隐患的轴承。现有的轴承监测系统由于没有分析零部件故障的发展过程和趋势,缺少热轴的提前预警,因热轴报警造成的停机和扣修会对生产指挥产生很大影响。因此,对轴承进行健康状态检测和评估,提前发现含有安全隐患的轴承,实现对异常轴承开展针对性检查和维修,在故障发生前对轴承进行检查,并在热轴报警前将其更换,是实现铁路货车状态修的重要部分。
轴承的状态监测数据包括单值类型的温度数据、波形类型的振动、声学数据。大多文献都是基于振动数据分析对轴承进行故障诊断[3-5]。温度数据常被应用在故障识别和监测,例如MA 等[6]对于高速列车车轴,通过逐步回归分析法预测轴温,反映轴温的变化趋势。
文中将历史温度数据视为时间序列进行分析并进行异常检测。时间序列分析技术已被广泛应用到工业、互联网、金融等领域[7-8]。然而,对轴承温度进行时间序列分析和状态评估还没有相关研究。文中针对轴承历史温度数据组成的时间序列进行分析,进行健康状态评价和热轴预警。采用滑动时间窗方式截取历史数据,针对铁路货车轴温数据的特点,构建基于时间序列异常检测技术的热轴预警模型,将轴承在历史趋势以及货车同辆、同侧、同列等多个维度上,识别在同维度内与正常轴承温度有偏离的异常温度,在各维度内构建多个数值特征,通过检查特征来识别温度异常情况,量化并分级表示其健康状态,提前发现含有安全隐患的轴承,实现对检修的针对性指导,从而节省计划外的维护成本,提高检修效率。
铁路货车红外轴温探测系统(THDS)的应用为轴承状态监测和实现列车状态修提供技术保障和数据支撑。轴温异常检测可以帮助检测异常情况,保障列车运行安全。然而,现有监测系统没有分析热轴的发展过程和趋势,缺少提前预警,不利于对检修内容提供指导。
轴承在故障前的检测数据大多都有一些异常情况,文中将THDS 监测数据作为算法输入,对历史监测数据和报警事件进行纵向规律分析,研究数据在运行里程维度的发展趋势并进行预判。对轴承的健康状态量化表示,按等级设置健康指标,评估轴承的劣化程度,实现对状态不良轴承的多级提前预警,有助于做出状态维护决策,防止事故隐患。
轴承预警算法需收集热轴的事件数据和状态监测数据:事件数据包括故障时间、故障发生的探测站、故障车辆及轴位信息;状态监测数据包括列车所有轴承的历史温度数据以及历次探测的环境温度。
车辆在每次探测中会生成8 个轴承的内探与外探共16 个数据。文中以滑窗的方式对轴承历史温度数据截取,形成时间序列,将每个窗口内16 个数值的时间序列作为一组诊断数据,对各序列进行异常检测、趋势分析和统计学分析。
通过分析典型热轴样本的温升曲线,可得到以下体现在时间和空间维度上的热轴温升趋势类型:
(1)报警前在短期内呈上升趋势,温升明显高于其他轴承,最终出现异常高温值,如图1 所示。
图1 短期内温升上升趋势
(2)温升出现骤升情况,并且高温持续若干站,如图2 所示。
图2 短期内温升骤升
(3)温升无异常高温值或异常温升趋势,但长时间高于其他轴承,即处于第一大值、第二大值,如图3 所示。
图3 长期第一大值、第二大值
(4)温升长期或阶段性明显高于其他轴承,如图4 所示。
图4 温升长期或阶段性明显高于其他轴承
文中将根据各类热轴温升趋势的数据特点,构造数据特征作为异常温升的诊断指标。
构建基于时间序列异常检测技术的铁路货车热轴预警模型,对THDS 历史数据进行全过程纵向规律分析。模型流程如图5 所示。
图5 模型流程图
轴承运转热温度与环境温度、车速等外界因素有关,需要尽可能地对各影响因素做修正。
(1)轴承的温度会因环境温度变化而有较大变化。由于温升受环境温度的影响较小,所以文中采用温升表示运转热温度。温升是指轴承的表面温度减去其所在的环境温度,为式(1):
(2)为消除噪声和缺陷数据,减小数据波动,需利用统计学方法进行平滑。文中采用的指数加权移动平均方法(EWMA)是一种趋向类指标,是以指数式递减加权的移动平均,为式(2):
式中:X(t)为t时刻估计值;Y(t)为t时刻的测量值;n为总数据点数;a(0<a<1)为对于历史测量值权重系数。加权系数a随着时间而指数式递减,表示为a=2/(n+1)。
EWMA 具有吸收瞬间突发的能力,相比于其他平滑方式更加稳定。移动平均线周期长度需根据输入历史数据窗口的宽度进行适当的选择,参数过小则无法消除噪声、减少数据波动,参数过大则丢失了异常数据的数据特征,如图6 所示。
图6 EWMA 结果
(3)通过将数据进行对数变换进一步减小数据的振动幅度,使其数据更加平稳,线性规律更加明显,并增加数值小的数据的敏感程度。数据平滑和对数变换可削弱外界因素对轴温的影响。
取当前探测站的前M次探测历史数据,经过预处理后组成长度为M+1 的时间序列,即为式(3):
历史数据共包含16 个传感器的数据信息。将Tdata按照时间窗为K,步长为L切割成若干时间片段组成诊断 窗 口每个时间片段均包括其时间窗内的所有传感器数据信息。
模型需特别定义“异常值”的概念。根据铁路货车多轴的特点,THDS 数据时间序列异常检测可以视为经典异常值检测的推广,即异常温度的概念是与同列车、同侧轴承或同辆车中的其他轴承显著不同的数据和趋势。目标轴承在历史趋势以及货车同辆、同侧、同列等多个维度上构建多个数值特征,通过检查特征来识别在同维度内与其他序列有偏离的异常模式。
结合THDS 监测原理和专家知识,在每个时间步内,从滑窗内数据中提取异常特征。通过检查特征来识别出序列中的偏离点、变化点、异常行为等。
构造特征的过程包括特征提取与特征选择。特征提取,即通过对轴承历史温升数据进行多维度分析,发现更有意义的潜在变量,帮助对数据产生更深入的了解。特征选择是为了降低模型复杂度,提高模型的可解释性,对数据特征进行主成分分析和相关性分析,选择与热轴判别结果相关性大的特征。最终选择出几个特征,见表1。
表1 特征参数名称
各个特征指标的计算方法如下:
(1)异常值特征:当轴承温升偏离所在车辆、车列一侧或车列所有轴承的温升平均值特定个标准差时,将其定义为异常值。对于发生故障或有潜在故障的轴承,其温升曲线常常与车辆、该侧、车列的其他正常轴承的温升大小、趋势不同,甚至产生极大偏离,歪曲实际情况,因此,在计算数据组的标准差、平均值时,首先剔除一次探测数据中的第一大值、第二大值。根据温升数据分布范围和对多个样本的统计分析,设定数据偏离平均值2.7 个标准差为判断数据是否异常的阈值,并统计出现次数。
设一次探测的特征值结果为x,一次探测的数据集为TqW,分别取车辆、车列一侧或车列轴承探测数据,并去掉第一大值、第二大值组成异常值特征计算数据集,计算平均值和标准差为式(4):
(2)第一大值、第二大值特征:根据故障轴承的历史数据分析,故障轴的温升常处于同一辆车中或车列同一侧中的第一和第二大值;另外,根据统计,TADS 中报警的故障轴承在其报警后的数据中多次出现前2 大值的情况,因此,统计轴承出现在前2 大值的频率和次数,可以反映轴承的性能状态。当车列两侧的第一大值和第二大值出现在同一辆车中时,判断为疑似抱闸车,避免将抱闸作为热轴进行预报影响了车辆状态的准确判别,并预警车辆制动故障。
(3)异常大值特征:在轴承的一定时间窗口内的历史温升序列中,当轴承温升偏离其历史温升平均值特定个标准差时,将其定义为异常大值。故障轴承会有一定概率出现异常大的温升值,根据多个样本的分析,设定数据偏离平均值2.85 个标准差为判断数据是否为异常大的阈值,并统计出现次数。
设轴承一个探测位置的历史数据序列为TiW(i∈[1,k]),计 算 平 均 值和 标 准 差SiW,为式(5):
(4)骤升值特征:当轴承发生突发故障,温升会在短期内急剧升高。根据专家系统和故障机理,不同程度的温升变化表征故障的不同严重程度,因此,在模型中设定多个骤升值特征阈值:30、50 ℃,利用原始温升判断是否属于骤升值特征,并统计出现次数。
(5)离群点特征:为了采用不同的方法提取点异常,在模型中加入了离群点特征。模型中的离群点是采用K-means 聚类算法提取的点异常。聚类结束后分别计算各样本到聚类中心的距离,设置合适的距离阈值,当距离大于设置的阈值时将该值视为离群点,同时,存在自为一类的点,也将其视为离群点。
为避免数据波动对预测结果的影响,采用滑动时间窗算法对历史时间序列进行分析。通过计算多次滑窗累加扣分值表征轴承的健康状况,进而对轴承的潜在故障进行预判。文中以当前及历史探测站共19 组探测数据作为输入,设置滑窗窗口长度为15,如图7 所示。提取当前指标诊断窗口的特征,得到特征矩阵。将滑动步长设为1,构建5个特征矩阵,特征矩阵中的每个特征乘以对应的特征系数,计算5 次滑窗累加值。
图7 滑动窗口示意图
对每个诊断窗口内的时间片段进行特征指标计算,所以每一时间片段的特征值向量为fi=(x1,x2,…,xn)。经过滑窗诊断后,将形成对车辆中8 个轴承的滑窗特征值向量,进而形成车列中各车辆轴承的滑窗特征值向量,为式(6):
根据各特征与轴承性能状态的相关程度设置特征系数。通过统计故障轴承和正常轴承具有特征参数的次数与对应健康状态的相关性,作为计算特征系数的依据之一。本算法通过Pearson 相关系数法计算特征系数λ,并结合经验进行调整。
目标轴承状态滑窗累计扣分值,即轴承状态扣分d为式(7):
根据累计扣分值的大小,设置不同的扣分值阈值,阈值可以通过收集分数分布的统计数据并假定分数的分布是正常的来确定。进而实现对轴承健康状态预警的进一步细分,即一级预警、二级预警,见表2。
表2 划分预警等级
文中算法在神华铁路2017 年8 月~2018 年11月、2020 年11 月~2021 年2 月 的44 个 热 轴 报 警 轴承上进行验证。将提前24 h 以上的预警视为准确预警。验证结果见表3,预警算法的准确率为
表3 提前预警结果
93.18%。
试验结果表明,算法可以实现热轴的提前预警,典型实例如图8~图10 所示。
图8 预警实例1
图10 预警实例3
(1)某密封罩突发故障,轴承经过明显的温升上升阶段,直到异常高温值,触发激热报警。
(2)车辆由于轴承卡滞有异音发生微热及强热报警。
(3)温升长期或间歇性明显高于其他轴承,体现在空间维度上的趋势异常。
实例中发生漏报的3 个样本均为由轴承突发故障造成的热轴,温升如图11 所示。
图11 漏报样本
此外,由于模型的预警等级阈值是决定准确率与误报率的关键因素,因此,可根据列车实际运行情况和检修需求调整预警阈值,在保证较高准确率的同时减小误报率。通过实例验证,目前设定的阈值下,预警算法在205 个THDS 未发生报警的轴承中,有27 个进行了预警,从数据上分析,部分误报轴承的温升变化与车辆其他轴承相比确实存在异常,如图12、图13 所示,可以在检修时对该轴承进行重点检查,避免发生热轴。
图12 THDS 未报但预警样本1
图13 THDS 未报但预警样本2
图9 预警实例2
文中构建了基于时间序列异常检测技术的铁路货车热轴预警模型,通过提取时间、空间维度下的多个数据特征,并计算健康状态得分来识别含有故障隐患的轴承。数据特征的构建不仅是对目标本身时间序列的趋势分析,更将重点放在同辆比、同侧比、同列比上,这种方法能够有效地减小外生变量,如运行速度、运载重量对轴温的影响,因此,本模型的泛化性强,适合所有类型和大多数工况的多轴车辆。
对于神华铁路THDS 系统的44 个热轴数据,有超过93%的样本实现了提前不同程度的预警,从而有效地实现了对轴承的状态监测。同时,如果以THDS 目前探测结果为依据,还是存在一定的误报,下一步也会进一步跟踪这些轴承和分析误报的轴承温度异常原因。模型的应用可以有效地做到轴承部分故障的提前预警,帮助做出科学的维护决策,使车辆在列检中进行有针对性地检查和修理,大幅提高检修效率,有效防止事故隐患,减少因故障造成的停机。