江炘坤,宋冬利
(西南交通大学 牵引动力国家重点实验室,四川 成都 610031)
传统装备维修管理方式主要以预防性维修为主、事后维修为辅,多采取计划修、事后修的方法解决装备的维修问题,但实际应用中存在维修不足、维修过剩等问题[1-2]。维修不足会导致装备未得到足够维修量在后续使用过程中产生风险,并增加装备局部故障演变为整体故障的概率;维修过剩会导致维修资源浪费和装备寿命浪费,如动车组轮对传统计划修方法较视情维修方法会浪费更多的轮径余量,导致轮对整体寿命缩短,同时频繁维修也会增加装备产生额外故障的概率。
为寻找更加经济有效的工程装备保障方式以适应现代工程装备的复杂性和智能性,在20世纪90年代中期,视情维修(Condition Based Maintenance,CBM)技术得到了美国等国的重视,并广泛应用于军事装备的维护与管理中。视情维修的目的是对装备在合理时间对合理部分进行维修,CBM可降低装备维修成本、提高装备维修效率、延长装备寿命。作为实现CBM技术的重要途径,故障预测与健康管理(Prognostic and Health Management,PHM)技术得到充足发展[3]。故障预测技术通常采用先进传感器技术,基于机理或数据模型监测和预测设备状态[4];健康管理是利用状态监测、故障诊断、寿命预测等关键技术对需要维修的对象进行分析和预测的技术[5]。
PHM强调在设备管理中开展状态感知、状态监控、明确故障发生范围与周期,通过采用先进传感器技术、信息融合技术和大数据技术实现对装备故障的监测和分析,从而大幅提高装备维修效率。
PHM实现了装备维护管理方法由健康监测向健康管理的转变,通过实时状态监控、故障判别、辅助决策和资源管理等技术手段,实现对装备的自我修复调控、智能维修辅助决策和维修任务的规划。使得传统装备维修办法转变为具有主动性、先导性的装备维修办法。
总结近年来PHM系统的应用研究情况,PHM系统总体技术框架可分为PHM对象层、数据处理层、信息处理层和决策层4个部分(见图1)。
图1 PHM系统总体技术框架
(1)PHM对象层。PHM对象层包括2部分:与PHM密切相关的对象(设备、装备等)和PHM的物理感知网络。在对PHM密切相关的对象设计时要保留PHM系统应用空间,即增加实现后续故障预测与健康管理功能所需要的空间;在对物理感知网络进行设计时要充分考虑传感器的应用工况、测试范围和传感系统物理结构的合理性。
(2)数据处理层。为了实现对PHM系统所采集信号的清洗,需在PHM系统中增加数据处理层。主要是实现对PHM对象层采集到的信号进行预处理,同时将处理好的信号按照一定格式分类存储,以便后续功能调用。
(3)信息处理层。结合PHM关键技术算法和先前数据处理层得到的数据,实现对故障预测和健康管理技术对象的寿命预测、故障预测、状态评估等PHM技术的核心功能,并将处理结束的信息发送给决策层。
(4)决策层。综合信息处理层得到的信息,考虑任务规划和经济成本,对维修决策、备件配置、资源优化等计划进行优化管理,得到更为合理的PHM运维决策。
PHM系统体系的主要结构可分为3类:集中式结构、分布式结构、分层融合式结构[6]。
1.2.1 集中式结构
当分析对象为小型、简单设备时,常采用集中式结构(见图2)。集中式结构逻辑简单,通过单一的中央故障管理控制器对整个系统所有故障信号进行收集和分析,并最终制定维修决策。尽管系统简单、信息传输路径明确,但集中式结构并不适合大型复杂装备:随着系统监测部件数量和信号量的急剧增加,中央处理器工作负载将会持续加大;越复杂的系统就越难以实现高效的处理效率,因而面对复杂系统时,集中式结构难以实现高效率分析。
图2 集中式结构示意图
1.2.2 分布式结构
分布式结构(见图3)各子系统具有独立完成故障监测、状态监测和隔离等任务的功能。各子系统完成各自分析任务后会将分析结果上传至综合控制系统。其突出优点是可在各子系统中独立完成PHM分析,且不存在高级别PHM分析,因此可大幅降低测试成本。相较于集中式结构,分布式结构可应用在大型复杂系统中,但各子系统间的分析结果并不能很好集成,从而缺少对各子系统信息中冗余信息的利用,形成的维修决策缺乏可信度。
图3 分布式结构示意图
1.2.3 分层融合式结构
分层融合式结构(见图4)是综合以上2种结构的新型PHM系统体系结构。在较低层级上,针对各子系统采用分布式结构处理,赋予各子系统独立的状态监测、故障检测能力,将被子系统解释后的信号形成重要信息流呈现给更高级别的处理模块。在高级别处理模块处,采取集中式结构的中央故障管理控制器作为处理核心,由于信号已被提前处理,大大减少中央故障管理控制器处理负担,形成针对装备各系统的综合诊断。分层融合式结构适用于现代大型复杂机电系统,系统各子系统联系密切,需具备对全局信息有准确处理能力的PHM系统进行处理,同时要求对各子系统的各种信息进行甄别和选择,为中心提供最干练的重要信息流,分层融合式结构是实现这种处理的较佳选择。
图4 分层融合式结构示意图
综上所述,对于结构简单、要求一次性工作和信息传输途径明确的装备系统,常采用集中式结构;对于工作时间较短但系统较为复杂的装备系统需采用分布式结构;对于结构复杂且需长时间工作、对工作效率要求较高的装备系统,常采用分层融合式结构。无论选择哪种结构,都应选择适用实际工况的PHM系统体系结构。
PHM技术早期多用于航空领域,如F404发动机检测系统中,出现了剩余寿命评估、操作极限监控、熄火检测等早期故障监测功能。但早期PHM系统缺乏故障预测功能,受限于当时技术发展条件,并不能实现故障的实时检测和及时预测。进入21世纪,随着计算机技术和数据处理技术的迅速发展,PHM技术已经成为连接装备本身和其保障装备的重要桥梁,同时也是英美等国争相研究的重点领域。PHM技术早在2000年就被列入美国国防部《军用关键技术》报告[7]。2002年,美国国防部在原有CBM管理技术基础上又提出更高端的CBM概念(CBMPlus,CBM+),用来提高装备视情维修的效率和精度。2006年,PHM技术在美国最新研发的F35战机上得到应用。同时,美国国家航天局等多个科研机构针对航天领域的PHM系统开展了综合研究。PHM技术不局限于航空航天领域,更在汽车、核电领域得到广泛应用。我国《国家中长期科学和技术发展规划纲要》(2006—2020年)[8]中明确指出,重大产品和重大设施寿命预测技术是提高运行可靠性、安全性、可维护性的关键技术。
相较于传统设备管理方式,PHM系统由传统故障触发抢修,到定期检修、状态维修,再到预防性维修和综合规划管理方式,从传统基于状态监测进一步演化为剩余寿命预测,具有安全性、经济性、可测试性、保障性、可靠性、实时监控性的特点(见图5)。
图5 PHM系统技术特点
PHM系统一般需要6个关键技术模块:可测试性与先进系统感知网络技术、数据预处理技术、健康状态划分技术、健康状态评估技术、剩余寿命预测技术、视情维修决策技术[9]。
2.2.1 可测试性与先进系统感知网络技术
在PHM系统研制之初,首先要考虑PHM系统感知网络层的构建,PHM系统在线感知网络主要是由传感器、数据传输网络、数据采集组件、接口组件、控制器组成的数据采集控制系统。需选择经济、性价比高的感知网络组件,确保建立读数全面、数据来源可靠的PHM系统感知网络。我国陆续有高校及科研院所开展了传感器技术研究,同时为方便PHM系统建立后的应用和测试过程,需结合PHM系统的实际应用环境,对PHM系统进行可预测性设计。可预测性设计的主要内容包含故障标尺内建、预警装置内部安装等,与具体应用对象的结构、原理等密切相关。
2.2.2 数据预处理技术
实际的PHM系统通常处于噪声干扰大、信号源影响因素多的工作环境。导致感知层采集到的信号具有随机性,不能直接进行分析,且各单位采集的信号由于参数单位不同,不能直接进行统一处理。因此需通过数据预处理技术进行分析后再进行健康状态划分和状态评估。数据预处理主要包括数据去噪、特征提取和规范化处理等。
(1)PHM系统对象层采集到的信号通常夹杂许多噪声,必须经过去噪清洗后才可被后续算法处理。常见的去噪方法有3种:分箱法、回归法和聚类法。分箱法通过对分箱数据进行去边界、最大或均值等处理,可使得到的箱内数据变得更加易于处理;回归法基于统计学理论实现数据的降噪处理;聚类法对PHM系统对象层采集到的原始数据按照一定规律进行聚类分析,最大程度降低离群数据量,实现数据的预处理。
(2)对象层的特征提取方法主要包括时域、频域、时频域3种。
时域方法主要利用时域内的多个特征量(如裕度因子、峭度因子等)作为统计依据,主要包括时域统计分析和相关分析。在时域统计分析方面,李继猛等[10]基于峭度指标,在保证已有特征完整性的前提下,对轴承振动信号中的周期冲击分量进行了提取。互相关分析可对2种不同信号间的关系作出描述[11];自相关分析则针对单个信号,对该信号在一定时间变化前后的关系作出分析。
频域分析相较于时域分析具有更高的精度,经过频谱变换后的信号会具有更高的故障辨识度。常见的频域分析类型有功率谱分析、倒频谱分析和包络谱分析等。代士超等[12]将倒频谱分析方法与时域分析方法相结合,使得到的轴承信号故障特征更加明显清晰,提高了对轴承故障诊断的准确度。
时频域分析可反馈出时间和频域间的关系,同时可以更好地显示信号细节存在的问题。常见的时频域分析方法有短时傅里叶变换(STFT)、Wigner-Ville时频分布、小波变换(WT)及其衍生方法[13]等。
(3)可采用缩放规范化处理及Z-Score规范化处理等技术将参数数据转化为无量纲数据。缩放规范化处理是将参数数据缩放至规定量程;Z-Score规范化处理是对数据集的均值及偏差进行规范化处理。
2.2.3 健康状态划分技术
实际应用中,通常将装备系统的健康状态划分为不同等级,如轮对多边形状态划分为A、B、C、D四个档次,通过细化的健康状态划分,可更加细致地描绘装备系统的实际工作状态。目前,健康状态等级划分方法可分为3类[14]:
(1)专家分类法。实际工况中以装备使用寿命和专家经验为判断依据,对装备的健康状态进行划分。专家分类法只适用于寿命周期容易获得、实际专家工作经验较为丰富的装备。
(2)等级标度法。在实际寿命周期难以评估且专家经验缺乏的情况下,可使用等级标度法作为健康状态划分方法,建立装备的健康指标库,并将设备的健康状态按照偏离健康正常指标的程度进行划分。
(3)聚类算法。采集装备的全生命周期运行数据,按照聚类算法对这些数据进行划分。此方法较适用寿命数据容易获取的装备。
Medjaher等[15]根据轴承实际工作寿命将轴承健康状态分为3个等级:健康、恶化和故障;Soualhi等[16]采用人工蚁群聚类算法将轴承健康状态分为4个等级:良好、较好、较坏和故障。
2.2.4 健康状态评估技术
健康状态评估是PHM技术研究的核心,对装备的结构、功能、运行机制和状态特征进行分析来构建系统的健康评估体系。健康状态评估方法主要有基于状态模型的方法、基于数据驱动的方法和基于知识经验的方法。
(1)基于状态模型的方法是在机理分析基础上,通过对设备对象的机理进行细致研究,得到其退化模型,进而对设备的健康状态进行评估。若建立的模型准确,则该方法可信度有保障。但建立模型过程复杂并需较高的专业知识,且建好的模型只可针对当下健康状态进行划分,不可推广应用。Rabiei等[17]提出一种基于经验裂纹扩展模型、定期裂纹尺寸测量、在线裂纹扩展速率估计的递归贝叶斯融合方法,用于机械结构的健康状态评估;Lu等[18]提出一种基于扩展卡尔曼滤波器的非线性欠定状态估计方法,用于燃气涡轮发动机健康状态评估。
(2)灰色系统理论、神经网络和支持向量机等基于数据驱动的办法,通过获取各状态参数的监测数据对健康状态进行划分,这种方法将会随着大数据技术的发展得到更多应用。牛晓晓等[19]采用在线顺序极限学习机识别轴承的健康状态;Guo等[20]采用卷积神经网络识别轴承的健康状态,网络参数的学习采用误差反向传播算法和自适应矩估计算法。
(3)基于知识经验的方法是基于一线维修人员经验判断作为评估的指标,常见方法有专家系统、层次分析法和模糊评判法。基于知识经验的方法主观性强、评判结果不具有普适性,且无法给出量化的故障程度。肖运启等[21]采用层次分析法和模糊评判法评估风电机组的健康状态;胡姚刚等[22]依据证据源修正思想建立基于证据推理的风电机组健康状态评估模型;邱文昊等[23]采用层次分析法、熵权法、模糊评判法和D-S证据理论评估某装备供电系统的健康状态;Yin等[24]采用基于差分进化算法优化的置信规则库评估数控机床伺服系统的健康状态。
2.2.5 剩余寿命预测技术
剩余寿命指从装备被监测开始直到装备功能失效所需的全部时间,往往利用分析设备的退化轨迹和历史数据建立剩余寿命估计模型。剩余寿命的分析有助于提出更合理的维修策略,提高装备的检修效率。剩余寿命预测的方法主要包括基于物理模型的预测方法、基于知识的预测方法和基于数据的预测方法。
(1)通过分析装备的物理失效机制,可得到基于物理模型的剩余寿命分析方法。这种方法可研究到装备故障的本质,得到的物理模型解释性强,并可做到实时预测。但构建物理模型的过程复杂,难以在复杂系统装备上应用。
(2)基于知识的预测方法与基于物理模型的预测方法不同,主要通过研究相关领域的专家知识进行预测,如基于专家知识的预测方法和基于模糊理论的预测方法,但这种方法更适合于定性推理,得不到量化结果,通常需与其他技术相互配合得到结果。
(3)基于数据的预测方法是根据历史数据和当前数据,通过数学分析反映寿命和数据间的映射关系,不要求了解装备的故障原理,只需通过强大数据处理分析能力就可得到装备的寿命预测模型。
2.2.6 视情维修决策技术
基于装备的故障预测和寿命预测结果,在装备出现故障征兆时就进行有针对性的维修称为视情维修。视情维修可解决传统计划修导致的维修不足和维修过剩问题。其主要方法有比例风险模型、冲击模型和延迟时间模型等。
(1)比例风险模型可较清晰地描述装备寿命周期和相关变量间的内在联系,并用量化单位表示装备的故障或剩余寿命。
(2)冲击模型主要应用于受到冲击的设备的寿命、可靠性和失效等性质的预测,多用于解决累积冲击条件下单维修决策问题。
(3)延迟时间模型将设备的失效分为初始缺陷阶段和延迟阶段。一旦设备在初始缺陷阶段完成了检测就能更有效地找到设备中存在的问题,但如果在延迟阶段内进行检测,就会导致设备故障。延迟时间模型需配合其他模型使用,单一使用延迟时间模型缺乏数学分析基础。
近年来,我国高速铁路迅速发展并取得了举世瞩目的成绩。而对高速铁路而言,由于车型众多,在行车过程中,设备故障和检修质量等方面的问题偶有发生。针对高速列车的PHM技术研究应运而生[25]。尽管有众多科研院所开展了针对轨道交通系统的PHM研究,但PHM技术在轨道交通上的实际应用仍存在难点问题有待进一步研究。
(1)轨道交通列车PHM总体技术研究。随着高速铁路的建设里程逐渐增多,高速铁路逐渐向“智能+服务”的形态转型,许多科研院所及高校开展了针对轨道交通PHM技术的研究。由于我国轨道交通列车型号繁多、数量大且各类车辆关键部件的失效模式和故障预测模型不同,通常情况下,一套健康评估模型只可应用于某一工况下的特定设备健康状态评估。且现有健康状态评估模型多依赖于单状态下的信号采集,不具备评估全状态轨道交通信息的能力。因此,如何整合各关键部件的PHM技术,作出全状态轨道交通健康评估和故障预测,是轨道交通PHM系统的一大研究方向。
(2)轨道交通关键部件故障特征参数集建立。在长期服役过程中,轨道交通列车表现出许多状态参数,如转向架横向加速度、轴向加速度、轴箱轴承声音信号、轮对踏面剥离与凹陷等。充分利用这些状态变量所反映的轨道交通关键部件状态可为轨道交通关键部件提供准确的状态特征数据库。对不同部件的状态参数进行研究来模拟得到该部件的状态变化规律,进而提炼出可反映不同部件健康状态的指标并整理成方便调用的集合,是接下来轨道交通PHM系统研究的一大难点。
(3)轨道交通故障信号深度处理。作为复杂机械系统的代表,轨道交通关键部件故障通常是混杂在一起发生,得到的故障信号通常会夹杂噪声和其他关键部件故障信号。如何在实际工况中对采集到的故障信息进行清洗并解耦得到列车多模式强时变故障特征的信息,进而实现对故障信息的准确分析,是亟待深入研究的课题。
PHM系统作为近年来引进轨道交通领域的新兴技术,对建设交通强国具有重要意义。首先对PHM技术总体框架进行梳理和应用范围总结;然后针对PHM关键技术研究和应用现状进行综述与分析;最后总结归纳在轨道交通PHM技术发展过程中面临的挑战。探讨轨道交通领域应用PHM技术存在的全状态健康评估模型建立与信号采集、轨道交通传感器技术、健康指标集建立和轨道交通关键部件故障信息解耦分析等热难点,可为轨道交通PHM技术未来发展提供借鉴与参考。