□ 杨家荣
上海电气集团股份有限公司 中央研究院 上海 200070
在制造系统越来越复杂,生产运营少人化、无人化的条件下,需要实现高效率、高质量的设备维护和及时维修。智能运维是通过数据采集和分析等技术对传统运维进行的一种升级,能够自动识别设备在生产制造过程中存在的隐患,对已发生或将要发生的故障、问题及时发出警报,从而辅助运维管理者消除设备隐患,对故障原因进行判断和处理[1]。对工业企业而言,高效的运维管理意味着更少的设备故障、更高效的故障停机处理,以及更低的运维成本。笔者介绍故障预测与健康管理技术在智能运维中的应用。
故障预测与健康管理技术最早在西方发达工业国家兴起,早期概念起源于预测性维护,之后逐步发展为故障预测与健康管理。故障预测与健康管理技术是基于状态的维修的升级发展,强调设备管理中的状态感知,监控设备健康状态、故障频发区域与周期。通过数据监控与分析,预测故障的发生,从而大幅度提高运维效率。故障预测与健康管理技术已经形成了一套技术方法体系,具有包含数据采集与传输、数据处理、决策支持、综合信息管理的技术结构,相应的技术标准体系也相对完善。
目前,故障预测与健康管理技术已经在民用飞机、直升机、战斗机、航天器等方面得到了应用,并且是研究的热点。波音公司在法国航空、美国航空定购的多个机型中应用故障预测与健康管理技术,提高维修效率。在军事武器装备领域,故障预测与健康管理技术的实施效果最为显著。如著名的F-35战斗机,采用故障预测与健康管理技术后故障不可复现率和维修人力大大降低。统计数据充分证明,故障预测与健康管理技术在降低维修保障成本,提高安全性、可用度、完好性,确保任务成功性方面具有重要作用[2]。随着我国制造业朝数字化、网络化、智能化方向的发展,故障预测与健康管理技术逐步从最初的军事、航天领域向民用高端装备应用,进而提高装备的安全性,降低运维成本。
当前,我国的重大装备取得了较大发展与突破,高铁、数控机床、核电、风电等领域都取得了举世瞩目的重大成就。这些高端装备的制造过程十分复杂,装备交付之后必须进行经常性维护检修,保障稳定性。一旦装备出现异常,则损失巨大。以安全著称的航空业,因飞机故障原因导致的事故或延误仍无法完全避免。海恩法则指出,每一起严重事故的背后,必然有29次轻微事故、300起未遂先兆,以及1 000项事故隐患[3]。传统维护检修更依赖人的经验与能力,在设备发生故障后,会进行故障记录分析,但不具备对故障的预测、预警功能。在智能运维过程中,用户希望能及时发现设备存在的隐患,及时制订维修策略,降低故障发生概率。由此可见,故障预测与健康管理技术在设备安全和保障中发挥着越来越重要的作用。
目前,故障预测与健康管理技术的应用深度、广度和功能水平,与应用对象、目标、任务有直接关系,并且存在很大的差异性。故障预测与健康管理技术的应用多表现为集成至工业互联网等智能运维平台的模式,这样可以支撑业务的发展。
随着我国经济的发展,高层建筑不断增多。电梯作为一种特种设备,存在一定的安全隐患。据统计,门系统事故是电梯的最主要事故,80%以上的电梯故障和70%以上的电梯事故都是由于门系统出现问题造成的[4]。电梯门系统故障模拟台如图1所示。通过采集电梯运行过程中门系统的数据,应用故障预测与健康管理技术,可以对门系统进行故障诊断和预测。此外,用于运送乘客或货物的轿厢也是电梯非常关键的组件,同样可以应用故障预测与健康管理技术,对轿厢的振动信号进行采集,并进行故障诊断和预测。电梯轿厢故障分类混淆矩阵如图2所示,其中,导靴大故障的预测准确率在98%左右,其它故障模式的预测也均取得了良好的效果。应用故障预测与健康管理技术,可以将传统电梯故障后检修方式转变为新型状态预测和维护方式,为现场设备的维护预留关键时间窗口,能够避免事故发生和人员伤亡,节约大量不必要的维护资源。
图1 电梯门系统故障模拟台
图2 电梯轿厢故障分类混淆矩阵
城市轨道交通的高速发展给运维市场带来了广阔的空间。我国轨道交通线路关键设施、设备陆续进入中大修阶段,而与此同时,运维呈现出人员分布不均情况,面临客流量持续攀升、拥挤度超标等局面,迫切需要提高运维效率,降低晚点率和突发事故的发生率。传统上,城市轨道交通关键设备主要采用以计划预防修和故障修为主的检维修体系。当前,构建集状态监测与评估、特征提取、故障诊断与预测、维修模式优化、维修决策于一体的轨道交通智能运维系统,是业内热点[5]。应用故障预测与健康管理技术,可以对转向架与轮对、屏蔽门、车门、空调、弓网关系、道岔等进行故障预测与健康管理。轨道交通车辆转向架运行状态监测系统界面如图3所示,这一系统可以在轨道交通车辆运行过程中对转向架的运行状态实现故障预警信息集中管理和预警提示,从而预测可能发生的故障,给出车辆运营维护建议,提升乘客体验。
图3 轨道交通车辆转向架运行状态监测系统界面
随着风力发电装机容量和规模的不断扩大,风电场运维已经成为风力发电产业重要的后市场。伴随着装机机组服役年限增加,近年来,风力发电机事故频发,如失火、倒塔等,使风电场运维的成本和压力不断增大。有机构对风力发电机事故的原因进行总结后发现,机组设备质量不过关、机组研发与运维脱节等是造成风力发电机事故的主要原因。在风力发电检修方面,故障预测与健康管理技术可以降低机组事故发生率,减少维修费用,缩短维修时间,提高机组运行效率和可靠性,同时能够为设计人员提供指导。
目前,几乎所有大型风力发电企业都在开展故障预测与健康管理技术与运维系统的开发,尤其是对大型海上风电场而言,智能运维直接关系到海上风力发电项目的安全和社会经济效益。风力发电机组状态监测及智能分析系统界面如图4所示,这一系统针对风力发电机组传动链,实现轴承和齿轮箱的智能故障诊断与状态评估,自动分析故障位置与故障类型,并预测衰退趋势,能够提高风力发电机组的运行效率和可靠性。
图4 风力发电机组状态监测及智能分析系统界面
故障预测与健康管理技术实现预测的方法主要分为三种:基于可靠性理论的预测、基于数据驱动的预测、基于时效物理模型的预测,三种方法在工程应用中的广泛性依次减弱,预测精度依次提高,相关的难度和成本依次增大[6]。
采用基于数据驱动的预测方法,模型构建过程相对简单,在获取准确、全面数据资源的前提下,只需要描述数据输出关系和相关参数,即可进行状态预测,不需要建立精确的物理模型。在近几年工业大数据浪潮的推动下,基于数据驱动的预测方法获得了空前的关注,成为研究和应用的热点。
基于数据驱动的预测方法对一个复杂系统对象进行预测与维护,需要确定可以直接表征系统故障及健康状态的参数指标,或者可以间接推理判断系统故障及健康状态的参数信息,这是应用故障预测与健康管理技术的数据基础[7-8]。传感器技术的应用,将直接影响故障预测与健康管理技术的应用效果,传感器的类型、安装位置、精度、传输等都会产生影响。一旦获取数据,就可以开展下一步具体的建模工作。故障预测与健康管理技术建模流程如图5所示。
图5 故障预测与健康管理技术建模流程
采用基于数据驱动的预测方法,还离不开特征工程,尤其是有经验的数据建模工程师的工作。对采集到的数据进行预处理之后,特征的提取与选择等操作非常重要,需要有经验的工程师一起参与并进行判断。找到有效的特征后,可以应用开发的模型进行衰退性评估,如果衰退是一个逐渐损耗的过程,那么基本可以使用这一模型来预测未来的状态变化和趋势,否则需要进行相应的调整和优化。
故障预测与健康管理技术虽然具有较好的应用前景,但是实现难度较大,并且复杂度高。在当前国内企业众多的应用项目中,因为基础理论及方法研究起步较晚,所以虽然开展了大量工作,但还是遇到了不少问题与挑战,主要有三方面。
第一,现有故障预测与健康管理技术故障诊断、性能预测效果欠佳。
复杂系统自身具有高维、非线性等特点,导致难以建立准确的系统模型。早期故障特征表现不明显,在传感器测点有限或不可及的情况下,获取的信息不完备,难以获取有用的信息。以上因素导致现有故障预测与健康管理技术故障诊断、性能预测效果欠佳。基于时间序列的数据虽然量大,但是价值密度不高,导致一些简单的设备应用故障预测与健康管理技术往往可以取得很好的效果,而在大型复杂装备中应用却无法取得令人满意的效果。当前,对于故障预测与健康管理技术的追求逐步理性,从现实角度考虑,不追求准确预测剩余使用寿命,只对子系统的性能衰退趋势进行跟踪,是比较现实和可接受的预测形式。
第二,在现有故障预测与健康管理技术中,模型无法自适应调整。
当前故障预测与健康管理技术的预测模型多数属于静态模型,缺乏自学习能力,通常情况下预测模型通过一次建模获得,模型参数保持固定不变,没有考虑复杂工业场景下环境变化、负载变化、新增样本、工况变化等对模型参数的影响,如果一个设备发生了状态变化,模型无法自动优化或升级,由此导致对于复杂装备的预测在运行工况多变的情况下并不精确。
第三,当前关于故障预测与健康管理技术的研究主要集中在故障知识推理和知识表示方面,异构故障知识组织与管理、应用方面的研究较少。
知识在故障预测与健康管理技术中具有重要作用,涉及产品设计、制造、运行、维护过程,包括结构化、半结构化、非结构化等类型。实现对这些知识的有效管理和应用,是提高故障预测与健康管理技术应用效果的基础和前提,也是故障预测与健康管理技术需要解决的难点。从知识管理和服务的角度来研究故障预测与健康管理技术中的知识建模和应用,是当前航空、高铁等领域的关注点,尤其是在航空领域,已经取得了很好的成效。另一方面,失效样本少,数据测点不完整、不平衡等问题,都会导致故障预测与健康管理技术在应用层面很难保证模型的准确性和稳定性[9-10]。各类故障试验数据、性能退化征兆、故障发展到失效的数据等都非常宝贵,而目前大多数国内企业尚未建立起完整的数据库。
应用故障预测与健康管理技术的根本目的是与运维过程中的其它系统集成,促进维修保障模式向智能运维转变,便于维护、维修计划的制订和调整,提出有针对性的运维计划,降低运维成本。在推进智能运维前期,尤其要做好故障预测与健康管理技术的探索和数据整理,为后续模型的优化打下基础。由于受到观念和条件的限制,我国在产品研制时,没有同步设计保障体系,配套的维护保障设施、设备维修方案、详细备件及技术资料都不健全。对此,可以考虑结合智能运维平台档案履历的电子化、交互化,在此基础上发展故障预测与健康管理技术。故障预测与健康管理技术的应用注定是一个缓慢推进的过程,在当前预测准确度还存在一定不足的情况下,企业需要将产品的设计、研发、制造、销售、服务等环节逐渐构成闭环,进而依靠机器视觉、工业互联网大数据分析等的综合运用,结合专家经验知识,将海量工业数据转变为有价值信息,实现智能运维。