李豹 曾海云
摘要:本文从故障信息数据采集、故障信息传递和闭环流程、故障信息数据分析利用角度分析了FRACAS信息系统实施过程,阐述了实施过程的要点,并提出了适合国内轨道交通行业的故障报告闭环系统流程;分析了在国内轨道交通行业实施FRACAS信息系统中普遍存在的2个重大问题,并提出了解决方法。
关键字:FRACAS 可靠性闭环流程 模块化设计 产品配置管理
引言
随着时代地不断进步和发展,社会、政府部门和市场对轨道交通产品的质量要求越来越高。人们对产品不再片面地追求产品性能,产品可靠性已经成为衡量产品价值的重要指标之一。据美国可靠性分析中心(Reliability Analysis Center,RAC)1995年发布的有关可靠性工作任务的调查报告,在众多可靠性任务中,故障报告、分析和纠正措施系统(Failure Report Analysis and Corrective Action System,即FRACAS)得分最高,其重要性已被国际公认。建立FRACAS的目的是及时报告产品故障、分析故障原因,制定和实施有效的纠正措施,以防止故障再现,改善产品可靠性和维修性。FRACAS系统是确保产品固有可靠性水平达到预期的目标值的有效手段。故障报告闭环系统对于提高产品的使用可靠性,改善其维修性,降低全寿命周期成本(Life Cycle Cost,LCC)等方面具有重要的作用。
轨道交通市场对产品可靠性的要求越来越高,国内许多企业已经实施了FRACAS信息系统。但在实施过程中,易出现与轨道交通行业不相适应的情况。本文以从故障相关信息的采集、传递和闭环流程和信息利用的角度阐述了在轨道交通行业中成功实施FRACAS信息系统的一些要点,论述了在国内轨道交通行业中FRACAS信息系统普遍面临的2个重大问题,并提出了解决方法。
1. 建立RACAS系信息系统的过程探讨
在实施FRACAS信息系统之前,企业也存在故障信息的收集、信息的处理和统计分析的过程。但是往往没有企业内统一的做法,各单元对信息的统计分析需求不同,各自保存和维护自己的故障信息库,信息的分类量化标准也不一,导致各业务单元统计的故障数据不一致。
实施FRACAS信息系统的过程就需要整合企业内各业务单元对故障信息的数据采集、整理和统计分析的需求,制定和实施企业内部统一的故障信息闭环处理流程,建立满足各业务单元需求的故障信息数据库。这场变革只有获得企业高层领导者认可和极力支持下建多功能FRACAS实施小组。实施小组的工作内容是研究和确定企业FRACAS信息系统的实施方案,并通过软件技术将其进行实现。
FRACAS信息系统由信息采集、信息传递和闭环处理、信息统计分析三大部分组成,信息的采集是FRACAS信息系统的输入、信息闭环处理是FRACAS信息系统对故障信息进行加工、故障信息统计分析是FRACAS信息系统的输出。
1.1 FRACAS信息系统的信息采集
FRACAS信息系统中数据的收集是FRACAS信息系统的输入,FRACAS信息系统实施小组可通过以下4个步骤来确定故障相关信息的采集标准。
第一步:实施小组需要调查研究企业内部各业务单位对故障信息的利用需求,比如:产品可靠性设计部门需要计算产品的平均无故障公里数,需要拟合产品的故障率曲线。
第二步:FRACAS实施小组研究确定满足每个要求,需要采集哪些信息,分析用户会按照哪些维度对这些数据进行统计分析。比如:计算产品的平均无故障公里数(MDBF),产品在历史里程数据、产品的故障次数。
第三步:FRACAS实施小组在统筹企业需要在FRACAS系统收集的信息之后,明确哪些信息需要进行量化,凡需要进行分类统计和计算的信息字段必須进行量化,最终形成企业统一的故障信息采集字段,并确定哪些字段需要进行量化。
第四步:FRACAS实施小组需要确定或制定量化字段的量化标准。调查企业内是否已有量化的标准,或者使用过的量化方法。FRACAS实施小组需要组织制定各字段的量化标准,比如功能系统层次的量化标准,失效模式的量化标准,故障影响等级的量化标准等等。制定的量化标准需要成为公司内统一的标准,确保FRACAS信息系统收集的信息在企业内都具有统一的含义。
1.2FRACAS信息系统的故障报告闭环工作流程
在国军标GJB841-90 《故障报告、故障分析及纠正措施系统》的应用指南中给出参考的故障报告闭环系统工作流程图,推荐的闭环工作流程是许多行业实施FRACAS系统闭环流程的模板,但与国内轨道交通行业的环境不相适应,军工行业的FRACAS系统实施范围集中在产品研发过程,批量生产之前已经对产品的可靠性进行了验证,从而FRACAS系统不再介入产品交付使用的阶段。而在国内轨道交通行业中实际也不可能对运用过程中的每一个故障进行故障根原因分析,并采取相应的纠正措施,而是按照故障的影响和发生的频次来综合确定是否进行立项攻关,进行根原因分析,制定纠正措施和实施相应的段改活动
图2GJB841-90提供参考的故障报告闭环系统工作流程图
因此轨道交通行业FRACAS故障报告闭环流程并不能照搬GJB841-90标准中参考流程。在实施FRACAS信息系统时,将闭环流程分为2个层次,一个是针对运用现场故障发现后的故障报告、故障核实(勘察)、故障维修和故障初步分析和责任判定的闭环流程(小闭环),另一个是针对批量故障识别成问题之后按照8D问题求解法实施的8D问题纠正措施闭环流程(大闭环)。其故障报告闭环流程图如下:
图3 适合轨道交通行业产品批量运用后的故障报告闭环流程图
1.3 FRACAS信息系统的数据分析
对FRACAS信息系统采集的数据,进行数据分析,支持业务决策是FRACAS信息系统价值所在。对于FRACAS信息系统中故障数据库分析,各企业往往通过定制相应的报表来实现,比如故障信息周报、月报、产品的平均无故障公里数(MDBF)计算报表、FRACAS流程监控报表等。这也是目前几乎所有FRACAS信息系统的做法。但是报表需要进行定制开发,每个报表都是按照特定的需求向决策层进行数据分析和展现。定制好的报表死板难以进行交叉分析,比如定制了一个本月各服务网点故障数的报表和本月各故障等级的故障数的报表,但需要知道各服务点各故障等级的故障数时,报表无法给出,除非重新定制新的报表。而在实际业务分析中往往需要多个角度进行交叉分析,报表难以满足这样的需求。
FRACAS信息系统可通过基于数据仓库的联机分析处理(OLAP)来解决报表系统问题,并极大提升数据分析的功能。在FRACAS信息数据库的基础上,通过清理、整合企业内部其它与故障信息相关的数据源(比如制造过程让步接收信息、产品制造过程中执行的工艺信息)形成数据仓库,并针对特定的问题领域建立多维数据集,多维数据集支持多个维度(比如:时间、产品、客户、服务点、功能系统、失效模式、供应商等等)进行交叉聚合分析,而且在这些维度可以进行钻取、切片切块、旋转操作。OLAP专门设计用于支持复杂的分析操作,侧重对决策人员和高层管理人员的决策支持,可以根据分析人员的要求快速、灵活地进行大数据量的复杂查询处理,并且以一种直观而易懂的形式将查询结果提供给决策人员,以便对业务单元的决策进行支持。使用OLAP技术对FRACAS信息系统进行数据分析将是FRACAS系统数据利用的发展方向。
2. 轨道交通行业实施的FRACAS信息系统普遍存在的2个关键问题及解决方法
2.1 通过模块化产品设计使FRACAS系统覆盖产品设计过程
国内轨道交通行业中产品的研发几乎所有的设计输出文件需要完全重新制作,其中存在大量通用性要求的类似重复设计。FRACAS系统中的故障经验库,不能主动向设计者提供改进经验,在超短的设计周期下,设计者忙于完成施工设计,特别是开发人员不同时,以前已经发生过的故障,在新设计的产品中仍然存在,甚至出现新的设计缺陷。产品也没有进行可靠性验证试验就进入了批量生产和交付阶段。设计缺陷只能在批量投入运营之后,才能显露出来。FRACAS系统的闭环流程仅用于对批量产品运营之后对其进行可靠性性提升,主要进行事后补救。主要原因是没有一种良好的机制将FRACAS系统提出的改进措施方便地应用于新产品开发,另一个原因是设计周期短。
如果加强设计输出的可复用性,确保可靠性提升的纠正措施能够通过复用直接应用于新设计,就能在缩短产品设计周期的同时,通过复用技术成熟,并经过可靠性验证的设计,保证产品设计的固有可靠性水平,这个复用的思想即模块化设计。
模块化设计可以将市场中一些通用的功能要求的实现进行封装成为可以复用的单元。通过对外提供标准的空间和通讯接口和模块功能的及功能调用的方法,使用者通过按接口的规范调用模块,就能在产品中实现相应的功能,从而不用关心模块内部的实现, 就能利用模块进行积木式搭建实现需要的功能,从而实现模块的复用。
模块在设计完成之后,应该进行相应的可靠性验证工作,通过了验证模块才能进行发布,并可投入的产品的设计中,对于模块的设计变更也需要重新进行可靠性验证,才能应用到最终的模块变更中,模块的变更通过模块的调用就可以直接应用到新产品设计中。因此针对模块的复用就是FRACAS信息系统的纠正措施在新产品应用的良好机制。
在模块的设计和变更过程应用FRACAS系统,其故障报告闭环系统流程参照国军标提供的参考闭环流程进行设计,针对在可靠性验证试验中发生的每个故障事件都需要进行根本原因分析,并采取纠正措施进行闭环;在最终产品的特性需求的设计和其选择的模块进行投入运营之后,其闭环流程可参考本文1.2节中提出的小闭环和大闭环流程,流程图见图3。
将通用要求的设计进行标准化封装成产品模块,并在新项目中直接使用,可以减少重复劳动,新设计的模块和对模块的改进变更经过FRACAS系统闭环流程进行可靠性验证,这样对模块的改进都直接固化在模块中,通过在不同项目中复用这些模块,不仅可以大大缩短产品的研发周期,还使得各项改进可直接应用于新产品设计,避免故障重复发生,能确保产品设计的可靠性。
2.2 通过产品配置管理系统提升FRACAS系统数据的分析能力
在轨道交通行业建立的FRACAS信息系统中收集到故障相关信息普遍缺乏可追溯性。比如不能获知故障件在生产制造过程中是否有异常,故障件是什么时候装配,故障时刻故障件服役了多长时间或者里程,故障件之前是否进发生过故障,是否进行了段改等等。此时故障信息的价值受到了极大的限制。比如在研究产品的可靠性中,产品的寿命分布(失效分布)是一个十分重要的因素,它是确定产品可靠度、维修周期等重要可靠性参数和进行可靠性分析的基本依据。而缺乏对零部件进行跟踪的FRACAS信息系統,在进行可靠性研究时只能建立在寿命分布符合指数分析的假设基础上,而对于机械产品而言,寿命分布并不符合指数分布而是威布尔分布,在这一基础上进行轨道交通产品的可靠性研究,对于机械产品而言是错误的。
产品配置数据管理系统能够很好地解决产品及其零部件的信息可追溯性问题。产品配置管理系统通过产品配置BOM作为产品配置数据的基础,为每个产品的每个零部件建立了配置数据档案,记录了比如零部件物料号、版本、零部件在产品中的安装位置、产品序列号、产品供应商、产品生产时间、装车时间、零部件装车时产品里程、零部件服役里程等信息。在这些信息发送变化时,比如更换了零部件、产品配属地发生变化、对零部件进行了段改作业时,产品配置数据系统将记录配置数据的变更的履历。
产品配置数据管理系统保证了产品配置BOM中的每个零部件均具有如同人的身份证意义一样的唯一的配置ID,每个零部件通过配置ID关联其在不同信息系统中发生的事件信息,使产品配置数据系统成为了这些信息系统数据进行互通的桥梁,能够将各信息系统的数据整合,从而极大地提升数据分析的能力和价值。比如:每个产品及其零部件可通过其配置ID关联FRACAS系统中对应部件的故障、维修和零部件拆卸事件,关联不合格品控制系统中对应部件的不合格事件和让步接收事件,关联制造执行系统(MES)中的工艺路线、工作中心等信息。
通基于产品配置数据的FRACAS信息系统,可使得FRACAS信息系统收集到的故障信息可与零部件配置数据相关联,从而使得产品及其零部件从设计、制造到产品运营的信息是可关联的,使得FRACAS信息系统具有显著的优势。比如,通过记录维修和拆卸时刻机车车辆的里程,就能准确计算出每个零部件的服役的里程数,加上每个零部件的故障信息即可估计零部件的寿命分析(失效分布)曲线,可解决可靠性分析中的基础问题,从而可以科学制定产品和零部件的维修周期、科学预测在保证可用性目标情况下备品备件数量等。能够从更多的维度上进行数据分析,比如针对不同供货商、不同配属地点、不同的装配位置、相同部件不同所属子系统之间、不同的技术版本之间等等进行可靠性比较分析,为设计选型、可靠性分析和验证、供应商业绩评价等提供准备的决策数据。
3. 结束语
南车株洲电力基础有限公司实施的FRACAS信息系统采用了本文提出的方法,整合了各业务单位对故障信息数据分析的需求,并量化了故障信息采集字段,形成了可从产品BOM、功能系统、时间、里程、供应商、客户、服役区域、失效模式、技术状态等多个维度进行聚合分析的故障数据库。并且实现了基于产品配置数据管理系统的FRACAS信息系统,能够追溯机车车辆及其零部件发生的故障、维修、更换、段改事件信息,能够利用这些数据拟合估计各零部件或功能系统寿命分布(失效分布)威布尔曲线。
4. 参考文献
[1] 陈晓静 面向商用飞机生命周期内的FRACAS研究【硕士学位论文】 南京:南京航空航天大学,2006
[2] GJB841-90 《故障报告、故障分析及纠正措施系统》
[3] 孟繁林 FRACAS技术在轨道交通行业中的应用 电子产品可靠性与环境试验 2013年第1期 66-71页