/上海航天电子通讯设备研究所
蒋颖晖 /上海航天控制技术研究所
可靠性是与故障作斗争的学科,产品的故障模式库是故障模式影响分析(FMEA)的重要输入,也是开展可靠性、维修性、保障性等“六性”设计与分析、验证工作的基础。利用故障模式库信息,通过产品的可靠性设计避免或减少故障发生,可提高产品的固有可靠性;通过产品的维修性、保障性等设计实现产品故障前或故障后的快速恢复,可提高产品的使用可靠性,是实现快速提升产品成熟度、有效控制技术风险十分有效的工具。
故障模式库不仅适用于大批量生产的产品,在开发周期短、小子样、技术风险大的航天领域,美国、欧洲及日本均建立了航天器故障数据库。我国的航天产品故障模式数据库尚未广泛建立和应用,不仅有样本量小、产品复杂等原因,信息收集困难也是主要原因之一。航天产品“双归零”信息中包含了构建故障模式库的大量信息,对产品“六性”工作具有重要的指导意义,但由于信息收集、分类、规范化整理等困难,这些信息未能得到有效利用。鉴于此,笔者结合FMEA分析、可靠性设计、维修性设计等工作的需要,以“双归零”信息为输入,设计了故障模式库的数据结构,并给出了各部分数据信息的获取方法。
在我国航天行业,广泛实施产品故障(质量问题)技术归零五条和管理归零五条的“双归零”要求。其中,技术归零明确了在产品出现故障后“定位准确、机理清楚、问题复现、措施有效、举一反三”的5个方面要求。
“双归零”信息通过航天产品质量与可靠性信息采集卡来收集,其中数据项是根据Q/QJA 11A-2007《航天产品质量与可靠性信息管理要求》演化而来,主要涵盖以下3个方面信息:一是产品信息,包括产品类型、产品所处层次、产品名称,对应数据项有问题产品分类、所属分系统、问题产品、产品名称等;二是故障信息,包括故障描述、故障原因、纠正措施,对应的数据项有质量问题概述、问题原因、原因分类、纠正措施等;三是案例信息,主要是举一反三信息,对应的数据项为举一反三说明。
故障模式是故障的表现形式,而故障模式库是不同产品的各种故障模式信息的汇总,应包含产品信息和故障信息,且这些信息之间并不独立,存在一定的相互关系,由此建立的故障模式库数据结构如图1所示。
故障模式信息依附于产品信息,具体表现是:按产品来建立各个故障模式,一个产品可能对应多个故障模式信息;产品与产品之间存在结构层次关系,由于产品之间结构层次关系的存在,导致故障模式信息之间也相互关联,最主要的体现就是下层产品的故障模式是其所属上层产品的故障原因,这一构造对于FMEA分析中故障模式、故障原因和上一层次影响等数据获取提供了极大的便利。
图1 故障模式库的数据结构
根据图1中故障模式库数据结构设计,故障模式信息应依附于产品,故以产品为主导来建立故障模式信息。通过对故障信息分析,以及开展“六性”设计与分析工作,尤其是FMEA工作的需要,每个故障模式信息至少应包括表1中的内容。
表1 某产品故障模式信息数据结构表
一个故障在模块级、单机级、分系统级或系统级不同的产品层级上的表现形式是不同的,因此在不同层级的产品上会有不同的故障模式;不同产品的故障模式以及产生原因是不同的,但同类产品的故障模式及产生原因大多一致。考虑到故障模式库的通用性,按产品类型作为故障模式库的数据单元比较合理,在GJB3386-98《航天系统质量与可靠性信息分类和编码要求》、GJB3781-99《电子系统质量与可靠性信息分类和编码要求》等标准中有类似的要求。由此,建立的产品信息要素及其相互关系如图2所示。
故障模式库中综合产品信息和故障模式信息共有数据项12项,其中大部分数据项可以直接从航天产品质量与可靠性信息采集卡获取,一部分数据需要人工分析、归类,各类数据项获取途径及方法见表2。
可以从采集卡中直接获取数据项,由于录入人员语言习惯及文化背景存在个体差异,在导入故障模式库后仍然需要进一步整理,以保证数据的规范化,其他需要人工设定的数据项可以采用以下方法获得。
故障模式代码。根据GJB3386-98、GJB3781-99等标准编制,每个故障模式库应制定出对应的故障模式信息代码手册,如某类型显示器在多个型号的地面控制装备中应用,采集卡中共记录了“显示器黑屏”“显示器无影像”“屏幕无显示”3个质量问题。经确认,这3个质量问题均为相同故障模式,若参照GJB3386-98、GJB3781-99制定编码规则,该产品的故障模式可规范化描述为“地面控制系统显示器无显示”,该产品故障模式代码为“210161-180”,其中“210161”是产品编码,“180”是通用故障模式代码。
图2 产品信息要素及关系示意图
表2 故障模式库数据项获取途径
故障模式名称。采集卡中有该数据项,但录入人员不同,同一个故障模式可能在采集卡中有不同的表达方式,因此需要参考GJB3386-98、GJB3781-99等标准进行归一化处理。
故障模式描述。根据故障模式发生情况人工总结。
发生频次。统计一段时间内故障模式发生的次数,计算MTBF。
产品类型。产品类型定义是建立故障模式库的基础工作之一,在故障模式库建立之初就应该设定好,后续参考采集卡中数据项进行分类整理。
产品层次。根据分析级别设定为模块级、单机级和分系统级等,在产品信息录入时人工设定。
在“双归零”信息基础上生成故障模式库,主要需要开展以下3个方面工作:一是对产品实施分类,建立产品(类)项目;二是按产品项目对质量问题数据库中的所有质量问题进行分类;三是为每个产品项目指定产品保证工程师或可靠性保证工程师,作为该类产品故障模式信息管理人员,对质量问题数据库中新发生的或已有的质量问题信息进行分析,由其根据故障模式信息代码手册确定故障模式及其编码实现规范化,再导入故障模式库。
生成故障模式库的工作流程如图3所示。
统计某型显示器近年来发生的质量问题,形成质量问题信息统计表,见表3。对质量问题信息进行简化处理,只显示用于故障模式分析确定的相关信息,参照 GJB3386-98、GJB3781-99标准制定编码规则,对显示器的故障模式进行标准化的处理,可以建立显示器的故障模式库,见表4。
图3 故障模式库建立的工作流程
表3 某型显示器质量问题情况简表
表4 某型显示器的故障模式表
表4将表3中多种故障现象即填报的故障模式如“黑屏、不显示、开裂、花屏、闪屏”等进行了归一化处理,参照GJB3386-98、GJB3781-99标准,总结归纳为“无输出”和“输出异常”2种故障模式。当GJB3386-98、GJB3781-99标准中已经提供的故障模式不能表述产品的故障模式时,需要根据产品的故障表现来定义一种新的故障模式。同时,显示器属于单机级产品,其下层板级产品,如电源板、逻辑板、液晶屏等产品的失效导致了显示器的故障,显示器上层产品是通道台,显示器的故障也会导致通道台出现质量问题。
基于“双归零”信息建立的故障模式库,将从产品研制、生产、试验、使用中采集来的各项原始故障信息经过分类和规范化整理,转换成能直接用于产品FMEA、可靠性、维修性和保障性设计的故障模式信息,对产品可靠性提高具有重要意义。产品故障模式库的建立是实现可靠性、维修性、保障性等“六性”信息数字化管理的基础,围绕基于“双归零”信息的产品故障模式库逐步扩展和丰富产品在研制、使用、预防及修复性维修的各类信息,可以使质量与可靠性信息得到深度利用,进而实现产品全生命周期可靠性信息大数据综合管理。