崔镇韬,李健,宋月,陶宇茜
(航天科工防御技术研究试验中心,北京 100000)
故障率、又称失效率,是产品可靠性的一种基本参数,其度量方法为:在规定的条件下和规定的期间内,产品的故障总数与寿命单位总数之比[1]。装备的设计、工艺以及使用环境,都会对故障率产生影响,同时,故障率也关系着装备的作战能力,尤其与装备的通用质量工作息息相关。如今,随着科技的不断发展和世界局势的变化,装备面临着使用环境复杂,贮存时间较长等新形势,因此,通用质量特性的重要性日益凸显。无论在装备通用质量特性的指标论证、设计和试验验证阶段,故障率都起到了重要的作用。因此,有必要系统地分析故障率对于装备通用质量特性的影响,并通过故障率这一基本参数明确装备六性之间的相互关系。
故障率是衡量产品可靠性的一个基础指标。在评估产品的使用寿命时,产品的失效率是重要的特征量。失效率的函数表达式为:
由公式可知,瞬时故障率的大小与产品的剩余寿命函数(即可靠度函数)和故障分布的概率密度函数相关。电子产品的失效率模型在实际中通常为浴盆形[2],随着时间的变化,可分为早期故障期,随机故障期和磨损故障期,如图1 所示。故障率与产品的可靠性呈现反比的关系,即故障率越低,则产品的可靠性水平越高[3]。
图1 浴盆曲线
常用的故障率分布为指数分布、正态分布和威布尔分布等,其中电子产品的失效率往往符合指数分布模型。将指数分布的产品寿命分布代入公式(1)可知,指数分布产品的瞬时失效率为常数。Vaupel 等通过将指数分布和威布尔分布混合得到了浴盆性失效率模型[4]。产品的故障率与其组成单元的数量和复杂程度相关,对于复杂的系统性产品,度过了早期失效期后,故障率往往趋于稳定值[5]。在工程实践中,为了计算方便,通常将产品的故障率视为恒定值。
我国故障率研究工作与可靠性研究同步开展。电子工业部(原称四机部)在20 世纪50 年代成立了专门的研究机构,调查分析电子产品的失效情况。60 年代中期,航天部门开始了对故障率的研究。随着改革开放,我国各个部门和单位逐渐意识到了可靠性对于产品的重要性。八十年代初,建立了“中国电子产品可靠性数据交换网”[6],经过大量试验和数据收集,相继编写出版了《电子元器件的失效率手册》和《电子元器件失效率预计手册》。目前,常用的失效率依据包括GJB 299C《电子设备可靠性预计手册》和GJB/Z 108A《电子设备非工作状态可靠性预计手册》等,综合分析元器件的质量控制等级、环境应力、应用状态和结构等信息,分别明确了元器件的工作失效率和非工作失效率。
国外对于故障率的关注,直接标志了可靠性指标的诞生。20 世纪40 年代,英国航空行业首次提出了可靠性指标,航空产品的故障率不得高于10-5/h[7]。息息相关美国的故障率研究工作源于上世纪50 年代,二战期间,电子器件故障频发,促使了电子设备可靠性咨询组(Advisory Group on Reliability of Electronic Equipment)的成立。1956 年,美国可靠性分析中心(Reliability Analysis Center)研究得到了元器件故障率的数学模型。1960 年,基于统计得到的大量数据,美国海军提出了已经验模型为基础的电子设备可靠性预计手册(MILHDBK-217A),该手册提出了电子器件故障率的计算方法。1962 年,由于电子元器件的发展速度迅猛,试验累计数据来计算故障率的方法无法满足元器件的发展需求,美国从材料的失效机理入手,将故障率与故障机理相结合,提出了故障物理方法[8]。在后续故障率评估的发展中,随着元器件的加工工艺越来越成熟,产品的复杂度逐渐升高,元器件故障率对系统的影响逐渐减弱,学者们通过使用相似产品数据,将经验模型和故障物理方法结合等方法来得到产品准确的故障率[9]。
通用质量特性可分为可靠性、维修性、测试性、保障性、安全性和环境适应性。通用质量特性要求贯穿装备从研制、试验到使用的全过程,通用质量特性的工作质量直接决定了装备的使用质量和使用寿命等重要指标。针对这一重要指标,国家发布了一系列军用国家标准,形成了全面的通用质量特性要求体系。根据GJB 900C《质量管理体系》,装备的研制单位要在研制过程中依据GJB 450A 等标准的要求,明确产品的通用质量特性要求,编制通用质量特性工作计划,逐项开展通用质量特性工作的设计、分析及试验验证等工作。结合六性对应的工作要求,逐个分析故障率对于装备六性的作用。
开展可靠性的工作目标是为了确保装备达到规定的可靠性要求,保持或提高可靠性水平,以满足装备的战备完好性和任务成功性等要求、降低对保障资源的要求、减少寿命周期费用。故障率作为可靠性的基本参数,对GJB 450A《装备可靠性工作通用要求》[10]中的可靠性分配、可靠性预计、FMECA、可靠性试验与评价和可靠性评估与改进等工作项目都有着重要的影响。
1)产品可靠性的分配是指将可靠性的定量指标分配到规定的产品层级。可靠性分配通常以各层级产品的故障率为基础,通过建立的可靠性模型,将指标通过故障率向下级产品进行分配。常用的可靠性分配方法包括等比例分配法、加权分配法、AGREE 分配法和动态规划分配法等[11]。针对串联系统,通常采用比例分配法,分配给单元的可靠性指标与单元的故障率成正比,准确的单元故障率才会得到准确的可靠性分配结果,从而为产品的设计和原材料选择提供依据;
2)可靠性预计与可靠性分配同步进行,反复迭代以确定结果的准确性。确定组成产品的零部件的失效分布是开展可靠性预计工作的前提,也决定了可靠性预计和建模的准确性。元器件计数法为最为常用的可靠性预计法之一,而元器件计数法的基础是通过大量数据得到的元器件在各种环境下的故障率信息。可靠性建模和预计工作要根据故障率信息进行实时调整,才能在产品的研制过程中及时提供有效的信息,从而起到指导的作用。随着装备逐渐趋于复杂化,系统级产品的元器件数量增多。元器件故障率的准确性也直接影响着可靠性预计和分配结果的准确性。王建军等通过分析比较国军标、美军标及民用企业的可靠性预计标准发现,采用不同的标准计算得到的元器件故障率差距较大,军标的元器件故障率对环境因子更敏感,民用标准的元器件故障率对电应力系数更敏感[12]。与装备在使用中实际得到的可靠性水平相比,使用标准的数据进行可靠性预计,结果也往往过于保守,从而给设计和周期带来了不必要的负担[13];
3)故障率影响着产品故障模式的危害性分析,常用的危害性分析方法包括风险优先数法和危害性矩阵法,产品的故障率是这两种方法中确定故障严酷等级的重要参数之一;
4)合理的故障率指标能够保证可靠性试验的方案正确选择。可靠性试验的目的是获得产品的可靠性真实水平,并发现产品的潜在缺陷[14]。试验的故障率考核指标设置是否合理,直接决定了可靠性试验方案的经济型和数据收集的有效性。过高的指标会导致产品的研制改进过程较长,而偏低的指标则无法充分暴露产品的设计缺陷,无法评估产品的可靠性水平;
5)通过可靠性试验累计得到的产品的故障率信息,可以作为相似产品开展可靠性工作的重要依据,在产品的方案设计阶段,通常使用相似产品法开展可靠性预计等工作[8]。
开展维修性的工作目标是提高装备的战备完好性和任务成功性,减少维修人力及其他维修保障资源要求[15]。故障率是产品维修性工作开展的重要输入信息。
构建产品的维修性数学模型时,产品各个组成单元的故障率与该组成部分对系统平均修复时间的影响成正比;
开展维修性分配工作时,常用的分配方法包括故障率分配法和故障率设计特性加权分配法。故障率越高的单元分配的维修时间越短;
故障率数据同样是开展维修性预计工作的前提条件,常用的维修性预计方法单元对比法、功能层次预计法和时间累积预计法都需要明确系统各个单元的位置和故障率;
开展维修性试验时,若自然故障所产生的维修作业样本不足时,则使用人工模拟样本进行补足。模拟故障样本的分布通常按照产品的故障率的比例进行分配[16]。
测试性是指产品能及时并准确地确定其状态(正常工作、不可工作或性能下降),并隔离其内部故障的能力[17]。
目前测试性的分配方法主要可以分为函数法和优先分配法[18]。最基础的函数法为故障率分配法,即以产品组成单元的故障率和数量为主要参数,对测试性指标主机分配。在故障率的基础上加入其他统计参数,发展出了其他函数法:加入了修复时间、故障检测与隔离难度的加权分配法和针对部分单元测试性指标已知情况的老产品分配法[19]。通过遗传算法、粒子群算法等构建优化模型的分配方式,故障率同样是其构建基础矩阵的重要参数[20];
测试性指标分配需要计算故障模式或故障单元的总故障率,相应单元分配的指标与计算得到总故障率成正比;
在开展机内测试设计(BIT)和外部测试设计时,测试点位置的布局和优选需要考虑故障率情况[21],通过以故障率、测试时间和费用等为参数的公式计算出测试点的选择方案;
在设计现场可更换单元(LRU)时,需要对LRU 的故障率信息进行确认,对于互相有关联的LRU,要尽量通过设计与元器件选型等工作来保证故障率相差不大;
在确定测试性的试验方案时,样本量的确定和样本数量的分配都与单元的故障率相关。当采用功能单元覆盖要求确定样本量下限时,需要已知受试产品及产品各个单元故障率的最小值[22]。
装备保障性的定义为装备的设计特性和计划的保障资源满足平时战备和战时使用要求的能力。作为一次性使用产品的保障性参数之一,保障性工作的成功实施与故障率密切相关。
在制定装备的保障方案时,设计人员可以通过产品的故障率信息来确定备件的数量,制定在使用前后的检查计划,科学合理的安排需要的维修和测试人员。
装备的预计故障率,是制定预防性维修方案的重要依据,准确的装备故障率信息,可以确保预防性维修工作的有效开展。
安全性的工作目标是将装备的风险控制到可接受的水平,识别、消除或降低其风险,遵循预防为主、早期投入的原则。安全性的主要工作是避免事故发生,准确的故障率信息可以使安全性工作的开展事半功倍。
在分析和评价危险的过程中,危险严重性和危险可能性是两大重要的指标,其中危险可能性的等级通过产品的故障率来确定[23]。
故障率同样是评价产品安全性设计水平的重要指标之一,可以通过对故障率较高的单元进行安全性设计的审查,以避免装备在工作时出现安全问题。
环境适应性是产品在其寿命期内预计可能遇到的各种环境的作用下能实现其所有预定功能和性能和不被破坏的能力,通常开展环境试验来进行考核。
在进行环境试验方案设计时,应提前确定进行参数实测的必要性和环境适应性设计采用的风险率,这些往往都需要以产品的故障率信息为支撑。
产品在开展环境试验发生故障时,故障率信息可以提高故障定位和分析工作的效率。
本文通过分析通用质量特性的主要工作内容,分析得到了故障率不仅是可靠性的重要参数之一,同时也对装备的维修性、测试性、保障性、安全性和环境适应性等其他设计特性具有重要意义。在研究和生产的过程中,获得准确的故障率分布及数据,对于装备通用质量特性指标的确定和提高装备的通用质量特性水平具有重要的支撑作用。同时通过分析可知,产品的通用质量特性之间是协调的,设计要求和定量指标可以通过产品的故障率相关联,在后续研究中,可进一步探讨基于故障率对产品六性指标进行一体化设计。