蔡骏
(中国电子科技集团公司第二十八研究所,江苏 南京 210007)
在军用电子产品研制的工程实践中,产品可靠性指标的要求都较高,样本数较少,由于项目研制进度、经费及资源等条件的限制,难以采用可靠性鉴定试验的方法来对产品的可靠性进行验证。因此,建立在科学理论及大量试验数据基础上的可靠性评估就成为对电子设备可靠性水平进行评价,对其可靠性指标要求进行验证的重要方法与手段[1]。
可靠性评估按照试验数据的统计特征可分为成败型可靠性评估模型、指数寿命型可靠性评估模型、威布尔型可靠性评估模型及结构(应力-强度型)可靠性评估模型等。实践数据证明,大部分电子产品的失效分布符合指数分布。为此,本文主要讨论符合指数分布的电子设备的可靠性评估方法。指数可靠性评估模型按照试验方法的不同分为定数截尾、定总试验时间及定时截尾3种,在电子设备的研制中最常使用无替换情形下的定总试验时间方法。工程上常用经典法和贝叶斯法进行评估,在定总试验时间情况下,这两种方法MTBF单侧置信下限的计算公式如下[2]。
其中,MTBFL——设备MTBF单侧置信下限;
T——定时截尾试验的等效试验时间;
R——故障数;
(1-α)——置信度,一般在0.6~0.9之间选取,实际由承制方和使用方协商决定。
本文以某型网络通信设备为例,阐述对其进行可靠性评估的工程应用实施方法。
可靠性评估工作的开展,必须是在规范化的研制过程条件下进行。采取的评估方法合理,试验数据准确可信,才能保证评估结果的有效性。某型网络通信设备在研制过程中,对各类可靠性试验都规定了严格的试验条件和方法,对出现的所有故障使用故障报告分析和纠正措施系统(FRACAS)管理。对设计过程中设备技术状态的改变进行严格的区分、记录和管理。总结整个可靠性评估工作的过程,可分为以下几个工作步骤:
某型网络通信设备的可靠性评估大纲主要规定了试验样本、可靠性评估方法、采用的试验类型及试验数据、故障数据管理方法等。网络通信设备主要由电子元器件组成,是典型的电子设备,所以设备评估模型采用指数发布。为了更全面地了解设备可能达到的可靠性水平,规定同时采用经典法和贝叶斯法进行可靠性评估计算。评估结果采用区间估计值,即MTBF的单侧置信下限。试验样本为2台,采纳设计总体方案定型后的试验数据,即设备的总体结构、模块数、关重件都不再更改以后的试验数据。试验类型包括设备进行的可靠性研制试验、可靠性增长试验和环境试验的数据,同时规定所有的故障必须进行FRACAS的管理。本设备MTBF的指标要求为最低1 500 h。
参与可靠性评估的故障数据仅计算关联故障数据,非关联故障数据不计算。为此,制定的故障判据如下:
a)记入关联故障的故障类型
1)部件和元器件设计缺陷或工艺不良造成的故障;
2)电路板上多个元器件发生失效,如果相互之间没有因果关系,算作多次故障;
3)寿命件在有效寿命期间发生的故障;
4)故障现象相同的间歇故障,通过故障分析,故障原因相同的故障,算作一个故障。
b)记入非关联故障的故障类型
1)受试设备在试验箱内安装不当造成的故障;
2)试验设备或监测仪器不良引发的故障;
3)操作失误引发的故障;
4)由其它故障引发的故障。
同时规定,查明关联故障的故障原因之后,改进设备,后期试验经过验证,确认改进有效,不再出现故障,转为非关联故障处理。
对软件引发的故障,查明原因,改进软件,在虚拟软件测试环境和硬件条件下进行测试。对改进模块及相关模块都要进行测试,测试用例的覆盖范围必须包括条件组合覆盖和路径覆盖。所有的测试验证软件在改正有效的情况下,可以不计入关联故障。如果是不明原因的软件故障,则必须记入关联故障。
进行可靠性评估,由于各类试验的条件不一致,必须将各类试验的数据转化为设备实际工作环境下的等效试验数据,也就是必须确定各类试验环境转为实际工作环境的环境因子。某型网络通信设备的实际工作环境为一般室内固定环境,可能没有空调设备的情况。按照GJB/Z 299C[3]中有关环境的规定,属于一般地面固定情况。在各种试验中,可靠性研制试验、可靠性增长试验的试验条件是完全仿照实际的工作环境进行的,所以环境因子是1。环境试验所进行的各类试验必须确定环境因子,进行数据转换。确定环境因子的方法,常用的主要有参照可靠性预计标准GJB/Z 299C中的环境系数、GJB 367A[4]附录中环境因子典型值或通过相似设备各类试验数据的统计评估而获得。针对本项目,由于相似设备的试验比较少,不足以获得准确的环境因子评估值。设备的环境试验是按照GJB 367A的规定进行的,所以采取参考GJB/Z 299C和GJB 367A的方式来确定环境因子。GJB 367A附录中提供了各类试验条件下对常温试验条件下的环境因子,这个常温试验条件相当于GJB/Z 299C中的地面良好(GB)环境,和设备工作环境不一样,需要进一步转化。设备实际工作环境相当于GJB/Z 299C中的一般地面固定(GF1),参考299C标准中各类元器件GF1和GB两者之间的环境系数,一般GF1是GB的两倍。综合以上分析,各类环境试验条件下的环境因子,取GJB 367A附录中的典型值,再除以2,作为转化为设备实际工作环境下的环境因子。综合以上分析,各类试验的环境因子确定见表1:
表1 环境因子表
可靠性数据的收集范围包括研制过程中的可靠性研制试验、可靠性增长试验和环境试验的数据。某型网络通信设备在振动试验中出现一次Modem模块不能同步故障,该故障是由内部接线松动引起的,属于制造工艺问题,计入关联故障,因此该设备可靠性评估的关联故障数为1。进行评估计算的试验时间为累计台时,根据前面确定的各种试验的环境因子(πE),统计等效试验时间,如表2所示。
表2 试验时间统计表
根据表2计算,累积等效试验时间为4 840.7(h)。
根据式1,取T=4 840.7 h,r=1,经过计算,得到某型网络通信设备可靠性MTBF的评估结果,如表3所示。
表3 经典法可靠性评估结果报表
由于该设备要求MTBF≥1 500 h,经典法评估结果满足指标要求。
根据式(2),取 T=4 840.7 h,r=1,经过计算,得到某型网络通信设备可靠性MTBF的评估结果,如表4所示。
表4 贝叶斯法可靠性评估结果报表
由于该设备要求MTBF≥1 500 h,贝叶斯法评估结果满足指标要求。
由两种评估结果可见,经典法更为严格。
按照可靠性理论,该网络通信设备需要继续积累试验与现场使用数据,不断丰富可靠性评估数据基础,在产品研制生产的不同阶段进行动态的评估工作,使评估结果能更真实地反映出产品各阶段的可靠性实际水平。
按照GJB 450A《装备可靠性工作通用要求》,在型号研制过程中,在研制任务书或合同文件中都要明确产品可靠性定量要求和验证方法。然而,对于有很高可靠性指标要求的产品,由于实现技术、研制费用、成本以及研制周期等方面的限制,通常不可能完全通过专门的统计试验来验证其可靠性指标。因此,结合产品在研制过程中一系列可靠性试验数据对产品的可靠性进行综合评估,不失为一种经济、有效的可行方法。
上文所述可靠性评估方法在某型网络通信设备的研制工作中通过了专家评审,得到了客户的认可,对类似产品的研制具有一定的参考价值和借鉴意义。
[1]张苑民,辛云.现场统计可靠性评估方法的研究 [J].电子产品可靠性与环境试验,2005,23(5):14-17.
[2]张士峰,李荣,樊树江.Byes可靠性评估方法述评 [J].飞行器测控学报,2000,19(2):28-34.
[3]GJB/Z 299C-2006,电子设备可靠性预计手册 [S].
[4]GJB 367A-2001,军用通信设备通用规范 [S].