张 点, 邢云燕, 蒋 平
(国防科技大学系统工程学院, 湖南 长沙 410073)
可靠性是指产品在规定条件下和规定时间内完成规定功能的能力,是衡量产品质量好坏的重要指标。随着科学技术的迅速发展,产品的功能变得越来越复杂,构成的元件越来越多,当前产品也面临着多变且急剧变化的环境,在这种情况下,人们对产品可靠性的要求也越来越高。因此,需要在研制阶段就要设计出高可靠性的产品。可靠性鉴定试验是在产品研制阶段验证产品的可靠性是否达到可靠性要求的试验,试验的结果也可以为产品的状态鉴定提供依据。
现有的产品可靠性鉴定试验主要依据是GJB899A-2009《可靠性鉴定和验收试验》。但是,该标准是针对指数分布产品来设计可靠性鉴定试验方案的,且其中的定时截尾试验方案存在试验样本量较大和试验时间较长的问题,而标准中提供的短时定时截尾试验方案的生产方风险和使用方风险又较大。其中,生产方风险是指产品可靠性实际上是合格的,但通过抽样试验后该批产品被拒收的概率;使用方风险是指产品可靠性实际上是不合格的,但通过抽样试验后该批产品被接受的概率。在工程实践中,由于高成本和研发周期的压力,往往难以提供足够的样本量和足够的试验时间来开展鉴定试验,且不论生产方风险过大还是使用方风险过大都是难以接受的。为解决上述困难,一些学者提出利用产品研制阶段的试验数据来推导产品的鉴定试验方案。例如,从研制阶段获得产品的可靠性增长数据、相似产品的可靠性数据、专家经验等产品先验信息,通过Bayes方法将其应用于可靠性鉴定试验的设计中[1-6]。文献[7]提出在产品设计发生变化时应用Bayes方法来设计可靠性鉴定试验,通过利用产品在设计变更之前的早期版本试验中收集的数据,避免了对重新设计的产品进行重复试验,并有助于减少试验所需的样本量。但该方法仅考虑成败型产品的试验数据,未考虑试验的两类风险。文献[8]基于产品的多阶段研制过程,首先考虑用第二类极大似然估计方法将产品不同阶段的试验数据结合起来,再基于Bayes方法,从生产方风险和使用方风险相均衡的角度,设计了产品样本量最小的可靠性鉴定试验方案。
由于成败型产品较为常见,故而在利用研制阶段设计成败型产品的可靠性鉴定试验方面较多。文献[9]利用AMSAA模型对成败型产品研制过程的可靠性增长进行建模,基于最大使用方风险的条件,结合Bayes方法,确定了成败型产品的可靠性鉴定试验方案,并结合实例验证了该方法的合理性与可行性。文献[10]基于产品研制阶段的多源信息,通过数据转化的方法,将产品不同阶段试验数据结合起来,进而设计了成败型产品的可靠性鉴定试验方案,与传统试验方案相比,该文所设计试验方案能较好地降低试验所需样本量。文献[11]将产品的可靠性增长数据用于成败型产品的可靠性评估中,首先利用最大熵原则处理产品的先验信息,而后利用矩等效方法确定产品寿命的先验分布,再基于Bayes方法对产品可靠性进行了评定。
国内外学者还对较常见的指数分布产品的可靠性鉴定试验设计进行了研究。文献[12]针对指数型产品,通过利用Duane模型对产品研制阶段的失效率变化过程进行建模,给出了产品可靠性增长过程中的不同试验信息的似然函数,进而给出了变总体产品的可靠性鉴定方案,但采取的Duane模型精度不高,导致对产品可靠性的估计存在偏差。文献[13]基于产品的研制阶段信息,利用多层Bayes方法对指数型产品的可靠性验收试验方案进行了研究。考虑到产品由于研制过程会对产品暴露的缺陷进行改进,也就是各阶段所获取的可靠性试验信息来自于一个动态变化的母体,故而有学者研究了变总体条件下,基于Bayes方法,结合产品研制阶段的多源信息来进行产品可靠性的鉴定[14-15]。
在近两年的可靠性鉴定试验研究中,众多学者主要是从如何降低试验风险、控制试验成本,以及利用产品研制阶段信息的角度设计可靠性鉴定试验[16-18]。例如,文献[19]和文献[20]通过控制生产方风险和使用方风险,综合考量试验时间与试验样本量来设计产品的可靠性鉴定试验。文献[21]依据给定的可靠性鉴定试验的生产方和使用方风险,利用子系统试验数据来设计系统的可靠性鉴定试验。文献[22]总结了传统二项分布可靠性鉴定试验的缺点,提出了一种利用Bayes方法来融合专家的判断和历史数据,以减少鉴定试验的样本量的可靠性鉴定试验设计方法,该方法可用于考虑多个时间间隔或多种失效模式的多状态可靠性鉴定试验设计。
综上所述,当前学者从模型构建和参数确定的角度出发,对如何利用产品研制阶段的试验数据来评估产品的可靠性进行了较多研究。在产品可靠性鉴定试验设计上,当前主要是研究了成败型产品的可靠性鉴定试验方案设计,但对于指数分布及其他分布产品的可靠性鉴定试验设计的研究不够充分。当前研究也表明,研制阶段的试验数据的充分利用有助于可靠性鉴定试验的设计。故当前需要进一步研究如何利用产品研制阶段的可靠性试验信息,进行产品可靠性鉴定试验设计。此外,当前产品的可靠性鉴定试验是依据鉴定试验中的失效数据来判别是否接受产品的,通常需要较多的失效数据才能做出判决。但实际工程实践中,由于工艺水平的提升,产品可靠性一般较高,这使得如果按照失效数是否达到要求来判断产品是否通过可靠性鉴定试验,往往会导致试验时间过长、成本较高的问题。
本文从工程实际出发,针对较常见的指数分布型产品,研究了如何利用研制阶段的可靠性增长数据来推导可靠性鉴定试验方案。首先,针对研制阶段采取及时修正策略的指数分布型产品,基于AMSAA模型对其可靠性增长过程进行建模,并估计产品的失效率;然后基于Bayes方法,获取产品失效率的先验分布和后验分布,进一步依据生产方风险和使用方风险确定产品当前阶段的可靠性鉴定试验方案;最后结合实际案例从理论上说明了方案的可行性和合理性。
产品的研制过程通常是分阶段的,在每一阶段结束时对产品进行可靠性试验,在每一阶段试验结束后,在下一阶段对试验过程中产品出现的问题进行改进,然后再进行试验,根据试验结果来判定可靠性是否符合要求。如果不符合要求则要进行下一阶段的改进和试验,直至达到要求为止。在这一过程中,由于每一阶段的试验会对暴露的缺陷进行修正,使得下一阶段产品可靠性高于前一阶段产品可靠性,故而可认为产品研制过程也是可靠性增长过程[23]。基于此认识,本文的研究对象假定如下。
(1) 产品寿命服从参数为λ的指数分布,其概率密度函数为
f(x)=λe-λx,λ,x>0
(1)
(2) 产品在研制阶段采取及时修正策略,即在每一阶段试验中一出现故障便对产品进行修理与改进,而后继续进行试验。
(3) 假设在研制阶段,产品已经进行了m个阶段试验,每个阶段试验相互独立,本文意在求经过m个研发阶段和对应的试验后,产品的可靠性鉴定试验方案。
对于可靠性增长过程的描述,当前已有许多经典的可靠性增长模型,如Duane模型、AMSAA模型、Compertz模型等[24-26]。AMSAA模型是美国学者Crow提出的,亦称为Crow模型,是基于Duane模型建立的。Duane模型是一个应用广泛的可靠性增长模型,其优点在于模型简单直观,但不够精确,无法对实际增长过程进行分析与评估。AMSAA模型则克服了Duane模型的缺点,能较精准地对实际增长过程进行分析与评估,从而更好利用产品可靠性增长过程中的可靠性信息。Compertz模型是从时间序列分析中引进而来的,该模型比较适用于描述起初可靠性增长速度较慢,随后加快,到达某一顶点后增长速度开始减慢的情况。综合考虑3种模型,相对于Duane模型,AMSAA模型对可靠性增长过程的分析更加准确,且Compertz模型是离散型模型,对于指数分布产品,连续型的ASMAA模型更加适合,再加上目前ASMAA模型已被军用标准[27-28]采用,故而本文选择AMSAA模型进行可靠性增长过程建模。
AMSAA模型认为产品的累计故障数N(t)在t时间内服从均值为E(N(t))=atb的非齐次泊松分布,强度为λ(t)=abtb-1,其中a为尺度参数,b为形状参数,a、b均是待估参数。
(2)
对于定时截尾试验,假设试验截尾时间为T,累计故障数为n,则参数a、b的点估计值为
(3)
在得到参数a、b的点估计值后,可以计算出产品的第m次及第m-1次故障发生的时间分别为
(4)
可得产品在及时修正策略下,经m次可靠性增长试验后产品失效率的估计值为
(5)
为控制试验成本,充分利用产品研制阶段试验数据,本文基于Bayes方法,综合考虑生产方风险和使用方风险来进行产品可靠性鉴定试验设计。由于指数分布产品较常见且具有代表性,目前已有研究表明其他寿命分布产品的可靠性研究可以将其转化为指数分布研究,故本文以指数分布产品为研究对象,进行产品的可靠性鉴定试验设计。可靠性鉴定试验设计方法的基本思路如下:首先根据产品研制阶段的试验数据,基于AMSAA模型对产品的可靠性增长过程建模,并获得产品在研制阶段后期的失效率估计值,将获得的失效率估计值作为待鉴定产品寿命分布的先验信息,再基于Bayes方法,确定该产品失效率的先验分布及后验分布,最后依照产品可靠性的研制要求,根据生产方和使用方风险来确定产品的可靠性试验鉴定方案,如图1所示。
图1 可靠性鉴定试验方案设计步骤
由于共轭先验具有先验分布与后验分布具有相同一阶、二阶矩的性质,在实际应用中便于计算后验分布[29]。因此,对于失效率为λ的指数分布产品,选取伽马分布Ga(θ,μ)作为失效率的共轭先验分布,即失效率的先验分布为
(6)
式中:θ是形状参数;μ是尺度参数。本文采取矩估计进行模型的参数估计[30],即
(7)
为了获得先验分布中形状参数和尺度参数的值,假设产品在研制阶段进行了m次试验,可以通过可靠性增长模型来对产品第m次试验结束后的失效率进行估计,而后再利用矩估计的方法获得产品先验分布的参数的值。根据第2节,利用可靠性增长模型获得第m次试验后的失效率估计值为
(8)
为在尽可能满足给定验前信息约束的条件下,使信息的不确定性达到最大,采取最大熵法求其先验分布。依据最大熵原理[24],第m次试验后,产品失效率λm的验前分布π(λm)可表示为
(9)
式中:u为待定系数,是一常量。由式(8)和式(9)可得
(10)
由式(10)可以解得常量u的值,进而可以确定m次试验后产品失效率的验前分布π(λm)。而产品失效率验前分布的二阶矩为
(11)
由于选取Ga(θ,μ)作为失效率λm的分布来拟合先验分布π(λm),需要分布Ga(θ,μ)与π(λm)具有相同的一阶矩与二阶矩。则由式(7)~式(11)可得
(12)
即
(13)
假设产品第m次试验出现故障的时间为tm,则失效率的似然函数为
L(tm)=λme-λmtm
(14)
(15)
当前的可靠性鉴定试验大多采取定时截尾,故而本文的试验方案也采取定时截尾试验方式。在获得产品先验分布的基础上,通过对产品可靠性鉴定试验的两类风险的控制来确定产品的可靠性鉴定试验方案(T,C),其中T为试验截尾时间,C为允许故障数。在及时修正策略下,假设产品通过可靠性鉴定试验的判断条件为截尾时间内不发生故障,即选取定时截尾试验鉴定方案为(T,C)=(T,0)。
对于指数型产品,可靠性鉴定试验也即假设检验H0:λ<λ0,H1:λ>λ1。其中,λ0为研制要求的失效率,即失效率的检验下限,λ1为失效率的检验上限,且满足λ1>λ0。定义鉴别比为d=λ1/λ0。
在Bayes方案中,生产方风险为产品失效率λ已达到研制要求λ0但被拒收的概率,其表达式如下:
(16)
使用方风险为产品失效率λ高于失效率的检验上限λ1但被接收的概率,表达式如下:
(17)
式中:试验方案为(T,C),T为试验的截尾时间,C为故障数;tr为预计故障发生的时间,π(λ)为产品的寿命分布;P(tr>T)表示预计故障时间要大于试验截尾时间,即产品在截尾时间内产品没有发生故障,通过了鉴定试验的概率。根据第3.2节中获得的产品失效率的后验分布,当给定了生产方风险α0和使用方风险β0时,可以得到:
(18)
由于产品服从指数分布,所以
P(tr>T)=1-F(T)=e-λT
(19)
根据式(19),当给定产品失效率的研制要求λ0时,可以计算出在给定的生产方风险α0和使用方风险β0条件下,产品通过鉴定试验所需要的试验截尾时间T。
进行产品可靠性鉴定试验的目的是判断产品的可靠性是否达到研制要求,那么对于研制阶段的产品,通常是希望产品的使用方风险尽可能小,这样能充分保证投入使用后产品的可靠性要求。但对于生产方来说,使用方风险越小,意味着试验时间越长,试验的成本越大,生产方风险也会增大。因此,综合考虑生产方和使用方的利益,本文选取在满足两类风险约束条件下,当两类风险相等时的试验截尾时间作为T。
具体方案确定的算法步骤如下。
步骤 1生产方和使用方依据研制要求,协商确定生产方风险α0和使用方风险β0,确定失效率的研制要求λ0以及试验鉴别比d。
步骤 2依据第3.3节,计算出满足α≤α0,β≤β0条件下,试验截尾时间T,并记录下来作为备选的试验方案。
步骤 3依据研制要求,从备选方案中选取合适的T作为定时截尾试验的截尾时间,进而确定最终的可靠性鉴定试验方案(T,0)。
为验证本文确定的产品可靠性鉴定思路的可行性,利用某型电子产品研制阶段的可靠性增长试验数据[15]来进行案例分析。该产品研制阶段采取分阶段开展试验,试验过程中采取的是及时修正策略,每次试验只投入一个样本,所采集的试验数据如表1所示。
表1 某型电子产品研制阶段故障数据
假设根据研制任务书要求,产品的失效率不得高于λ0=0.01,生产方风险最大可接受值为α=0.3,使用方风险最大可接受值为β=0.3。
(4) 根据第3.4节中可靠性鉴定试验确定算法,可以得到当产品可靠性的研制要求为失效率不高于λ*=0.01,试验鉴别比d=2时,生产方风险和使用方风险随时间的变化如图2 所示。选取生产方和使用方风险相等时的截尾时间T作为可靠性鉴定试验的截尾时间,则确定可靠性鉴定试验截尾时间T=55,即试验方案为(T,C)=(55,0)。若在试验截尾时间内产品没有发生故障,则认为产品的可靠性满足研制要求,产品通过了可靠性鉴定试验;反之则说明产品可靠性还未满足研制要求,需要继续改进。
图2 两类风险随试验时间变化
另外,由于试验时间的解析解难以直接解得,所以本文采取的是让T从1取值,反过来计算对应的生产方风险和使用方风险,并让T的值每次增加1,以获得试验风险随时间的变化,其中试验时间T取值为整数。
以上述产品的试验数据为例,将GJB-899A中提供的可靠性鉴定试验的定时截尾试验方案(定时截尾试验的方案20)与本文所得可靠性鉴定试验方案进行对比,如表2所示。
表2 可靠性鉴定试验方案对比
通过与GJB899A中的方案对比可以看到,当研制要求相同时,结合产品研制阶段的可靠性增长信息所获得的方案用时更短,使用方风险和生产方风险也更低。这是由于本文设计的试验方案利用了产品可靠性增长信息,获得更准确的先验分布,从而使得该试验方案达到了节约试验时间,降低风险的效果。
在经过第4.1节和第4.2节的数据分析后,可以得出本文进行可靠性鉴定试验设计的方法是可行的,且所得到的试验方案在试验时间以及试验风险上优于GJB-899A中给出的定时截尾的可靠性鉴定试验方案。基于表1的试验数据,依据本文的可靠性鉴定试验设计方法,可以得到产品经过15次可靠性增长试验后,选取不同的试验风险时产品的可靠性鉴定试验方案如表3所示。
表3 不同风险要求下的可靠性鉴定试验方案
依照表1的实验数据,对影响产品可靠性鉴定试验方案确定的参数进行分析。首先,依据图2可以得知,两类风险与试验时间之间的关系是:产品的生产方风险越大,所得可靠性鉴定试验方案的截尾时间T越大;产品的使用方风险越小,所得可靠性鉴定试验方案的截尾时间T越大,这与客观事实是相符的。
当鉴别比d一定时,在相同生产方风险和使用方风险要求下,发现研制要求的失效率越小,可靠性鉴定试验方案的试验截尾时间越长,如表4所示。这与产品失效率越低,预计故障发生的时间越长这一事实相符。
表4 不同失效率要求下的试验截尾时间
当产品的失效率大小给定时,试验的鉴别比越大,使用方风险越小,如表5所示。鉴别比代表着失效率上限和下限的比值,鉴别比越大,失效率的上限越大,依据使用方风险定义,可以得到使用方风险越小。这也提示在试验方案选择时,要注意鉴别比的选择对试验风险的影响。
表5 不同鉴别比时的使用方风险
本文针对寿命指数分布的产品,研究了如何利用产品研制阶段的可靠性增长数据来设计产品的可靠性鉴定试验。现行标准GJB-899A由于其在试验方案制定时只依赖于产品自身的试验数据,忽略了产品研制阶段的试验数据,导致所得标准试验方案往往试验时间较长,而短时方案又存在风险过大的问题。本文提出的基于可靠性增长的可靠性鉴定试验设计方法可以较好地弥补标准试验方案的不足。依照本文提出的可靠性鉴定试验设计方法所得到的可靠性鉴定试验方案与GJB-899A中的标准定时截尾试验方案相比,具有两类风险更低、试验时间更短的优点。此外,本文所得的可靠性鉴定试验方案确定方法更具灵活性,可以获得在不同风险要求下的产品可靠性鉴定试验方案,这样便于在工程实践中,依据实际情况选取合适的可靠性鉴定试验方案。