田 英,佘 阳
(1.佛山科学技术学院 机械与电气工程学院,广东 佛山 528000;2.广东南车轨道交通车辆有限公司,广东 江门 529000)
部分状态信息下的截尾数据分析
田 英1,佘 阳2
(1.佛山科学技术学院 机械与电气工程学院,广东 佛山 528000;2.广东南车轨道交通车辆有限公司,广东 江门 529000)
针对暗含部分状态信息的类截尾数据在可靠性建模中的分析与处理问题,提出等失效数据法。该方法通过给类截尾数据增加一个代表的剩余寿命,使其转换为等失效数据,代表的剩余寿命值可能是一个固定值或是与平均剩余寿命成一定比例的值,对这两种情况分别引入中间变量表示暗含信息,由极大似然法得出最优中间变量和分布参数,通过实例分析验证了该方法的有效性。
类截尾数据;部分状态信息;代表的剩余寿命;预防维修;中间变量
截尾数据在可靠性领域中普遍存在,其主要特征是不完整性。右截尾数据是典型的不完整数据,指在数据收集的时间窗口内,只知道失效时间大于当前观察到的运行时间的数据[1],由于这种观察是随机的,因此这种数据除了知道系统的工作状态外无任何其他状态信息。然而,有些截尾数据却隐含某些状态信息,例如,预防维修活动中,元件被检测到即将失效而进行预防替换时产生的截尾数据,它不是随机右截尾数据,且不能表示元件的寿命,但却隐含元件不久将失效的重要信息。为了把这类数据与随机右截尾数据区分开,笔者称其为类右截尾数据。
令t+表示截尾数据,如果t+为随机右截尾数据时,将其试验到失效,元件寿命可表示为t′=t++m(t+),其中m(t+)为平均剩余寿命(mean residual life,MRL);如果t+为类右截尾数据时,由于元件即将失效,则其实际失效时间可能远小于t′。因此,在可靠性分析与建模中,不能忽略这些重要的状态信息而仅简单地把这类数据等同于随机截尾数据或失效数据。为有效合理地应用包含部分状态信息的截尾数据,笔者提出等失效数据法对类截尾数据进行分析,并通过实例分析来验证该方法的合理性与有效性。
1.1 基本思想
等失效数据法的基本思想是在类截尾数据上增加一个代表的剩余寿命(representative residual life,RRL),把类截尾数据转换为等失效数据,确定RRL值包含两种情况:①是一个固定值;②是与MRL成一定比例的值。对这两种情况分别引入一个中间变量来表示隐含的部分状态信息,应用极大似然法和Excel的“规划求解”工具可快速而精确地求得中间变量和分布参数。
(1)
式中,δj表示RRL,若δj被指定,则可根据极大似然估计法来求得各模型参数。
(2)
式中: f(t)为概率分布函数;θ为其参数集。根据δj的大小,可分为两种特殊情况:
(1) δj=0,即截尾数据被视为失效数据,这时将低估产品寿命。
显然,δj值应居于两种特殊情况之间,即:
(3)
1.2 等失效数据法1
假设维修工程师对某元件代表的剩余寿命有一个粗略参考值,元件运行到某个时间后,如果估计的剩余寿命小于该参考值,则对元件执行预防替换;否则,元件继续运行。设δ为一个比参考值稍小的固定值,则类截尾数据可由式(4)转换为等失效数据:
(4)
1.3 等失效数据法2
(5)
2.1 数据背景
笔者所用数据引自文献[4],如表1所示,表示在3种不同气压z下压力表的寿命时间t,包括元件失效替换时间和预防替换时间(带“+”号值),从表1可以看出,气压越高元件寿命越短。
表1 相应气压下压力表的寿命
在进行可靠性分析建模时,文献[4-5]均假定预防替换恰好是在元件即将要失效时进行的,因此都是把预防替换的截尾数据当成失效数据处理,显然这将低估元件的寿命,笔者将使用等失效数据法重新分析这些数据。
2.2 分布模型
表1的数据中包含协变量z,令zi=2+i(i=1,2,3)表示3种气压,Ti为气压zi下的元件寿命。为了方便分析,假定T1,k1T2,k2T3为独立同分布的随机变量,其中k1,k2为待估“加速因子”,满足1 (1)Ti均服从同一类分布。 (2)Ti各分布函数中形状参数一致,尺度参数不一致。 (3)对于等失效数据法1,令δ=δ(z1),有: δ(zi)=δ(z1)/ki-1,1≤i≤3,k0=1 (6) 为了确定元件合理的寿命分布,视类截尾数据为失效数据,则压力表失效数据的对数似然函数可表示为: (7) 在元件可靠性分析中,威布尔分布、伽马分布、正态分布和对数正态分布应用十分广泛,故选择它们作为备选的寿命分布模型[6]。根据各分布函数的特性可知,威布尔分布和伽马分布的形状参数β独立于z,但是尺度参数η的大小与z有关;正态分布中ρ=μ/σ独立于z,但μ的大小与z有关;对数正态分布的σl独立于z,但μl的大小与z有关。因此,对于4类分布模型,式(7)包含了4个独立参数。 通过Excel的“规划求解”工具使ln(L)值最大,可得到各分布模型的参数值,如表2所示,根据似然函数值ln(L)的大小,可知对数正态分布模型是最佳的拟合模型。 表2 各模型的分布参数 2.3 对数正态分布的特性 设随机变量t服从对数正态分布,其对数均值为μl,对数标准差为σl,则对数正态分布的累积分布函数可表示为: F(t)=Φ[ln(t);μl,σl] (8) 令: (9) 由式(9)可以看出,1/σl类似于威布尔分布的形状参数β,eμl类似于威布尔分布的尺度参数η。因此,假定1/σl和μl分别为对数正态分布的形状参数和尺度参数。则对数正态分布的均值和标准偏差分别可表示为[7]: (10) 其平均剩余寿命为: (11) 式中:Φ(w;σl,1)为平均值为σl,标准差为1的正态分布函数;R(t)为可靠性函数。 由于气压zi下的平均寿命μi(1≤i≤3)与“加速因子”的关系为μ1/μ2=k1,μ1/μ3=k2,则对数正态分布暗含如下关系: μl,2=μl-ln(k1),μl,3=μl-ln(k2) (12) 2.4 两种特殊情况的分析 δj包含两种特殊情况,即把类截尾数据当成失效数据或当成随机截尾数据。两种情况均可用极大似然法估计参数。情况(1)可根据式(7)直接由密度函数得到似然函数,而情况(2)中截尾数据的似然函数则是可靠性函数,即: (13) 两种情况下的参数特性值如表3所示,其中μi(1≤i≤3)为气压zi下压力表的平均寿命,两种结果对比可知两者形状参数一致,只是平均寿命不同,但相差不大,这说明该实例样本的截尾度不大。 表3 关于函数z的参数特性值 2.5 等失效数据法分析 根据两种等失效数据法可求得参数特性值如表4所示。其中pi(1≤i≤3)为气压zi下RRL与MRL的比值,δ1为气压z1下的RRL。方法1中δ1是中间变量,方法2中p=pi是中间变量。 表4 等失效数据法的参数特性值 由表4结果可得出如下结论: (1)两种方法均满足pi∈(0,1),表明存在最优中间变量,且其提供了关于RRL的信息。 (2)由对数似然值ln(L)的大小可知等失效数据方法2优于方法1。 (3)两种方法的结果相吻合。 2.6 两种参数估计法的对比分析 当截尾数据被视为随机截尾数据时,可用两种方法进行参数估计,第一种是当p=1时,求式(2)的极大对数似然函数,即EM算法,第二种是极大似然法(maximum likelihood method,ML算法),此时截尾数据子集的似然函数是可靠性函数,见式(13)。表5为两种方法所得参数,结果表明,形状参数完全不同,且ML算法所得寿命估值大于EM算法,这可能是对数正态分布有重右尾性质的缘故。 表5 两种估计方法的参数特性值 图1为3种情况下的密度函数曲线,曲线1为类截尾数据被视为失效数据;曲线2为类截尾数据被当成随机截尾数据,且参数估计是用极大似然法;曲线3为根据等失效数据法2,当p=0.446 5时所得。 图1 3种情形下的密度函数曲线 由图1可知,等失效数据法所得概率密度函数曲线居于两种特殊情况之间。 笔者定义了类截尾数据,引入了代表的剩余寿命RRL来处理可靠性建模中的类截尾数据,并提出了两种确定RRL的等失效数据法,一种是以一个固定值作为RRL,另一种是以与平均剩余寿命MRL成一定比例的值作为RRL。笔者通过实例分析了这两种方法,并由对数似然值可知方法2优于方法1,两种方法均引入一个中间变量表示数据隐含的状态信息,实例证实了存在最优中间变量,且通过分析发现:①由预防维修产生的截尾数据被视为失效数据或随机截尾数据时,将低估或高估产品寿命。②由EM算法所得的参数估计结果可能与ML算法所得结果不同。 [1] 蒋仁言.威布尔模型族:特性、参数估计和应用[M].北京:科学出版社,1998: 8-20. [2] DEMPSTER A P, LAIRD N M, RUBIN D B. Maximum likelihood from incomplete data via the EM algorithm [J]. J R Stat Soc, 1977,39(B1):1-37. [3] JIANG R, JARDINE A K S. Composite scale modeling in the presence of censored data[J]. Reliability Engineering and System Safety,2006(91):756-764. [4] LOVE C E, GUO R. Using proportional hazard modeling in plant maintenance [J]. Quality & Reliability Engineering International, 1991(7):7-17. [5] JIANG R, JARDINE A K S. Health state evaluation of an item: a general framework and graphical representation[J]. Reliability Engineering and System Safety, 2008(93):89-99. [6] JIANG R. A trade off BXlife and its applications[J]. Reliability Engineering and System Safety, 2013(113):1-6. [7] WANG W B. An overview of the recent advances in delay-time-based maintenance modeling [J]. Reliability Engineering & System Safety,2012(106):165-178. TIAN Ying:Experimentalist; School of Mechanical & Electrical Engineering, Foshan University, Foshan 528000, China. [编辑:王志全] Analysis of Censored Data with Partial Condition Information TIANYing,SHEYang An equivalent failure data approach was presented to analyze the quasi-censored data which implicitly contain the condition information in reliability modeling. The approach transformed a censored observation into an equivalent failure observation by adding a representative residual life to the censored observation. The representative residual life can be a fixed quantity or proportional to the mean residual life. In each case, an intermediate variable which represents the condition information was introduced. The intermediate variable and distribution parameters were simultaneously estimated using the maximum likelihood method. The effectiveness of the approach was illustrated by a real-world example. Quasi-censored data; partial condition information; representative residual life; preventive maintenance; intermediate variable 2015-03-10. 田英(1986-),女,湖南娄底人,佛山科学技术学院机械与电气工程学院实验师. 2095-3852(2015)05-0598-04 A O211.9;TB114.3 10.3963/j.issn.2095-3852.2015.05.0163 结论