数字电视可靠性试验设计

2012-06-07 04:15陈鹏，刘博

电视技术 2012年20期

关键词：贝叶斯合格可靠性

陈鹏，刘博

（国家广播电视产品质量监督检验中心，北京 100015）

可靠性是指产品在规定的条件下，规定的时间内，完成其规定功能的能力。对数字电视来说，可靠性就是数字电视可以正常的收听、收看电视节目，要求“功能可靠”。

1 可靠性的主要特征量

1.1 平均故障前时间MTTF（Mean Time to Failure）[1]

平均故障前时间MTTF是指不可修复产品的一种基本可靠性参数。其度量方法为：在规定的条件下和规定的期间内，产品寿命单位总数与故障产品总数之比。

1.2 平均失效间隔时间MTBF（Mean Time Between Failure）[1]

平均失效间隔时间MTBF是指可修复产品的一种基本可靠性参数。其度量方法为：在规定的条件下和规定的期间内，产品寿命单位总数与在该时间间隔内故障产品总数之比。

1.3 失效率（Failure Rate）[1]

失效率λ(t)是可靠性工程应用广泛的特征量。解释为：在规定的条件下和规定的时间内，产品失效总数与寿命单位数之比。在产品寿命服从指数分布的情况下，产品失效率λ(t)与平均故障间隔时间MTBF成倒数关系，即

1.4 任务可靠性（Mission Reliability）[1]

任务可靠性是指产品在规定的任务剖面内，完成规定功能的能力。所谓任务剖面是指产品在完成规定任务这段时间内所经历的事件和环境时序描述，任务可靠性的定量参数之一，任务可靠度仅描述影响完成任务的那些事件。因此，任务可靠度分析必须包含完成任务基本功能的定义。例如：彩色电视接收机的任务和基本功能是接收图像和伴音，更进一步的要求可能是图像和伴音的清晰度、色度等。

1.5 基本可靠性（Basic Reliability）[1]

基本可靠性是指产品在规定的条件下，无故障的持续时间或概率。基本可靠性反映产品对维修人力的要求。确定基本可靠性的特征量时，应该统计产品的所有寿命单位和所有故障，而不局限于发生在任务期间的故障，也不局限于只危及任务成功的故障。

2 可靠性试验论证设计

2.1 样机研制（设计定型）阶段

按技术设计阶段拟定的技术文件进行样机的研制、试验、评价和改进。验证可靠性技术措施和关键工艺的适用性，使样机可靠性增长达到预定计划要求。

2.2 可靠性筛选试验

对重要的元器件、部件和设备单元进行必要的可靠性筛选试验。筛选项目、应力等级和合格标准视产品的特点和要求而定。

2.3 样机可靠性增长试验

在样机性能试验通过后，进行环境试验和可靠性增长试验。通过失效分析，及时暴露和排除系统性缺陷，使样机可靠性达到预定增长计划要求。

3 贝叶斯验证试验

采用贝叶斯统计分析，将以往的历史数据、工程经验以及对产品可靠性的认识水平等这些验前信息放到评价产品可靠性试验方案中去，称这种可靠性验证试验方法为贝叶斯验证试验。贝叶斯试验方法主要应用于彩色电视机（CRT），数字电视机检测方法已较少采用，所以本文只进行简单介绍，以作参考。

贝叶斯方法的核心是贝叶斯公式，考察一个随机试验，在这个试验中，几个互不相容的事件A1，A2，…，An中必有一个发生。假如记P（Ai）为事件Ai的概率，则有

又设为任一个事件，则根据事件概率定义和全概率公式，可以推得，在发生的条件下，事件Ai发生的概率为

式（3）表明，假如事先知道诸事件Ai发生的概率P（Ai），还能通过实验获得在诸Ai发生的条件下，事件Ai发生的概率，那就可求得在事件Ai发生的条件下，事件Ai发生的条件概率。

贝叶斯分析方法的基本特点有：1）贝叶斯统计分析强调使用验前信息；2）把感兴趣的未知参数，比如平均寿命θ看作一个随机变量；3）对所有未知的量最好用一个概率分布去描述，这个分布就是验前分布。

3.1 强调使用验前信息

贝叶斯统计方法作推断工作时，利用3种信息：1）总体信息：如产品寿命分布类型所含有的信息；2）样本信息：如试验样本中所含未知参数的信息；3）验前信息：在试验以前对未知参数了解到的信息。

验前信息可以是准确的数据，也可以是工程判断。在实际工作中，工程师们不断地在各方面使用其以往的经验——先验知识，并不断地通过实践做出正确与否的判断。如果不是那样的话，很多工作只能在原地踏步，不会有所前进。有经验的工程师们对其开发的新产品的可靠性是有所估计和考虑的。所以说，先验知识广泛存在，而贝叶斯方法只是对它主动地认识并加以利用罢了。

在很多场合都存有不同程度的先验信息，其实每个人都在用过去的经验（先验信息）进行推断和决策。免检产品就是根据产品的过去质量情况而定的。这种做法就是利用了过去的经验。

3.2 认为未知参数θ是一个随机变量

这一点是贝叶斯统计方法与经典统计方法之间一个主要的区别。经典方法认为未知参数θ是一个未知常数，是不变化的。但贝叶斯方法认为未知参数θ不仅是变化的，而且是随机变化的。以产品的废品率θ为例，每天的废品率都是在变化的，有时变好，有时变坏，每天都在随机波动。所以把“一天废品率θ”看作一个随机变量是妥当的，从当天产品中抽取一个样本是为了估计当天的废品率，这相当于估计随机变量θ的一个观察值。

3.3 用分布去描述未知参数

贝叶斯统计方法对所有未知的东西最好都用一个概率分布去描述，这个分布就是验前分布。

譬如某种电容器的失效率是未知的，但根据过去的试验数据，此种电容器的失效率是一个偏态分布，频率直方图表明很像一个伽马分布，因此就可用伽玛分布来描述其失效率。

3.4 贝叶斯验证试验的风险

采用贝叶斯验证试验[2]方案，如考核的可靠性指标为q，令：q0为合格质量水平（AQL）；q1为极限质量水平（LTPD）。

验证试验是采用定时截尾有替换寿命试验，即取n个产品进行寿命试验，到t时试验截止，总试验时间T=nt，其间共失效r次，则规定：r≤c时，判定产品合格，接收这批产品；r＞c时，判定产品不合格，拒收这批产品。这种抽样方案称（T，c）方案。

古典的生产方风险为：a=P(r＞c|Q0)即产品合格。

而求被拒收的概率，使用方风险为：β=P(r≤c|Q1)

即产品不合格，而求被接收的概率。

用贝叶斯方法制订可靠性验证试验方案时，将参数Q看成是一个随机变量，它的验前信息，集中体现在它的验前分布密度P（Q）中，常用的风险类型有验后风险、平均风险和接收概率等3种。

1）后验风险

后验生产风险，是指产品经验证试验没有通过的条件下，而质量是合格的概率，即

式中：Q0是参数q合格的取值范围。

后验使用方风险，是指产品已通过验证试验的条件下，而质量是不合格的概率，即

式中：Q0是参数q不合格的取值范围。

2）平均风险

平均风险的概念类似于经典风险，它是经典风险对于验前分布的平均。生产方平均风险为

3）接受概率

在经典抽样方案中，接受概率是参数Q取定时产品被接受的概率，所以它是q的函数，即

而在贝叶斯抽样方案中，接受概率是表示参数q的验前分布为P（Q）时，产品被接受的无条件概率，即为

彩色电视机的贝叶斯方案（BRDT），在制定彩色电视接收机的贝叶斯可靠性验证试验方案中，需要充分考虑到经过多年实践经验业已成熟的试验条件。为了实行科学管理，将产品的MTBF分成三级，分别记为P，Q和R。然后根据管理经验和历史数据确定MTBF的质量控制范围θ1和θ2取值。

令θ1为可接受的MTBF的下限。按标准对数字电视可靠性指标的要求，分别确定P，Q和R三级的θ2为15000 h，20000 h和30000 h，见表1和表2。

表1 彩色电视机MTBF方案

根据以往的经验和历史数据，取EΘ=3θ1；并分别取θL为0.75θ1、0.90θ1和0.95θ1。

表2 P级产品的BRDT方案

4 可靠性试验方案设计

从统计试验所采用的方法而言，可靠性统计试验可分为可靠性验证试验和可靠性测定试验，这两种试验在技术标准或合同中的作用不完全相同。

可靠性验证试验，是承制方和订购方在选定的风险水平下，通过试验来验证产品是否符合其规定的可靠性要求，所以，验证试验常常是订购方接收产品的条件之一。

可靠性测定试验，只是测定可靠性特征量，并就试验结果作出报告，在产品没有专门规定可靠性要求时，测定试验通常是用来提供分析数据的。在本章内容中暂不做考虑。

可靠性验证试验在产品标准或技术经济合同中又分为可靠性鉴定试验和可靠性验收试验。

4.1 鉴定/演示试验

鉴定试验和演示试验一般包括：抽样检验（包括定时截尾试验和定数截尾试验）和序贯试验。

4.2 可靠性验收试验（Reliability Acceptance Test）

可靠性验收试验即为验证批次生产产品是否达到规定的可靠性要求，在规定条件下所进行的试验。产品可靠性验收试验PRAT（Product Reliability Acceptance Test⁃ing）发生在设备或系统的生产阶段，用来监测原始设计中的可靠性降低。PRAT可以在整个生产阶段定期的或持续的进行，并且可以是针对所有设备的或是个别样本的。PRAT的使用可以为一些矫正和预防性措施提供必要的数据和反馈。

1）序贯试验计划

序贯试验[4]的优点具有最低的期望整体试验成本，一般来说该计划作出结论的期望故障数较其他试验计划少，可用最少的期望试验时间（平均起来）做出判断。

序贯试验的不利之处包括试验成本是随机的。与定时截尾试验相比，序贯试验故障数及由此引起的试验时间最大可能是截尾试验时间的3倍。

2）定时截尾试验

定时截尾试验[4]的优点是知道试验完成时间以及试验所需的最大样本数量。相对序贯试验来说，定时截尾的缺点为：包括达到某一固定值失效数是随机的，更多的失效数和等待时间。虽然所需最大时间较短，但平均时间较长。

3）定数截尾试验

这类试验的优点是，即使试验样机更改，也知道试验所需的样本的最大数量。这类试验必须要发生失效，并可对失效进行失效模式和失效机理分析。

4）试验总结

一般来说，PRAT做出判断所需的综合成本和时间较少。当试验对象的大多数相对需求较好或较坏时，这一特点尤其突出。

5）相关试验比较

（1）定时截尾寿命试验，就是实现规定一个试验的截止时间，当试验进行到规定的截止试验时，不论是否发生失效，或失效多少，都停止试验。这种试验的优点是已知试验时间，从而便于管理。

故障分析和分类：试验过程中应监测受试设备的功能性能参数，当被观察的任何一个参数永久地或间断地超出规定极限范围时，就应认为发生了故障。无论是可靠性鉴定试验或可靠性试验验收试验，对试验中所发生的故障应通过分析确定每一个故障的原因，分析工作的深度要能足以用有效的证据确切地将故障划分为关联或非关联故障。

对关键故障又可进一步分为责任和非责任故障。只有那些相关的独立的责任故障才用来确定是否符合规定的接收、拒收判据。

当使用截尾抽样方案时，如果在规定的试验时间内发生的责任故障数超过了接收数时，就可以做出拒收判决；如果在方案规定的时间内，没有发生比接收数更多的责任故障次数，则可以做出接收判决。

（2）定时截尾抽样试验的基本思想是观察试验到规定时间出现的失效数是否符合规定的要求，如果失效数超过了规定的次数则说明产品的寿命不长，认为产品不合格；如果到规定的时间失效次数少于或等于规定的失效数，说明产品的平均寿命较长，则认为产品合格。在这里可以看到，产品被判为合格与不合格之间只有一个失效数之差。这样似乎太绝对化了，于是提出一种修正的方法——序贯规则。

（3）序贯规则对发生的每个故障都规定两个时间，即合格的下线时间A与不合格的上限时间B，当总试验时间T超过或达到合格的下限时间A，认为产品合格；当总试验时间T小于或等于不合格上限时间B，认为产品不合格；当总试验时间T在A和B之间，认为不足以作判断，则继续进行试验。显然合格下限时间A与不合格上限时间B都是故障数r的函数。这种试验称为序贯试验。

5 综述

任何一项工程，任何一个系统或设备，其设计和开发阶段，就应当确立其可靠性要求。同时，应当制订一个为达到这个要求的可靠性保证规划。其工作重点应放在防止、发现和纠正可靠性设计中的缺陷、生产过程中的薄弱环节和可靠性管理中的漏洞上。标准是工程的语言，只有少数标准是满足不了各种复杂工程的需要的。由于可靠性工程涉及可靠性数学、可靠性物理、管理学以及各种专门技术这样广泛的理论和实践问题，因此，需要有一系列的标准，建立起一个完整的可靠性基础标准体系，才能适应各种不同复杂程度的产品[3-4]。

[1]苏德清.可靠性技术标准手册[M].北京：中国标准出版社，1994.

[2]安永成.彩色电视机检测技术[M].北京：电子工业出版社，1997.

[3]温熙森，陈循，张春华，等.可靠性强化试验理论与应用[M].北京：科学出版社，2007.

[4]SJ/T 11325，数字电视可靠性试验方法[S].2006.