魏莎莎,李真
(1.中国电科芯片技术研究院,重庆 400060; 2.中国电子科技集团公司第二十四研究所,重庆 400060)
可靠性是产品、结构、通信网络、军事装备和许多其他项目的关键质量特征之一[1]。电信网络故障和可能影响数百万用户的电力中断就是此类复杂系统的例子,其故障会对具有不同需求的许多用户产生直接影响。新材料、传感器的引入,以及新产品功能的复杂性,以及用户对更“可靠”产品的更高期望,促使工程师在产品(或服务)发布之前进行广泛的试验[2]。事实上,试验占产品总成本的很大一部分,特别是军事装备,电子元器件的可靠性是确保组件、系统可靠性的前提,要求比工业级产品更为严苛,因此,电子元器件可靠性试验方法的研究至关重要[3]。
准确的可靠性度量是使用正常工作条件下的试验数据获得的。然而,在正常工作条件下需要很长的时间,特别是对于预期寿命较长的器件和产品。它还需要大量的试验单元,因此在正常条件下进行可靠性试验通常是昂贵和不切实际的。此外,该结果仅适用于与试验条件相似的运行环境,可能不适用于在明显不同条件下运行的机组的可靠性预测。因此,更多人寻求使用数据和试验条件来“预测”可靠性指标的替代方法,而不是使用正常的操作条件,这些方法称为加速试验方法,主要目的是在较短的时间内诱发器件、组件和系统的故障或退化,并利用加速条件下的故障数据和退化观察来估计正常运行条件下的可靠性[4]。
在产品生命周期的第一阶段(设计阶段)对系统、器件和组件进行仔细的可靠性试验,对于在后续阶段实现期望的可靠性至关重要。在这个早期阶段,通过试验、分析、修复和试验(Test、Analyze、Fix、Test,TAFT)过程来消除复杂系统中间原型固有的设计缺陷,这个过程通常被称为“可靠性增长”。具体地说,可靠性增长是由于故障模式的发现、分析和有效的纠正而对开发项目的真实但未知的初始可靠性的改进[5]。纠正措施通常采用对系统的硬件、软件或人为错误方面发现的问题进行修复、调整或修改的形式。同样,现场试验结果用于改进产品设计,从而提高产品的可靠性。
综上所述,研究可靠性试验方法对提高电子元器件的可靠性具有重要意义,在实际的工程上有各种各样的可靠性试验方法和目标。第二节对常用的可靠性试验方法进行了介绍,包括高加速寿命试验(Highly Accelerated Life Testing,HALT)[6]、可靠性增长实验(Reliability Growth Testing,RGT)[7]、高加速应力筛选(Highly Accelerated Stress Screening,HASS)[8]、可靠性验证试验(Reliability Demonstration Testing,RDT)[10]、可靠性验收试验[9]、加速寿命试验(Accelerated Life Testing,ALT)[11]和加速老化试验(Accelerated Degradation Testing,ADT)[12]。最后对全文进行了展望和总结。
HALT的目标是确定器件、组件和系统的操作限制。这些是不同失效机制发生的极限,而不是在正常操作条件下发生的失效机制。此外,也应用极端应力条件来确定被测单元的所有潜在失效(和失效模式)。HALT主要用于产品的设计阶段,在典型的HALT试验中,产品(或组件)受到温度和振动(单独和组合)以及快速热转变(循环)和与产品实际使用相关的其他特定应力的影响。例如,在电子学中,HALT用于定位电路板故障的原因。这些试验通常包括在温度、振动和湿度下试验产品,但湿度对产品失效机理的影响需要较长的时间。因此,HALT只在两个主要应力下进行:温度和振动。
RGT的目标是在设计阶段持续改进。该试验在正常运行条件下进行,对试验结果进行分析,以验证是否达到特定的可靠性目标。一般来说,产品的第一个原型可能包含设计缺陷,其中大部分可以通过严格的试验程序发现。最初的设计也不太可能满足目标可靠性指标。然而,初始设计将经历迭代变更(设计变更),这将导致产品可靠性的改进,这是相当常见的。一旦设计投入生产,产品就会在现场进行试验和监控,以发现潜在的设计变更,从而进一步提高其可靠性。
HASS的主要目的是对正常生产产品进行筛选试验,以验证实际生产产品在试验过程中所使用的环境变量的循环作用下继续正常运行。它还用于检测生产过程中“质量”的转移(和变化)。它使用的应力与HALT试验中使用的应力相同,只是应力降低了,因为HASS主要用于检测工艺转移,而不是设计边际问题。
进行RDT是为了证明产品是否满足一个或多个可靠性度量。这些措施包括在规定的周期或试验持续时间之前未失败的总体的分位数。它还可能包括试验后的故障率不应超过预定值。通常,RDT是在产品的正常运行条件下进行的。进行RDT有几种方法,例如“成功运行”试验。该试验涉及使用具有预定尺寸的样品,如果在试验结束时不超过特定数量的故障发生,则该产品被认为是可接受的。否则,根据试验不合格的次数,重新抽取样品,重新进行试验,或认为产品不合格。
可靠性验收试验的目标与RDT类似,在RDT中,产品服从于一个精心设计的试验计划,并相应地做出关于产品验收的决定。图1给出了某大型汽车公司可靠性试验计划的实例。在图1中,试验产品在480 min的周期内承受所示的温度分布。当这些装置在200次循环中没有故障时,就被认为是可以接受的。被认可的车辆的平均寿命预计相当于10万英里的行驶里程(基于工程师的经验)。这种验收试验是基于经验的。然而,基于一定的准则和约束条件,可以为验收试验设计最优试验计划。
图1 验收试验的温度曲线
在许多情况下,ALT可能是评估产品是否满足预期的长期可靠性要求的唯一可行方法。ALT试验可以使用三种不同的方法进行。第一种方法是在正常操作条件下加速设备的“使用”,例如在典型的一天中只使用一小部分时间的产品;第二种是通过使样本承受比正常操作条件更严重的应力来加速故障;第三种是通过使表现出某种退化的单元(如金属的腐蚀和机械部件的磨损等)承受加速应力来进行。
最后一种方法称为ADT,利用从实验中获得的可靠性数据构建可靠性模型,然后通过统计和/或基于物理的推理程序预测产品在正常工作条件下的可靠性。推理过程的准确性对可靠性估计以及随后关于系统配置、保证和预防性维护计划的决策有深远的影响。具体而言,可靠性估计取决于两个因素:ALT模型和ALT试验计划的试验设计。一个好的模型可以为试验数据提供适当的拟合;这个好的模型可以在正常情况下实现准确的估计。同样,试验计划的优化设计,它决定了应力载荷(恒定应力、斜坡应力、循环应力)、试验样品的分配、应力水平的数量、最佳试验持续时间和其他试验变量,可以提高可靠性估计的准确性。事实上,如果没有一个最佳的试验计划,很可能一系列昂贵且耗时的试验会导致不准确的可靠性估计。
在进行可靠性试验时,有必要缩短加速退化试验和可靠性论证试验所需的时间。下面简要讨论两个有前途的方向:
1)虚拟-物理混合试验方法。建立虚拟数字平台,模拟电子元器件在加速或正常应力水平下的退化水平[13],并结合物理试验来校准数字平台中使用的模型。由于很大一部分是通过模拟完成的,因此可以在不影响结果相关性的情况下减少所需的时间。
2)结合早期磨损预测来加速试验。将早期试验结果的退化曲线预测应用于电子元器件的可靠性试验中。在最近的案例研究中[14],已经证明,在有早期预测的情况下,224种候选电池中识别高循环寿命充电协议所需的时间减少到预期时间的3.2 %,并随后验证了该方法的准确性和效率。因此,电子元器件的退化试验值得探讨,并可将其当成可靠性试验的先验信息,帮助后面可靠性试验的进行,并提高效率。
电子元器件的可靠性对整体系统的运行具有至关重要的作用,而在实际试验的时候,要想办法降低试验的成本,并且还要对其进行多种应力组合的情况下才能找到电子元器件的缺陷,因此了解电子元器件的可靠性试验方法有助于我们在实际中合理选择的试验方法,准确的发现产品的故障,从而保证元器件的质量和可靠性。