费跃哲
(中国电子科技集团公司第四十七研究所,沈阳110032)
随着信息技术的不断发展,近年来大数据、云计算等技术的应用开始变得愈加广泛,这对数字集成电路的可靠性提出了更高的要求。
受诸多因素影响,数字集成电路在应用过程中很容易出现老化问题,这不仅会使电路成本大大增加,同时还会直接影响到集成电路的稳定性与可靠性。如果老化问题未能得到及时处理,甚至还有可能会引发严重的安全事故。而要想对这一问题进行有效预防,提高数字集成电路得可靠性,则需要对电路老化进行准确测试。
数字集成电路老化通常是指集成电路在长时间使用后,其电路性能在各种因素的影响下逐渐下降,并对电路可靠性与稳定性造成影响。
一般来说,集成电路在出现老化问题后,工作频率出现下降,信号延迟问题随之产生,老化问题越严重,工作频率下降与信号延迟问题就越严重[1]。而从故障现象上来看,老化主要体现在信息采集的延迟上,数字集成电路由组合逻辑电路、触发器等部分组成,其中逻辑电路负责输出稳定信号,而触发器则负责捕捉这一稳定信号。正常情况下,由于逻辑电路的输出信号能够在一段时间内持续保持稳定,因此触发器能够轻易捕捉到该信号,但在老化的情况下,逻辑电路的输出信号不断退化,使触发器无法完成信号捕捉,而输出信号则会在触发器开始工作之前发生跳变,进而引发时序故障。如图1 所示,当SW2 开关出现故障时,SW3 开关会继续工作,从而跳过了SW2 开关,使整个电路出现时序故障。
图1 集成电路故障示意图
数字集成电路老化的影响因素有很多,其中影响较大的主要有负偏置温度不稳定性效应、经时击穿、电迁移、热载流子注入等几种。
(1) 负偏置温度不稳定性效应
负偏置温度不稳定性效应主要出现在PMOS 管上,在集成电路运行过程中,PMOS 管的阈值很容易出现电压漂移的情况,进而导致漏极电压降低,PMOS 管的性能因此下降[2]。PMOS 管导通过程会出现一定程度的延缓,信号传播时间也会延长,这些都会使集成电路芯片的故障发生机率大大增加,并使电路老化现象变得愈发严重,负偏置温度不稳定性效应示意图如图2 所示。
图2 动态负偏置温度不稳定效应
另外,负偏置温度不稳定性效应的出现还受到很多其他因素的影响,例如温度、占空比、工作负载、受压时间等。一般来说,数字集成电路所产生的负偏置温度不稳定性效应具有动态化特点,整个效应的周期通常可分为应力期与恢复期两个阶段,在这样的情况下,要想对负偏置温度不稳定性效应进行可靠性分析,其难度往往会比较高,计算工作也比较复杂。
例如在动态模式下,数字集成电路阈值的电压变化会比较大,在静态模式下,数字集成电路的阈值电压变化则会相对较小;而如果将数字集成电路的占空比与输入模式确定下来,则大多数负偏置温度不稳定性效应都可以通过偏置PMOS 栅极电源电压的方式来解决。可见,对于负偏置温度不稳定性效应所导致的一系列老化问题,必须要对数字集成电路展开全面测试,并且依据测试中的结果将负偏置温度不稳定性效应恢复期确定下来,然后对于负偏置温度不稳定性效应所引起的退化情况进行测量。
(2) 经时击穿
经时击穿(TDDB)是与时间相关电介质击穿。通常情况下,晶体管的栅氧层具有绝缘特性,但在集成电路运行过程中,由于正电荷的不断累积,在超过一段时间后,累积的正电荷会击穿栅氧层,使之失去绝缘性,对集成电路的正常运行造成直接影响[3],导致数字集成电路的老化。
(3) 电迁移
电迁移是指在高温环境下,数字集成电路的金属线因电流作用而出现金属迁移,是数字集成电路的一种十分常见的老化故障问题。
数字集成电路的精密性非常高,内部的互连引线密集,直径也都非常小,这使得电路内部的电流密度相对较大,在高频率变化的情况下,很多金属原子都会在电流的影响下沿着电子运动方向而持续运动,如果某处的金属原子迁移较多,那么本身就非常细的金属线就很可能出现断裂的情况。
从整体上来看,电迁移故障的形成原因并不多,通常仅在电源、时钟线等处的互连引线上出现,引线电流密度与变化频率越高,出现电迁移现象的机率也就越高,针对这一故障,通常都会通过增加互连引线宽度的方式来进行规避,具体宽度需要根据数字集成电路的电流密度标准值而定。
(4) 热载流子注入
热载流子注入是指电子脱离硅衬底而进入栅氧化层,并且会导致阈值电压发生改变。如今电子产品的尺寸越来越小,而设备内部供电电压与工作电压无法再缩小,这就造成其内部集成电路的电场强度与电子运动速率随之不断增加,当电子的能量足够高的时候,电子会脱离硅衬底,隧穿进入到栅氧化层,从而改变阈值电压。MOS 器件中热载流子注入(Hot Carrier Injection, HCI)效应的发生,是源于器件工艺尺寸改变导致的工作异常,因为沟道中的横向和纵向电场增加,所以在强电场作用下,载流子能量迅速的提高,于是载流子变成热载流子,并导致一系列的热载流子效应。在深亚微米尺度下,这种效应会减小PMOS 管的阈值电压,同时增加NMOS 管的阈值电压,并影响一些关键的工艺参数,产生长期的可靠性问题。
数字集成电路老化测试技术方法较多,从总体上来看,可大致分为老化检测技术与老化预测技术两类[4]。
老化检测技术简单来说就是在数字集成电路出现老化问题后,技术人员利用感知单元对组合逻辑电路进行全面检测,采集其生成的输出信号,并对感知单元与触发器的输出值进行比对分析,以判断逻辑电路所输出的信号是否正确。
在正常情况下,感知单元捕捉到的逻辑电路输出值会与触发器输出值相匹配,一旦发现逻辑电路输出值与触发器输出值存在差异,则可以判断该数字集成电路出现了老化现象[5]。一种典型故障检测电路如图3 所示,当电流经过电阻R1 或R2 时,该电路中的小灯泡全部点亮。当电流经过R3 时,小灯泡不亮。但如果电流流经R3 时有灯泡点亮,则说明该集成电路出现问题,需要对故障进行排除。
图3 故障检测专用集成电路
与老化检测技术相比,老化预测技术主要是用于对数字集成电路老化的预测,即在数字集成电路发生老化之前,通过对电路相关数据参数的检测与比对分析,来判断其是否存在即将老化的迹象。
由于老化必然会导致集成电路本身性能的下降,因此即便在老化现象发生后对其进行准确的老化检测,也只能够降低电路老化的影响[6]。而老化预测技术则可以在帮助技术人员在老化问题发生之前进行有效预防,且不会对集成电路造成影响,在优化电路性能、大幅度降低电路成本等方面有着非常显著的优势,因此其应用价值是非常高的[7]。
一般来说,对于数字集成电路老化的预测主要是通过观察信号跳变情况来实现。正常运行的数字集成电路会按顺序完成信号输出、捕捉、识别等一系列程序,但在电路老化的情况下,由于信号捕捉会出现延迟,因此信号跳变就会频繁出现,在测试过程中,只需预先确定可能老化问题的区域,并将其设置为测试范围,就可以通过持续观察进行老化预测,一旦该区域信号出现了,那么就说明电路具有潜在老化问题,接下来就可以为电路制定针对性的老化预防措施[8]。当然,由于老化预测技术依赖于信号跳变现象的观察,因此比较适用于负偏置温度不稳定性效应所引起的老化问题,而对于其他原因引起的老化,则存在一定的限制。
电路老化本身是一个比较漫长的过程,数字集成电路在长时间使用后,其性能才会因各种因素的影响而逐渐降低,并可能会出现老化故障。因此在电路出现时序故障之前,通常都需要对电路老化情况进行预测,但当数字集成电路出现较为严重的老化故障时,则需要通过老化检测技术对老化故障的原因、严重程度等进行深入分析。因此,数字集成电路老化预测技术和老化检测技术在整体上并不存在着优劣之分,实际应用中必须根据具体情况来对两种技术进行选择。
从总体上来看,老化预测技术与老化检测技术的差别体现在以下几方面。第一,在应用时间方面来看,老化检测技术只能在数字集成电路的老化故障发生后才能够应用,而老化预测技术则必须要在故障发生前进行应用;第二,从数字集成电路的状态来看,老化检测过程中,数字集成电路的数据与状态基本已经被破坏,而在老化预测过程中,电路中的数据或状态则并未发生变动;第三,在价格方面,老化检测需要对数字集成电路的实际故障进行深入分析,所以检测成本是非常高的,相比之下老化预测在成本上会更低;第四,老化检测对于检测准确性要求较高,如出现长期的错误检测,其潜在的数据的完整性必然会受到影响,而老化预测则只需在预测失效前收集到数据即可,就能够保证预测结果的有效性;第五,在实用性上,老化检测与老化预测的相关技术都可以有效的结合到其他电路之中,但在老化预测的应用会存在一定的限制。
数字集成电路的工艺尺寸向微型化的方向不断发展,对电路的鲁棒性与可靠性产生了很大的影响,老化故障问题成为影响数字集成电路性能、可靠性、稳定性的主要原因。面对数字集成电路所存在的各种老化故障问题,要对影响因素做多方面的了解和研究,分析研究探讨负偏置温度不稳定性效应、经时击穿、电迁移等老化影响因素的原理与规律,并在此基础上对电路老化预测与检测技术进行更加灵活的应用,实现对电路老化问题的有效预防与处理。