方骏仁,程凡永,孟献蒙
(安徽工程大学 安徽省电气传动与控制重点实验室,安徽 芜湖 241000)
随着现代电力电子技术的迅速发展,作为风电等新能源系统中重要的能量转换元器件,逆变器拥有启动快速、转换效率高、稳定性好等优点,然而一旦发生故障就会破坏整个电力系统的正常运行,从而影响人们的生产生活,因此有许多研究人员对逆变器的各种故障进行了深入研究。
很多研究表明,大部分逆变器发生故障都是由于逆变电路中的核心部件绝缘栅双极型晶体管(IGBT)故障引起的,所以针对IGBT的故障检测显得尤为重要。目前IGBT的故障主要分为3种[1]:一是在生产研发阶段由于制作工艺出现了问题产生的故障,一般不做研究;二是在使用阶段由于受到了外界冲击等因素导致发生开路或短路故障等问题;三是随着使用时间的增加都会面临的IGBT老化失效问题。因此为了减少发电系统的故障,实现系统的安全稳定运行,必须要预测出IGBT的剩余使用寿命,当出现老化特征时第一时间更换元器件,预防出现更大的损失。
对IGBT的老化故障预测是目前的研究热点[2],由于IGBT在逐渐老化的过程中会使得器件的某些外部参数发生变化,所以选择一个合适的评估参数是重中之重。文献[3]通过对IGBT进行老化实验,发现模块的结-壳瞬态热阻会随着IGBT的老化而变化,故根据这一特点选择了结-壳瞬态热阻值作为失效特征参数,再利用注意力机制模型预测IGBT的剩余寿命;文献[4]指出,当IGBT工作在高结温及高温度梯度状态时,老化失效主要表现为铝键合引线的翘起和脱落,会出现集电极-发射极饱和电压变大的情况,因此也可以作为IGBT故障预测的特征参数;文献[5-7]都选择了美国宇航局NASA研究中心发布的IGBT加速老化数据集,并选取IGBT在瞬态关断过程中产生的集电极-发射极瞬态尖峰电压作为失效特征参数进行故障预测。文献[5]采用BP神经网络构建老化故障预测模型,但由于没有对网络的结构和参数进行优化,还存在极小值情况,准确性有待提高。文献[6]使用的小波神经网络拥有小波变换的优点,避免了BP网络设计结构的盲目性,但是隐藏层的节点数以及各层之间的权重始终难以确定,影响模型的收敛速度。文献[7]提出了基于长短时记忆网络(LSTM)的预测模型,LSTM可以利用历史长期的时序信息进行预测,但传递信息需要等待上一个时间步的前向传递结束后才可以进行下一个时间步的前向传递,是顺序执行的,无法做到并行处理,而且传统的循环神经网络只能默认输入全部的历史信息,无法做到对输入的精准控制。所以本文利用该瞬态关断尖峰电压特征参数提出了一种基于时间卷积神经网络(TCN)的IGBT老化故障预测方法,并构建LSTM及其变体GRU神经网络模型作为对比分析,通过实验结果验证本文所提方法的可行性。
IGBT作为一种场控元器件,拥有控制电路简单、开关速度快、饱和压降低等优点,是一种由电压驱动的电路开关,没有机械按钮。对封装好的IGBT元器件进行物理电路等效得到的IGBT等效电路图如图1所示,其中G、C、E分别代表IGBT的栅极、集电极和发射极。当IGBT的栅极和发射极加上正电压,并且大于导通阈值时,兼容了MOSFET的IGBT就会导通;当栅极和发射极无电压或施加电压小于最小阈值电压时,IGBT就会处于关断状态。这仅仅只是一次简单的IGBT导通关断过程,但在实际复杂的工作环境中,IGBT需要频繁进行开关,流经它的电流和电压会对器件产生日积月累的影响,最终会导致IGBT在没有达到预期使用寿命期限时提前发生老化失效故障。
目前,针对IGBT模块的老化失效主要可以归结为两点[8]:焊料层疲劳失效和铝键合引线脱落。IGBT是由多种不同类型的材料组合而成的,结构图如图2所示。这些材料的热膨胀系数不同使得各材料层之间承受应力的能力也不一样,所以当IGBT因工作而聚集大量的热量并且散热不及时,就有可能会导致焊料层发生疲劳失效。另外,结温升高产生的热应力不仅能够作用于材料层,还会对器件的铝键合引线产生冲击,键合引线在IGBT中起到芯片连接芯片、材料层的作用,随着冲击效果的不断累积会造成键合引线松动甚至脱落,这两点都是IGBT在封装层面上发生老化失效的重要因素。
图1 IGBT等效电路图 图2 IGBT模块结构图
对IGBT的相关研究表明,在-55 ℃和125 ℃的温度范围内只需要进行300次热循环,就会导致芯片焊料退化和焊点损坏,相当于器件几十年的运行[9]。每一次热循环过程,IGBT都会不断退化,而退化伴随着由于内部温度升高而导致的工作期间一些外部特征参数发生变化,这些参数对于研究IGBT老化故障有着重大意义。为了推进电子元器件故障预测的研究,NASA研究中心开发了对IGBT的加速热老化实验平台,实验条件如表1所示。该实验采用在栅极施加方波电压的方法实现热循环加速老化,测量的参数主要包括:集电极-发射极电压、集电极-发射极电流、栅极电压、包装温度等。在通过大量实验后研究中心公布了IGBT加速热老化数据集,而且在文献[10]中对实验期间记录的瞬态开关信号进行了分析:在整个测试过程中,栅极信号和电流保持相对恒定,稳态电压变化最小;导通过程中的集电极-发射极电压特性也几乎没有变化;但在观察集电极-发射极电压关断特性时,发现在IGBT退化过程中其集电极-发射极瞬态关断电压峰值显著降低,因此可以选取该瞬态尖峰电压值作为IGBT老化的特征参数进行故障预测。
表1 IGBT加速热老化实验条件
实验参数参数设置开关频率10kHz封装温度260~270℃
该加速热老化实验从开始进行到出现故障失效共经历170 min左右,期间共采集了418组集电极-发射极瞬态电压数据,每组数据共有10万个采样点,而且每组的分布具有相似性。研究将418组数据的集电极-发射极关断尖峰电压值提取出来,如图3所示。由图3可见,随着IGBT逐渐退化,关断瞬态尖峰电压有比较明显的下降趋势,进一步证明了使用该参数进行预测具有足够的合理性。
从图3a可以看出,采集的数据波动比较大并含有异常值,故先剔除前几个异常样本值再采用二次指数平滑的方法对其进行平滑处理。该方法扩展了简单指数平滑,使其可以用来预测带有趋势的时间序列。经过以上数据处理后可以得到图3b,黄线代表剔除异常值和平滑处理后的数据,蓝线是原始数据,从图3b中可以发现,经过处理后的数据波动性小,且保留了数据本身的曲线趋势。另外,在数据标准化方法的选择上采用最大最小归一化,可以提高模型精度和模型训练时的收敛速度,有效避免了梯度爆炸。
图3 IGBT集电极-发射极关断尖峰电压值退化过程
在以往分析时序问题时,大家通常都会选择循环神经网络(RNN)以及它的变体LSTM等来进行建模,这是因为RNN天生拥有循环自回归的结构特性,这是对时间序列的很好的表示[11-12]。但随着TCN的出现引起巨大反响后[13],一些人认为TCN会取代RNN成为时序预测领域新的王者,这归结于RNN在处理数据时耗时太长,网络传输数据时只能按照顺序进行,无法做到同时大规模并行处理。TCN作为卷积神经网络的一个变体,克服了传统卷积神经网络受其卷积核尺寸的限制,以及不能很好地抓取长时间的上下文依赖信息的问题,并且当给定一段输入时,TCN可以实现大规模并行处理,取得比RNN更好的时序预测效果。
TCN的核心就是扩张因果卷积和残差块模块[14],TCN模型所使用的因果卷积,就是对于上一层t时刻的值,仅与下一层t时刻元素大小及之前的输入有关,用来确保未来的数据不存在泄漏。扩张因果卷积相比普通因果卷积,引入了扩张系数,使得有效窗口的大小随着层数的增加呈现指数式增长,这样用较少的层数就可以获得比较大的感受野。扩张卷积的计算定义为
(1)
对于一个一维的输入序列x,其中,F(s)表示经过一次扩张卷积计算后在s位置上的网络输出结果;d为扩张系数,且d以2的指数幂形式增长;k表示卷积核大小;f为过滤器,f(i)表示对第i个输入进行过滤操作。d=(1,2,4)、k=2的扩张因果卷积和普通一维因果卷积的对比如图4所示。由图4可以发现,前者在减少网络层数获得稳定梯度的同时可以拥有较大的感受野。
为了防止出现网络退化,使用Resnet残差网络可以有效改善网络退化问题[15]。残差链接是训练深层神经网络的有效方法,它使得网络信息可以采用跨层方式直接进行传递,另外还加入了Dropout机制避免训练时出现过拟合现象,由于样本数据量适中故不需要进行WeightNorm权重归一化。
本文使用Keras框架和Python语言构建的时间卷积网络模型如图5所示,TCN模型由多个残差模块组成,将输入序列(x0,x1,…,xt)输入到模型进行训练,再把TCN的输出输入到一层全连接层,得到最终的输出预测值。最下面一层的扩张系数d=1,表示输入时每个点都采样;中间层d=2,表示输入时每两个点采样一个作为输入;模型为了加速收敛速度,保持稳定训练,引入残差网络模块实现网络跳层连接;一维卷积模块用来解决输入输出可能出现维度不同的情况。
图4 两种因果卷积基本结构
图5 基于TCN的IGBT老化故障预测模型
对于TCN模型,它的一些超参数设置也影响着最终预测的精度,如过滤器的数量,过滤器存在于任何卷积神经网络架构中,它与模型的预测能力有关,并影响网络的大小,一般过滤器数量越多越好,除非出现过拟合情况;卷积核大小控制一维卷积运算中数据的空间面积;扩张系数控制网络的层数,相同大小的感受野,所需隐藏层更少,可以减少大量网络参数;选择Relu激活函数能有效避免深度学习训练过程中梯度消失的问题,Dropout大小设为0.05,防止出现过度拟合;此外,选择Adam作为TCN模型和对比实验LSTM、GRU网络模型的优化算法。Kingma的研究表明[16],Adam模型中的一些超参数几乎不需要调整,因此,直接使用Kingma等测试的良好参数设置作为Adam优化器的超参数。各算法模型在表2所示的超参数设置下,均达到最佳的性能表现。
表2 各算法模型超参数设置
性能评价指标采用均方根误差(RMSE)和平均绝对误差(MAE)来衡量IGBT预测算法的性能,它们是机器学习中评价模型两个重要的指标。其中,RMSE测量误差的平均大小,是预测值和真实值之间平方差异平均值的平方根,数量级上较为直观;MAE是绝对误差的平均值,可以准确反应实际的预测误差。这些指标的结果越小则证明模型预测效果越好,计算公式如下:
(2)
(3)
为了验证本文所提出的基于TCN的IGBT老化故障预测方法的优越性,另外尝试与LSTM、GRU模型进行了对比分析,把经过数据处理后的集电极-发射极关断尖峰电压时间序列的前70%用作训练集,后30%用作测试集,3个模型在测试集上的预测结果如图6所示。蓝线代表真实数据值,黄线代表预测值。评价指标结果如表3所示。TCN模型的预测结果的RMSE为0.025 8,MAE为0.021 6,均低于LSTM及GRU模型的结果。
图6 三种算法模型预测结果与真实值对比图
表3 三种算法模型评价指标对比
通过图6中预测值拟合真实值的情况和表3中能够反映具体模型预测误差的两项评价指标可以看出,在这3种算法模型中,相较于循环神经网络模型预测方法,基于TCN的IGBT老化故障预测方法取得了最好的效果,相对于LSTM模型,TCN模型两项评价指标都提升了26%左右。
根据IGBT关断时产生的瞬态尖峰电压会随着器件老化而逐渐降低的特点,本文提出了一种基于时间卷积网络的数据驱动故障预测方法,用于预测IGBT的老化故障。以集电极-发射极关断尖峰电压数据为输入,再利用TCN模型对器件的老化失效进行预测。该方法不仅可以并行处理输入故障特征,还克服了循环神经网络容易出现梯度消失和梯度爆炸的问题。同时TCN具有更灵活的感受野,改进了传统卷积网络不能有效地提取长时间序列之间相关性的缺点,增强了故障预测的鲁棒性和准确性。结果表明,该方法拥有较好的故障预测性能,对IGBT老化故障的预测具有一定的应用价值。