宁圃奇,郑 丹,康玉慧,柴晓光,曹 瀚,温旭辉
(1.中国科学院电工研究所,北京 100190;2.中国科学院大学,北京 100049;3.电力电子与电气驱动重点实验室(中国科学院电工研究所),北京 100190;4.北京电动车辆协同创新中心,北京 100081)
2019 年我国新能源车销量为120.6 万辆,与2018 年比下降4%,2020 年情况略有好转,主要原因之一是现有功率器件的容量水平和发展速度不能满足日益增长的车用电机驱动需求,在各地补贴进一步降低的状况下,这一差距还有继续扩大的趋势,对中国制造2025 年产销300 万辆目标的实施带来了压力。因此亟需发掘现有车用功率器件的应用潜能,进一步提高其功率处理能力,促进电动汽车产业快速发展。
现有电机驱动系统已经集成过压、过流和过温保护,但是目前功率模块结温监测技术大多基于模块内基板某处集成的热敏元件,监测结果与芯片的实际工作结温有较大差距。为了保证电机驱动系统的可靠运行,大多采用增大裕量、多重冗余的经验化设计准则,不可避免地存在“大马拉小车”的现象。如果能够精准提取功率芯片结温,就能够减小现有设计方法浪费的视在容量,从而降低成本,提高系统在复杂工况下的安全运行能力。同时,功率芯片结温的精准提取是系统进行状态监测、故障诊断、故障预测与健康管理的基础[1]。
在系统设计开发阶段,通过芯片结温监测给出电机驱动控制器额定功率与可靠性量化指标,可以为系统性能均衡设计提供指导,在提高装置功率密度的同时增加系统整体的安全裕量;在系统运行使用阶段,通过结温实时在线监测以及其变化趋势可以判断装置整体健康状况;在系统维修保养阶段,基于相同工况下的芯片结温记录,可以减少装备非计划内维修概率,对提高装备保障能力具有重要意义。
结温实时在线监测对于第三代半导体的可靠应用同样具有重要意义。以碳化硅SiC(silicon carbide)为代表的的第三代半导体器件,具有导通电阻低、开关速度高、工作温度高等优点,特别适合需要高功率密度和高性能的车用电机驱动系统,被预测为硅器件的取代者。但这种新型器件的基础模型和实用技术尚不完备,需要借助结温在线监测技术来充分发挥SiC 器件的优势,实现超高功率密度。
由于功率芯片封装在模块内部,不易直接接触,难以直接观测,芯片结温测量颇具挑战,成为近年来电力电子学科的研究热点与难点课题。目前,国内外学术界和工业界在车用功率器件的结温监测方面做了大量的研究工作[2],提出了多种方法并开展了验证分析。结温监测方法主要可归纳为4 种技术手段:物理接触法、光学非接触法、热阻抗模型预测法与热敏感电参数提取法。
物理接触法主要在功率模块内集成热敏电阻或热电偶等测温元件,得到的信息是模块内部基板某处的局部温度,远非功率芯片结温,其误差较大(可达73%)[3],且响应速度一般在秒级,无法实时反映待测器件结温的动态变化。光学非接触法主要包括红外热成像仪、光纤、红外显微镜、辐射线测定仪等。在测量前需要破坏模块封装,除去灌封胶并涂黑芯片表面以增加辐射系数,提高准确度[4]。另外,现有商用红外热成像仪的最高采样率仅为2 000 帧/s,远不能满足实时监测要求。SiC 器件在运行时会发出可见光,Li 等提出采用光敏探头来监测结温[5]。然而电机驱动用SiC 模块内部并联芯片较多,封装内部隔光板的设计、多路光敏探头的排布与外连、平面型模块的狭小空间等都限制了其应用。热阻抗模型预测法考虑了待测器件、电路拓扑和散热系统等综合因素,通过估算损耗推导芯片结温及其变化趋势[6-7],广泛应用于设计过程中散热系统的评估。然而,实时损耗模型和热阻抗网络模型的精确建模相当困难,预设的热阻网络模型会由于老化原因发生较大偏移,限制了其结温监测能力[2]。
功率器件的一些物理参数与结温具有对应的映射关系,如载流子寿命、迁移率等,使得宏观电气特性呈现出与温度相关的变化趋势,也称为热敏感电参数TSEP(temperature sensitive electrical parameter)[8]。通过对热敏感电参数的测量,可以对芯片结温进行估计。其核心思想是把待测器件自身作为温度传感部件,建立温度与外部电气变量的映射模型。这种方法响应快、成本低,是最具应用潜力的结温实时在线监测技术。
热敏感电参数法基本可分为两类:静态法和动态法。静态热敏感电参数法是指器件处于完全导通或关断状态下的参数,例如小电流导通压降法[9]、大电流导通压降法[10]、驱动电压降差比法[11]、集电极起始电压法[11]和短路电流法[12]等。与之相对的是动态参数法,如集电极信号/功率端子差值法[13],阈值电压法[14-15]、内置驱动温敏电阻法[16]等。
大电流导通压降法是结温实时在线监测最具可行性的方法,得到了国内外学者广泛关注,取得了一定的研究成果,但尚未进入实用阶段。本文对大电流导通压降法的特点进行分析,针对离线标定繁琐、采样精度低、验证困难等问题,介绍了现有的解决方案和未来研究方向。
各类热敏感电参数法都有各自的优势和缺点,可以从泛化度、精准度、对控制策略的影响、硬件侵入性等角度进行评估[17]。相对于其他TSEP 方法,大电流导通压降法主要有如下4 个优点。
(1)泛化度较好,适于SiC 器件[18]。现阶段SiC器件加工工艺尚未成熟,SiC MOSFET 栅极氧化层存在缺陷,各类电气参数均会在运行时出现随机变化的情况。相对于其他热敏感电参数,大电流导通压降相对稳定,随机变化量很小[19],是用于结温监测的良好参数。对于SiC 二极管,其他测量方法也出现了实时随机变化的问题,只有导通压降可以作为热敏感电参数变量。
(2)精准度较高。在采样电路中,测量参数变化率大且测量分辨率大的方法可以获得更高的灵敏度和监测精度。电极信号/功率端子差值法等需要通过时间估结温,对于快速开关的工况,灵敏度很低(<1 ns/℃)[20]。小电流导通压降、门极阈值电压等方法的测量参数变化律在2 mV/℃左右,而大电流压降可以达到10 mV/℃[21]。
(3)对控制策略影响小。短路电流法需要设计额外的短路测试环节,阈值电压法需要在开关瞬间添加额外的测量脉冲,小电流导通压降法需要暂时关断工作电流,这些测试需求会影响驱动系统正常的控制策略,带来稳定性问题。大电流导通压降法不需要改变已有的控制策略,也不需要增加额外的脉冲,对系统安全的潜在威胁较小。
(4)硬件侵入性较低。驱动电压降差比法需要在正常控制之外改变驱动电压,内置驱动温敏电阻法需要在驱动电路中增加高频交流电源,这些附加电路会大大增加原有驱动电路的复杂度,带来额外的可靠性问题。大电流导通压降法可以复用驱动系统原有的电流采样电路,只需增加相对简单的电压采样单元,并且不需要改变原有驱动电路的拓扑结构,硬件侵入性较低。
在相关的应用研究中,文献[22]提出了大电流导通压降法的具体实现方法,给出了测试电路原理图和监测流程。首先通过离线标定建立电压、电流、结温的映射模型,在运行过程中,监测待测器件导通时段的压降和电流,即可利用映射模型计算出瞬时结温。此方法可以将逆变器的功率密度从11.16 kW/L提高到19.13 kW/L[23]。
大电流导通压降法的应用同样存在一定的局限性。文献[24-25]提出大电流导通压降法存在盲区效应,如Si IGBT 器件为双极型器件,负载电流较小时,导通电压降会呈现负温度系数,而电流较大时为正温度系数,具有拐点。当采用大电流导通压降法进行结温提取时,必须事先判定拐点并建立相应规避策略。针对这些问题,文献[26]认为,常规工况下只有负载电流较大时才会出现较高温度,轻载时可不进行结温监测,只在电流超过拐点情况下再开启监测,不会影响过温保护效果。在这种实际要求下,大电流导通压降法能够发挥作用。文献[27]指出现阶段结温监测的主要目标,是在常规工况下判断功率模块的每个桥臂是否存在过温现象,以便进行及时保护,异常工况下瞬态电流过大导致的结温剧增一般都能由过流保护电路处理。因此,结温实时在线监测不必要求全量程高精度,对于远超正常芯片结温的区域以及轻载区域,可以适当放宽甚至设置饱和值。
综上,大电流导通压降法具有响应快、精度较高以及对控制策略和硬件系统改变小等优点,具有一定的学术研究与工业应用价值,尤其对于SiC 芯片,相对其他热敏感电参数随机变化小,是当前唯一适合的结温在线监测方法。
使用大电流导通压降法监测结温应首先进行离线标定,获得导通压降、电流、结温之间的三维映射规律,离线标定的准确性直接影响在线结温监测的效果。小电流导通压降法已经有成熟的标定流程,大电流导通压降法需要考虑芯片自发热影响[28]。基于导通电流测试的热敏感电参数均存在不同程度的自发热问题,大电流导通压降法则更为严重,采样时刻会影响建模精度。如果在开通之后过短时间内采样,瞬态过程尚未结束,导通电压误差较大;如果持续通电流时间过长,则发热明显,温度相差很大,需要补偿。
文献[29]提出了一种在正常工作时,根据测量电流和压降值计算结温的方法。但是这种方法依赖于一个校准台和特殊定制的模块,其应用受到限制。文献[30]提出了一种更为传统的利用基板温度的校准方法,在校准阶段估算考虑自加热。为了获得接近的结温,需要通过热阻抗网络计算修正参数,利用修正参数补偿标定过程,得到更准确的热敏感参数模型[31]。此方法过于依靠散热模型的准确度,较小的误差就足以影响标定的准确性。文献[32]指出,如果水冷条件良好并且校准在很短的时间内,即时间不超过2 μs 进行标定,芯片结温上升有限(<3%)。文献[27]指出,使用短脉冲信号控制待测器件,会产生较长的瞬态波形振荡过程,影响导通压降测量。提出始终保持被测器件DUT(device under test)导通状态,增加一个串联辅助开关来控制脉冲,可以在短时间内实现待测器件导通压降的稳定,进行合格标定,如图1 所示。
图1 结温标定电路Fig.1 Circuit for junction temperature calibration
采样时间的优化选择,要利用基于物理机理的热电耦合器件模型进行电路仿真,才能既保证待测器件真正进入稳态,又保证器件自发热时间不会过长。按照仿真手段的不同,基于物理机理的热电耦合模型方法可以分为3 类:有限元法、电路法和混合法。对于未知芯片设计参数和具体加工工艺的器件,有限元法和混合法需要逆向破解过程,计算复杂且误差大,电路法是唯一选择。电路法主要根据芯片结构和外特性边界条件求解载流子输运方程,得到载流子分布,进而求解外特性。典型的Si IGBT 和二极管物理模型包括Hefner 模型[33]、傅里叶模型[34]、Laplace 模型[35]和集总电荷模型[36]等。如图2 所示,文献[37]提出了有限差分模型,采用有限差分法求解基区载流子分布,解决了Hefner 模型和集总电荷模型不够准确、傅里叶模型收敛性过低的问题。SiC MOSFET 热电耦合模型相对简单,相关研究比较透彻。传统的热电耦合模型包括器件封装杂散阻抗和芯片热电耦合模型,文献[38]提出主电路尤其是母线电容,对功率器件的开关特性有较大影响,在热电耦合模型中应加入母线电容部分。
图2 电路法求解有限差分模型Fig.2 Finite difference model solved using circuit method
电机驱动系统组装后很难为标定三维映射规律进行大量台架实验,如何在较短时间内建立高准确度的映射关系也是需要突破的问题。对于车用电机驱动系统来说,热敏感电参数模型具有特异性,只能利用少量台架实验的样本建立映射模型,如果使用随机样本容易形成较大的误差。在设计实验的时候要根据均衡分布思想,运用组合数学等理论设计构造样本库,使之具有正交性、典型性以及综合可比性等特点。文献[39]指出采用正交法设计实验时,需要基于功率器件的热电耦合模型,分析其中的物理机理,揭示结温与热敏感电参数在不同工况下的相关性,找出不同区域内各参数变化的敏感性,为实验优化设计打下基础。在全部标定实验结束后,建立三维映射模型需要进行参数拟合,为提高模型精度,一般要采用特定的优化学习方法,迅速建立全量程高准确度的映射模型。使用遗传算法对热电耦合模型进行参数拟合,有效提高了性能和训练效率。文献[40]改进了经典遗传算法优化模型参数,部分解决了收敛速度慢、全局搜索能力差以及不稳定等问题。
在实际运行工况中,待测大容量电力电子器件一直处于高频开关切换中,经受着高电压和大电流的双重冲击。器件导通时待测量一般只有几伏,而关断时需要耐压近千伏,需应对分辨率和采样噪声难题。特别是SiC MOSFET 开关过程中的dv/dt 和di/dt 噪声量级远大于传统Si 基功率变换器,这种强干扰环境对结温监测电路提出了更高的要求。
在可阻断高压的低压信号测量方法研究中,文献[41]给出了两种常用的导通压降检测电路,如图3所示。当DUT 处于导通状态时,钳位电路处于短路状态,理想情况下,导通压降可以约等于负载电阻R1两端的压降;当DUT 处于阻断状态时,钳位电路可以阻断直流电压,在保护测量电路的同时提高测量精度。如图3(a)所示,R1远大于开关S1的导通电阻,V1,a在数值上约等于VCE。选择此方案需要特别关注S1的开关时序。一般来说,在DUT 关断之前,S1需要提前被关断;当DUT 导通之后,S1才能被再次开通。这样可以有效地抑制DUT 的开关瞬态对于测量电路产生的影响,同时也会增加整个系统的复杂程度。图3(b)通过电压钳位二极管D1来阻断直流电压,相比于前一种方案,采用D1阻断直流时电路结构简单,不需要额外的脉冲来驱动有源器件。但是,其测量电路输出值实际上为DUT 的导通压降值加上钳位二极管D1的导通压降,并且VD1会随着二极管温度和导通电流的变化而变化,这就使得精确测量DUT 导通压降变得十分困难。
文献[42]在图3(b)的基础上增加了一个相同型号的二极管D2用于抵消隔离二极管D1压降的影响,如图3(c)所示。实际使用中要求两个二极管位置靠近以保持温度相对一致,并且两个二极管温度系数的离散性仍然会产生部分误差。
图3 常用导通压降监测电路Fig.3 Commonly used monitoring circuits for on-state voltage drop
使用积分器对一个开关周期内的信号进行滤波是常用的手段,也常被用于结温监测的调理电路中。实际电路中含有寄生电容,导致其在高频段丧失微分特性,再加上空间复杂干扰的存在,致使高性能积分器的设计面临巨大挑战。因此,尽管基于大电流导通压降的结温监测方法在理论上具有很大优势,但实际应用中仍需要探索同时满足高带宽、强抗扰、低侵扰和小体积的高性能电路。文献[43]在图3 电路的基础上增加了低通滤波环节,同时增加动态比例调节电路和无效范围去除电路,大幅提高了电压采样的温度分辨率。高精度导通电压采样调理电路如图4 所示。
图4 高精度导通电压采样调理电路Fig.4 High-precision sampling and conditioning circuit for on-state voltage
在结温在线监测系统中,芯片导通电流检测的准确性,以及与导通压降测量的同步性,对结温在线监测结果影响较大。被测器件导通电流检测的方法主要有同轴分流器法(Shunt)、霍尔传感器法、芯片集成电流传感器法、IGBT 退饱和方法和PCB 板罗氏线圈法等。同轴分流器法测量精度高,但电阻的寄生参数会恶化被测器件的开关特性,且损耗问题不可避免,仅适用于中小功率等级。芯片集成电流传感器法采样电阻的选取无法兼顾检测精度和电流偏移之间的要求,仅适用于辨识过载和短路,不适合作为正常工况下的电流检测方法。IGBT 退饱和方法无法解耦结温和导通电流,一般只应用于短路保护。PCB 板罗氏线圈法是最近比较热门的研究,具有体积小、带宽高、线性度高、无磁饱和等优点,但是对于低频信号误差较大,且存在积分器与线圈的耦合振荡问题。
霍尔电流传感器带宽通常低于300 kHz,对于突然变化的电流测量较为困难,而且霍尔元件的温漂问题会引入测量误差,但是其在电机驱动系统中应用非常普及,如果能把霍尔电流传感器采样的电流数据应用于结温实时在线监测系统,对于降低系统复杂度和侵入性具有重要意义。文献[43]使用负载电流和控制时序计算芯片导通电流的方法,具有一定的实用性。然而,电机驱动系统在高速运转时载波比变小,每个开关周期内电流会迅速变化,必须按照开关频率和控制策略及时调节电流、电压的采样时刻,尽可能测量到该周期的芯片最高结温。在热电耦合模型的基础上,需要进一步详细仿真分析每段PWM 采样时刻,摸索采样规律,提高结温监测的准确性。
图5 给出了应用负载侧霍尔电流传感器对电流进行采样的结温在线监测采样时序[43]。为消除功率器件开关过程对采样产生的干扰,在DUT 导通中间时刻采样。为减小对控制策略干扰,控制器使用两个定时中断,在载波的上溢中断进行控制器主控相关的模拟量采样和计算,在载波下溢中断进行结温监测相关的采样和计算。结温采样与开关频率同步,在每个结温采样周期,进行过采样滤波。选择电压、电流交替采样以保证电压和电流采样时刻同步。
图5 结温在线监测采样时序Fig.5 Sampling sequence for online junction temperature monitoring
文献[9-15]指出,已有的各种结温监测技术均缺乏有效、可信的实验验证方法,一些测量技术在非线性区域准确性可能会大幅度变化。文献[11]在验证的过程中,把模型的仿真结果和结温监测结果进行了对比,缺乏与其他实验方法监测到的结温相互验证,信服力较低。
在前述介绍的几种芯片结温监测方法中,物理接触法大多远离芯片,难以得到准确结温;光学法对模块侵入性较大,难以正常运行;热阻抗网络法对实时损耗和热阻抗网络要求高,精确建模不易。如果利用其他的热敏感电参数法进行对照,会受到灵敏度、控制策略、硬件侵入性等问题的约束,且同时使用两套测量电路会极大增加系统复杂度,特别对于SiC 器件,除大电流导通压降法外,其他的热敏感参数法几乎都存在随机变化的情况,难以直接对比。
小电流导通压降法具有线性度好、耦合量少、检测精度高的优点,目前广泛应用于Si IGBT 实验室离线的结温测量和热阻抗测量。对于电机驱动系统常规运行工况下的结温在线监测,比较适合采用小电流导通压降法来进行对照验证。文献[41]提出了突然暂停法,在常规工况运行时封锁所有控制信号,逆变器完全停止后再注入小电流信号,以小电流导通压降法测量离线芯片结温,如果该过程的时间很短(小于10 ms),可以认为芯片结温下降有限,可以与在线监测方法互为验证。然而,所有开关器件锁闭后,由于电感存储的电流不会立刻消失,二极管仍然会导通一段时间,此时难以开通一个开关器件并注入小电流信号,特别是电机负载具有旋转机械能量存在,加大了电流快速回零的难度。
文献[44]采用特殊的控制时序,提出了单向电路带电感负载时,“暂停”变频器时在短时间内使大电流归零的方法,具体电路和控制方法如图6 所示。其控制算法在“暂停”过程中会对阻抗负载逆向注入较大电流,从而使电感电流迅速归零。通过改变逆变器的控制算法,可以一次性测量H 桥中所有器件的结温。这种方法目前仅适用于单相电路。
图6 H 桥电路和突然暂停控制方法Fig.6 H-bridge circuit and sudden shutdown control method
对于三相系统,文献[45]设计的“暂停”时序,通过选择停止时刻和控制IGBT 状态,使负载电流进入强制续流模式,可以在几毫秒内切断工作电流进入小电流导通压降法测量模式。具体电路和控制方法如图7 所示。从开始“暂停”控制到完全停止之间的时间,应用方法进行补偿,可以精准得到关断瞬间的结温。
图7 三相变流器电路和突然暂停控制方法Fig.7 Three-phase inverter circuit and sudden shutdown control method
车用电机驱动的实际工况中,可能出现过流、短路、负载突变、堵转等异常状态,在异常工况下,结温监测结果的准确性、快速性和保护特性同样需要验证。其中短路模式的电流突然增大能够引起温度的聚升,但能够被电流保护所控制,温度检测只需要针对满载、超载和瞬态过程中的结温过高。与Si IGBT 不同,SiC MOSFET 输出特性的线性区和饱和区无明显过渡,在短路瞬间电流急剧上升,结温迅速升高。文献[46]提出,作为过流保护的有效辅助手段,结温监测也要极其迅速才能避免器件热击穿失效,由于材料缺陷和工艺原因,现有SiC MOSFET芯片产品的短路耐受能力远低于Si IGBT,结温检测的快速性需要特别验证。
另一方面,结温监测依靠电流、导通压降、结温的三维映射模型,不仅要计算采样时刻的结温值,而且要估算一个开关周期内结温的变化,这需要掌握整个开关周期内电流的变化规律。文献[47]指出,通过负载电流和控制时序能够实时计算出流过每个桥臂的电流,但只在三相对称时准确度较高。电机驱动在常规工况下三相有较高对称度,仅在载荷突变时三相瞬态下不对称,负载突变时会有一相电流超过之前时刻的稳态,基于大电流的结温检测可能出现准确率大幅下降的情况,需要匹配合适的补偿算法。另一类情况是电机堵转,电流的幅值并不增加,但是电流的基波频率会大幅下降,可能造成对单一桥臂散热集中的情况。尤其是转速较高的电机突然堵转的瞬态过程,三相不对称的瞬态过程会使结温监测系统受到影响,可能出现动态测量误差过大,也需要一定补偿。
该方向研究的最终目标是以大电流导通压降作为特征参数,实现功率器件实时结温监测,为功率器件容量扩展和系统可靠性增强提供支撑。在标定、采样、验证方面仍有进步空间,可能的热点方向如下。
(1)在标定用模型改进方面,需要建立包含芯片和封装的热电耦合模型,进一步加入母排、电容等主回路元件,并考虑元件间散热影响,以降低模型误差。采用芯片+封装+母线电容的热电耦合模型后,容易导致温度大范围变化时仿真时间过长,或出现收敛性问题,需要进一步降阶。
(2)在数据采集方面,需要在平衡成本和体积的前提下进一步提高电流、电压采样精度,将温度误差限制在较小范围内。增强数据预处理、数据传输、数据融合等环节的稳定性和精度。
(3)在SiC 器件结温验证方面,上述小电流导通压降法无法作为验证手段,可以探索利用SiC 正常工作时发出的可见光进行验证。设计开发特殊的功率模块,内嵌光敏探头和隔光板,防止芯片间的光源干扰。在电机驱动正常运行情况下,利用SiC器件工作时可见光与结温具有的特定关系,对比验证大电流导通压降法的准确性。
车用功率模块应用过程中,现有设计方法存在视在容量的浪费,结温在线监测可以提高功率模块的可用容量,增加系统可靠性。以大电流导通压降为状态量的热敏感电参数法最有可能实现结温在线监测。在已有研究中,深入机理研究建立包括芯片、封装、主回路元件在内的热电耦合模型,是解决大电流导通压降法难以标定、采样准确度低、验证困难等问题的基础。标定阶段的研究主要侧重合理采样时间的确定以克服芯片自发热现象,监测阶段的研究侧重高精度、抗干扰、低温漂的采样电路和采样策略,准确性验证方面的研究侧重在不同工况下可以迅速停止系统进行离线结温监测数据对比的控制策略设计。基于大电流导通压降法的结温在线监测研究,正在不断提高监测的准确性和稳定性,助力提高功率芯片实际使用容量,增强电机驱动系统的安全性。