李晓刚 李婕 曹宁 刘开元 刘启辉 汪攀
(上汽通用汽车有限公司武汉分公司)
汽车总线的稳定性在汽车功能稳定性中至关重要。随着整车智能化及集成化程度的提高,总线数据也日趋复杂,当大量的数据出现问题或者丢失时,汽车总线可能出现崩溃的情况。如果汽车出现总线长时间掉线问题,一般会造成汽车部分功能故障[1-2]。汽车通常会出现瞬时掉线,持续时间为20~200 ms 之间,当出现这种情况的掉线时,可能会导致部分车辆模块瞬间功能异常并弹出警示,但实际功能却不受影响。基于以上问题,文章通过汽车总线仿真测试软件(Vehicle Spy3)录取并分析实车总线数据,确定总线瞬时崩溃的原因,同时分析总线瞬时崩溃对车辆功能的影响,并深入评估车辆功能的恢复和正常使用的情况。
项目进行期间出现了“仪表盘弹出请检修制动牵引力”问题,随即进行问题分析,到实车阶段发现仪表盘一直显示该问题,但是汽车制动牵引力可正常使用,汽车无其他故障。
故录取总线数据后,对总线数据进行相应的分析,发现总线上许多模块都出现了短暂的掉线,并且掉线状态持续的时间很短,约为20 ms 左右,如图1 红框中所示。
CAN 总线是一种现场总线,连接在CAN 总线上的控制单元通常是通过2 根数据导线彼此相连。2 根导线是双导线并互相缠绕,称为CAN-H 和CAN-L,双绞线对称信号,抗干扰能力强,适用于环境比较恶劣的条件[3]。
分析数据后发现,总线上的数据出现在20 ms 内丢失1~2 帧数据的情况。模块集体丢帧这类问题大概率的原因是物理连接问题引起,特别是有外接线束或者设备的情况下,如果存在接触不良、短接、虚接、短地等情况都有可能出现。
其中仪表盘弹窗提示“请检修牵引力”,逻辑如下:电子刹车控制模块是安全件,对于信号改变的识别比较敏锐,只要监控到总线掉线,即多条相关信号不在线,如Ax/Ay(传感器X/Y轴加速度)等,就会禁用掉TCS(牵引力制动系统)/ESC(电子车身稳定性控制系统),此时电子刹车控制模块只请求了毫秒级的故障提示,继而会在仪表盘显示请维修牵引力。
CAN 总线的故障共分为3 类[4-5]:1)电源故障。由于电源系统电压低,引起控制器无法正常工作。2)节点故障。通过数据总线实现的控制单元网络的节点为网络的各个电控单元,可能存在电控单元本身有故障。3)链路故障。可能由于车机震动、系统未正确加装等原因导致总线的物理层出现故障,即传输系统的链路不通畅,无法正常通讯。链路故障又分为以下3 种,如表1 所示。
表1 汽车CAN 总线链路故障原因
该问题发生原因可能是CAN 线断路导致的,但是该问题现象只保持了20 ms 左右,随即恢复正常,如果是线路断路导致,问题现象应该一直存在,故可排除是由于CAN 线断路导致的。
当电阻缺失时,负载会减小,导致线路电流加大,线路会一直处于总线保护中,问题现象也会一直存在,故可以排除由于电阻缺失导致CAN 线路故障。
问题发生的原因还可能是CAN 线短路导致,为了查明是否由于CAN 线短路导致该问题的发生,需要对问题现象进行复现,以下为3 种复现的工况及手法。
工况一:正常状态下,启动汽车,通过对整车启动过程进行复现,查看仪表盘是否弹出警示;
工况二:怀疑外接设备导致,故插拔数据录取工具进行复现;
工况三:尝试短接高速CAN 线的CAN-H 和CAN-L。
分别在上述工况下对问题现象进行复现,通过复现,确认问题发生的根本原因。
1.2.1 工况一描述
不做任何相关的其他触发操作,只是正常启动汽车后,观察仪表盘是否弹出请检修制动牵引力的警示,并观察是否有其他现象。
1.2.2 工况二描述
由于插拔外接设备时问题现象会偶然复现,故分析认为在插拔外接设备时,在某种特定工况下会导致总线掉线。因此仪表盘弹出请检修制动牵引力问题的提示很可能是由于外接设备导致,外接设备及连接方式,如图2 所示。
图2 外接设备连接方式
针对该情况,分析插拔外接设备,以确定导致问题现象发生时,外接设备的状态。通过复现对比,仪表盘弹窗出现“请检修牵引力”的提示,从而复现出问题发生时的状况。
首先数据录取设备接口与汽车延长端口相连接,复现的状态为外接设备拔出的过程较慢,端口的针脚之间容易出现误接触,从而容易产生问题现象。
1.2.3 工况三描述
尝试短接高速CAN 线的CAN-H 和CAN-L,分别对应引脚中的6/14 脚,如图3 所示。在短接过程中,需要保证只是短暂的短接,避免由于时间过长影响车辆状况。短接的方式为:先用金属丝的一端连在引脚6上,然后用金属丝的另一端去触碰引脚14,再瞬间拿开,从而实现短暂短接的工况[6-7]。
图3 端口引脚分布图
在短接过程中,我们尽量保证短暂接触后立即断开,之后从数据中看到,当短接时间为25 ms 左右时,仪表盘弹出“请检修制动牵引力”的提示,与问题出现时的现象一致。
针对以上3 种复现工况,为了避免不同车辆因素的干扰,只使用一台试验车进行3 种工况的复现操作。通过对上述3 种工况进行相应的复现,并统计复现的次数及频率,经过一段时间得到结果,如表2 所示。
表2 不同复现工况下的复现概率
从复现结果可以看出,在正常启动汽车时,复现的概率为0,表示在该复现工况下,问题现象不会出现,可以排除车辆总线自身会掉线的可能性。
当插拔外接设备进行复现时,发现问题现象可以复现,但是频次较低,发生该现象的可能性是在插拔外接设备时,不一定会出现问题现象,而在插接过程中,2 个接口之间处于某种接插状态时,才会导致问题现象的发生。通过多次分析及试验,发现在2 个接口缓慢拔出的过程中,某些针脚处于连接状态,而某些针脚处于断开状态,在这种针脚连接状态下,可能会出现问题现象的发生。
在短接的CAN-H 和CAN-L 时,发现复现频次很高,短接的方式如复现工况中描述,基本只要进行短时间的短接,就会造成问题现象的出现。
通过对以上的复现工况及复现结果进行分析,由于短接高速CAN 线时,都会出现问题现象,而在插拔外接设备的过程中,会出现由于针脚误触而导致问题现象发生,而问题发生时实际车辆只连接外接设备,而没有自己短接的可能性存在,所以基本锁定总线掉线的原因是由于插拔外接设备时,总线偶然出现短接20 ms左右造成的。
为了确认和分析总线崩溃是否会导致车辆出现功能问题,文章经过长时间的跟踪和车辆数据对比,进行了分析和验证。
首先对于问题第一次发生的车辆进行7 天的跟踪,发现缺陷车辆恢复正常之后,车辆功能在该段时间内未发生其他异常,且录取总线数据后,数据未出现少发帧的现象。
然后对其他3 辆车进行工况三的复现方法对比,即通过短接高速CAN 线的CAN-H 和CAN-L,总线崩溃时间不同,车辆也会有不同的状态。因为模块的轮询周期不同,部分模块轮询周期较短,出现总线掉线后立刻会有警示灯弹出。
掉线时间不同对车辆会有不同的影响,对比的指标主要分为以下几个方面,如表3 所示。
表3 总线掉线对车辆的影响指标
因为汽车外接设备发生崩溃的时间为20 ms 左右,故设定短接时间为10 ms、20 ms、40 ms、80 ms,对比数据,如表4 所示。
表4 不同短接时间指标数据
从表4 中可以看出,在追踪车辆后期质量时,没有出现相关的故障,说明总线短暂崩溃后,汽车的功能会迅速恢复正常,并且不影响车辆的其他功能。
通过对以上的复现工况及复现结果进行分析,总线发生瞬时崩溃的原因是在插拔外接设备的过程中,出现针脚误触而导致总线短路。通过对问题发生后的车辆功能进行长时间的追踪,车辆功能未发现故障。综上所述,当总线短暂崩溃后,车辆的功能会迅速恢复正常,并且不会对车辆的正常功能造成影响。文章在理论上阐述了汽车总线短暂掉线发生后根本原因的确认,并评估此现象对整车功能的影响,可以指导后期车辆出现该问题后的排查及功能评估。后期将进一步研究总线掉线时间长短对于车辆功能安全方面的影响,并研究总线在出现意外情况下保持稳定的方法及策略。