段 宇
(中车大同电力机车有限公司,山西 大同 037038)
2018年配属西安铁路局的HXD2机车出现的微机控制单元MPU切换故障,具体现象是机车运行中报“MPU1 故障”,机车回段后试车,查看MPU1指示灯电源灯频繁微弱闪烁,其余指示灯不亮,MPU2指示灯正常,现场更换A节MPU机箱后试车正常。
MPU为冗余设计,正常情况下MPU1工作,当MPU1故障时,MPU2工作。但针对上述现象是由于MPU2电源烧损,从而通过MPU2内部的继电器板控制另一个MPU1失电,但MPU2也未能工作,从而不能实现冗余。MPU是机车运行的关键重要部件,相当于电力机车的大脑,MPU系统冗余功能失效导致MPU无法正常工作会给行车安全带来极大的安全隐患。本论文针对这一问题,从MPU冗余的逻辑下手,改进MPU冗余功能[1-2]。
微机控制单元MPU采用冗余设计,内部包含两个MPU机箱,正常情况下,MPU1作为主控单元,负责管理和监测网络通信和各设备状态,MPU2热备冗余;在MPU1故障的情况下,MPU2自动接管主控单元功能。切换过程中除MPU1本身故障外任何数据无损失,不会引起其他设备故障。MPU通过内部电器元件实现主控与从控主机得失替换,最终实现MPU1与MPU2的冗余功能。
HXD26138机车于2018年8月23日机车运行中B节报“MPU1 故障”,机车回段后,试车排查故障,发现微机屏提示“MPU2 故障”(死现象),查看MPU2指示灯仅亮左下角1个电源灯,MPU1正常,MPU2数据无法下载,初步分析为MPU2电源板故障,运行中故障MPU2错误将MPU1切除,但由于自身电源板故障,将MPU1切除后,MPU2无法投入正常工作,更换MPU机箱后试车正常,判断为HXD2机车MPU冗余功能失效。
后续对故障的MPU返厂检测,上电测试,故障复现,电源灯闪烁,其他指示灯闪烁后熄灭,发现电源板烧损。
MPU内部控制电路如图1所示。
图1 MPU内部控制电路
MPU的冗余控制原理是,通过内部数字量输出通道(A、C脚)控制继电器Q-PW闭合和断开,再借助Q-PW继电器触点实现管控MPU的电源复位功能。这个功能可以实现当某个MPU发生故障以至影响网络通信时,另一个MPU可以对其进行电源复位,不影响整车运行。图2为MPU1和MPU2的控制接口图。
图2 MPU1和MPU2的控制接口图
一般情况下,MPU2的AC脚之间处于高阻抗断开状态,继电器保持失电,此时继电器常闭触点闭合,MPU1得电,但当MPU2电源烧损时,导致MPU2内部电路板供电异常,导致DO控制电路芯片的工作基准电压不正常,造成MPU2的AC脚之间处于低阻抗导通状态,从而继电器得电,继电器常闭触点断开,最终造成MPU1的110 V电源断开,MPU2错误将MPU1切除,但又由于自身电源板故障,MPU2也无法投入正常工作。通过MPU返厂检测分析再次验证了前期故障处理的判断。
硬件冗余是通过热备系统或冷备系统硬件实现冗余控制所需要的数据同步和主从切换,在机车运行的过程中微机主控制器MPU1工作,从控制器MPU2处于联机运用状态,但不参与控制和输出,一旦MPU1故障,MPU2便会立即接替主控制器投入工作,迅速接管控制与输出,重新执行主控制器故障时的那段任务,不会造成数据丢失。
但根据前文中分析的故障问题,若MPU的电源板烧损就会出现冗余功能失效,该冗余功能的可靠性受到MPU机箱内电器元件的性能影响。一些老直流机车的控制单元采用的是冷备冗余,当一组控制单元故障时,手动切换至另一组。若在原有硬件热备的基础上,增加硬件电源冷备装置及当微机控制单元MPU内部电源板烧损热备冗余失效时,通过备用的冗余冷备电源装置给其中的一组MPU故障,通过人工上电,可以让另一组MPU得电继续维持机车运用,但这样做的缺点是通过人工操作,过于依赖人员操作的熟练程度,人工操作所耽误的实践会造成部分数据丢失,而MPU的数据记录是毫秒级,会对机车数据的运用分析造成一定影响。
冷备冗余是通过备份所有正常运行的组件放在一旁或者仓库里,等运行的组件坏了以后更换新的组件来完成系统的正常运行,这个冗余时间和更换时间息息相关。这种冷备用方式很少去关注响应时间,并且需要运维人员干预操作,人工上电的过程会耽误多少时间,只能视运维人员的对系统的熟练程度而定并且必须被动接受。热备冗余,是两套完全一样的配置组件,一个正常运行被视为主,另一个待机并不运行备用被视为从,每隔一段时间,主从的内容相互交换一次,当运行组件出现故障,备用组件才会运行承担工作,同时会完好地保存数据。
MPU相当于是机车微机网络系统的大脑,我们希望提高MPU使用的可靠性,包括全文给MPU增加冷备冗余装置的目的也是希望提高MPU冗余功能的可靠性,降低因电器元件故障导致冗余失效的风险,但冷备冗余的模式不利于机车运用数据的保留,站在这一角度思考,我们也可以通过改变MPU内部电器元件的电路设计,使MPU的DO控制电路内部冗余,从而提升设备的可靠性。
根据上文叙述,改进方案是在原来MPU主控和从控主机通过得失电实现冗余功能原理的基础上,改进MPU1和MPU2的DO电源控制电路,增加继电器Q-PW,由2个增加为4个,2个为一组,当MPU内部电源板路电器元件故障继电器动作时,每组的继电器互为冗余可以保证MPU继续得电,从而实现DO电源控制的电路冗余,最终从电器元件的得失电和内部电路设计方面的双层冗余,提升了设备的安全可靠性,也避免了增加冷备冗余装置的缺点和高费用。图3为改进后的MPU1和MPU2的控制接口图。
图3 改进后的MPU1和MPU2的控制接口图
图3中,改进的电源控制板电路将MPU1和MPU2的控制电路由原来的1路继电器控制增加为2路继电器控制。MPU2通过2路可控输出(MPU2 D01和D02)分别控制继电器A2和A4的线圈,外部DC110 V电源正端经过防反二极管及滤波电路后,分别经过A2继电器常闭触点和A4继电器的常开触点后接入MPU1的电源输入端口正端。
因为外部电源经过2个继电器的常闭和常开触点控制MPU1的电源输入,当发生故障时,即使MPU2的D0通道故障,A2继电器断开,A4继电器闭合,被控的MPU1电源仍处于正常导通状态,这就可以避免因MPU2故障导致MPU1失去电源输入的问题,提高MPU冗余功能的可靠性,MPU1电源控制电路同理控制着MPU2。
针对MPU电源板U4芯片烧损,造成MPU1、MPU2冗余功能失效的问题,我们结合优化后的电源控制电路改进方案,对MPU的电源控制板进行了实际改进优化,改造前后的实物如图4所示。
同时,在MPU1和MPU2的D0控制引脚端与地之间增加了TVS(型号SMCJ15CA),增强了DO通道的抗干扰性。但在第一批改进的MPU电源控制板上车实验,通过切断MPU1和MPU2断路器实验冗余功能,试验中发生当一组MPU电源断路器断开后,另一组MPU有时不启动的问题。主要原因是MPU控制电源板上的C3电容容量大造成启动电流偏大,后将C3电容容量由原来的100 μF更换为33 μF,启动电流降低了1/4,且不影响MPU正常启动,MPU电源断路器断开后可再正常闭合,具体电路如图5所示。
图5 电源隔离模块改进图
图4 改造前后的电路板
通过优化,目前改进的MPU电源控制板能够更好地保证机车的正常运用,HXD2机车的微机控制单元MPU的冗余功能可靠性得到大幅的提高,为机车的安全运用提供了可靠的保证。
本文主要针对HXD2机车微机控制单元MPU在运用中出现的问题,从MPU内部电路设计方面着手,进一步使得MPU的冗余功能可靠性得到大幅的提高。