李亚群,包云,韩霈然,杨建伟,陈中雷
(1.北京经纬信息技术有限公司,北京 100081;2.中国铁道科学研究院集团有限公司 电子计算技术研究所,北京 100081;3.北京交通大学 交通运输学院,北京 100044;4.中国铁路北京局集团有限公司 工务部,北京 100860)
高速铁路灾害监测系统(简称:灾害监测系统)实时监测铁路沿线风、雪、雨等自然灾害及异物侵限,当监测值超过报警预警阈值时进行报警和预警,发生异物侵限和地震报警时,进行紧急处置,保障列车运行安全[1-2]。灾害监测系统为高速列车在灾害性天气和突发事件下的运行发挥了重要的安全技术保障作用。灾害监测系统由现场监测设备和中心系统组成,现场监测设备包括风速风向计、雨量计、雪深计、数据传输单元等现场采集设备和监控单元,部署于铁路沿线接触网杆、基站等处所;中心系统包括信息处理平台、监测业务终端、网络设备、网络安全设备,时间同步设备及其软件等,部署于铁路局机房。灾害监测系统构成复杂,任何一个环节均可能导致系统故障的产生。
目前,已开展的高速铁路灾害监测故障、可靠性分析工作中,张翠兵[3]运用故障树分析法对异物侵限监测子系统故障进行了分析;周绍华[4]重点对异物侵限监测子系统产生红光带故障处置措施进行了研究;刘岩、李晓宇等人[5-6]对灾害监测系统可靠性进行了研究;王娇娇等人[7]对灾害监测系统脱离监控故障数据进行了分析,并提出了改进措施与建议;周小明[8]对沪宁城际灾害监测系统电源故障进行了分析;李亚群等人[9-10]对监控单元设备可靠性进行了试验研究,并建立了时齐泊松过程模型对异物侵限监测系统可靠性进行了试验。以上研究多是对灾害监测系统故障、可靠性的分析,而关于灾害监测系统故障诊断方法的研究尚不多见。开展灾害监测系统故障诊断方法研究,可及时解决灾害监测系统出现的问题,降低故障影响程度。目前,常用的故障诊断方法有回归分析、神经网络、支持向量机、随机森林等算法[11-13],本文结合灾害监测系统设备状态及故障监测数据特点,采用随机森林算法对灾害监测系统进行故障诊断,辅助故障快速定位和处置。
灾害监测系统是一个复杂的系统,设备管理涉及多个专业,包括工务、电务、信息等;设备类型多、环节多、管理部门多,一旦发生故障,排查困难,各部门协调工作量大,严重时会影响线路正常运行。灾害监测系统设备管理分工,如图1 所示。
图1 高速铁路灾害监测系统设备管理分工
(1)信息专业设备有铁路局集团公司中心系统软/硬件设备,包括信息处理平台、监测业务终端、网络设备和网络安全设备,时间同步设备等;
(2)信号专业设备有监控单元至信号机房之间的电缆、电务段监测维护终端及信号系统侧的灾害监测系统接口设备;
(3)通信专业设备有监控单元及配套网络设备、现场采集设备至监控单元之间的光缆或电缆、灾害监测系统专用配电箱、通信段监测维护终端等;
(4)工务专业设备有现场采集设备、工务段监测维护终端等;
(5)供电专业设备有监控单元端子排(不含)至变电系统之间的设备。
目前,灾害监测系统对设备状态监测的数据是离散的,监测设备是否正常工作一般采用0 或1 变量表示,因此,无法采用回归分析方法开展对设备状态的分析。本研究基于失效模式与影响分析(FMEA,Failure Mode and Effects Analysis)对设备故障数据进行分析,在此基础上,研究设备故障诊断的方法。根据对灾害监测系统故障的调研结果,构建了基于FMEA 的灾害监测系统故障分析表,故障分析表包含12 类设备,45 种故障原因。以监控单元为例,基于FMEA 的监控单元故障分析,如图2 所示。
图2 基于FMEA 的设备监控单元故障分析
监控单元故障分为严重故障和一般故障。严重故障会导致监测点失效,需派人进行人工值守并安排天窗点维修,一般故障需等待天窗点维修。
本文采用随机森林算法对灾害监测系统进行设备故障诊断。其原理为:采用Bootstrap 重抽样方法[14]从原始样本中抽取多个样本,对每一个样本建立分类和回归树(CART,Classification And Regression Tree)(统称:决策树),将这些决策树进行整合,构成随机森林模型。基于随机森林算法的灾害监测系统故障诊断流程,如图3 所示。
图3 基于随机森林算法的灾害监测系统故障诊断流程
(1)对灾害监测系统故障数据进行预处理,通过设备状态、故障数据、故障表现和故障原因,结合故障分析表进行故障分析。其中,灾害监测系统故障原因是决策类别,故障现象是特征属性。
(2)通过Bootstrap 重抽样方法抽取灾害监测系统故障数据。采用训练节点分裂规则对故障现象进行排序,得到各个节点的特征属性;再根据特征属性的不同值,从该节点向下分支,选择最优决策树(分支)个数,最终构成故障诊断随机森林模型。
(3)采用构成的随机森林模型对新的故障数据进行分类和诊断,得出故障原因,辅助设备管理部门快速定位故障。
本研究共收集到多条线路灾害监测系统故障样本403 条,将所有数据的70% 作为训练集,其余30%作为测试集,采用python 编程语言构建基于随机森林算法的灾害监测系统故障诊断模型,同时,设计基于传统决策树(C4.5 决策树)算法的灾害监测系统故障诊断模型,将其作为对比方案。诊断结果,如表1 所示。由表1 可知,基于随机森林算法的故障诊断效果明显优于基于C4.5 决策树算法的故障诊断效果,可减少人工排查设备故障的工作量,提高工作效率。
表1 故障综合诊断结果
对灾害监测系统具体构成部分进行故障诊断,以监控单元和风采集设备的故障诊断为例,获得监控单元样本225 条,故障原因10 种,故障表现13 类;风采集设备样本59 条,故障原因11 种,故障表现4 类。对监控单元和风采集设备2 个数据集的分类器个数进行判断,以监控单元的数据为例,基于训练集构建的决策树个数与判断准确率关系,如图4 所示,可以看出,最优决策树棵数在10 以内达到最优的准确性,基于此,构建灾害监测系统故障诊断随机森林模型。
图4 监控单元随机森林决策树个数与判断准确率关系
对监控单元和风采集设备的基于随机森林算法和基于C4.5 决策树算法的故障诊断方法分别进行k折交叉验证,即将全部样本划分成k个大小相等的样本子集,依次遍历这k个子集,每次把当前子集作为验证集,其余所有样本作为训练集,进行模型的评估,评估结果如图5 所示,从图5 中可以看出,随机森林算法的表现明显优于C4.5 决策树算法,诊断结果如表2 和表3 所示。
表2 监控单元故障诊断结果
表3 风采集设备故障诊断结果
图5 监控单元和风采集设备故障诊断k 折交叉验证结果
由表2、表3 可以看出,对灾害监测系统构成局部设备故障的诊断效果优于对系统整体故障的诊断,原因在于灾害监测系统故障成因和现象复杂,一个故障现象可能由多种原因导致,如灾害监测系统脱离监控故障,可能是由网络、硬件故障(电源、服务器、终端等)、软件故障等多种原因导致[7];一个故障原因也可能出现多个故障现象,如风速风向计故障可能导致设备故障报警、监测终端无采集数据等;而风采集设备的故障及故障原因相对系统整体故障成因和现象较简单。
针对灾害监测系统故障诊断问题,构建了基于FMEA 的灾害监测系统故障分析表;在此基础上,提出了基于随机森林算法的灾害监测系统故障诊断方法。
(1)实际数据分析表明,基于随机森林算法的灾害监测系统故障诊断方法对系统故障的诊断准确率为67.3%,优于基于传统决策树的故障诊断准确率(48.5%);
(2)基于随机森林算法的灾害监测系统故障诊断方法对监控单元和风采集设备的诊断准确率为80.6%和86.7%,优于基于传统决策树的故障诊断准确率(48.2%和66.4%);
(3)基于随机森林算法的灾害监测系统故障诊断方法可有效提高灾害监测系统设备故障诊断准确率,有助于灾害监测系统设备故障的快速定位和处置,大幅减少人工排查设备故障的工作量,为灾害监测系统的运营维护提供技术支持。