基于WEKA的信号设备预测性维护信息系统

2016-02-15 09:57:10赵晓峰
铁路计算机应用 2016年1期
关键词:预测性数据挖掘信息系统

赵晓峰

(上海富欣智能交通控制有限公司,上海 201210)

基于WEKA的信号设备预测性维护信息系统

赵晓峰

(上海富欣智能交通控制有限公司,上海 201210)

信号设备预测性维护信息系统主要是对信号系统的各子系统维护信息进行数据挖掘,结合系统可靠性、可用性、可维护性分析结果,制定预测性维护策略,定义故障信息收集模板,提供基于自由软件WEKA的预测性维护方法,使用软件集成的开发方式,建立数据挖掘的分类、聚类、关联模型。这种方式既有助于缩短开发周期,也能够有效降低软件成本。

预测性维护;自由软件;数据挖掘;分类;聚类;关联

预测性维护是以状态为依据的维修,在设备运行时,对其主要部位进行状态检测和故障诊断,判定设备所处的状态,并能预测设备未来的状态趋势和可能的故障模式,从而制定出预测性维护计划。

怀卡托知识分析环境(WEKA)是一款使用Java语言编写的面向机器学习和数据挖掘的综合工具平台,获得了GNU通用公共许可认证,为自由软件,包含一系列可视化工具、数据分析算法以及建模技术,支持数据预处理、聚类、分类、回归、可视化和特征选择。

1 预测性维护信息系统需求

应用于城市轨道交通信号系统的预测性维护信息系统是在实时监督和收集运营相关各子系统状态和报警数据的基础上,经过大量数据挖掘和知识分析,同时辅以资产管理和办公自动化等工具,提供更准确的预防性维护计划和建议,有助于降低和减少纠正性维护发生的概率和造成的危害,并为整个信号系统可靠性、可用性、可维护性(RAM)指标的验证提供依据。

预测性维护信息系统数据收集的范围包括计算机联锁(CI)、区域控制器(ZC)、车载控制器(VOBC)、列车自动监控(ATS)、数据通信系统(DCS)的内部和外部数据,以及列车位置检测设备、道岔、信号机、有源信标、站台屏蔽门、站台紧急按钮等轨旁外部设备的状态和故障信息,车辆、速度计、加速度计、雷达传感器、信标应答器、司机显示器等车载外部设备的状态和故障信息。

预测性维护信息系统经过数据挖掘和知识分析后,会生成纠正性维护和预防性维护的计划。其中,纠正性维护需要维护人员在预测故障发生前尽快执行;预防性维护主要包括轨旁和车载设备的日检、周检、双周检、月检、季检、半年检、年检具体内容的增加或更新。

根据EN50126标准要求,城市轨道交通信号系统应进行RAM评估,提交RAM分析报告和定量安全风险分析报告(QRA),尤其是计算机联锁、区域控制器、车载控制器等SIL4的子系统。表1给出了主要信号设备的RAM参考值。

表1 信号设备RAM参考值

2 预测性维护信息系统架构

预测性维护信息系统主要由数据采集、数据清洗和数据应用3大功能模块构成,如图1所示。

图1 预测性维护信息系统架构

数据采集模块是对信号系统主要子系统的状态和报警进行收集,包括ATS、DCS、计算机联锁、区域控制器、车载控制器、微机监测等,不同子系统的数据格式可能不同;数据清洗模块是对不同格式的数据源进行格式化,检查数据一致性,处理无效值、缺失值和重复值,并存入预测性维护数据库;数据应用是以维护数据库为核心,根据故障处理方式的不同,分为3类:(1)基于故障定位的维修工单子模块,主要辅助解决纠正性维护任务;(2)基于故障统计的RAM管理子模块,实现长期数据的分析,为轨道交通维护和建设指标提供参考;(3)基于故障预测的维修计划子模块,主要辅助持续更新预防性维护任务,并围绕系统外的维修因素—人员和备件进行综合管理。

城市轨道交通运营单位一般会在信号系统开通后增设维护支持系统,主要是完成对轨旁信号设备的微机监测和机房环境监测,所以在构建预测性维护信息系统时,应支持独立工作和软件集成两种运行模式。WEKA的Simple CLI和Knowledge Flow功能环境可以很好地实现这两种方式。其中,Simple CLI提供一个简单的命令行界面,可以把模型保存下来,这样有新的待预测数据出现时,不用每次重新建模,直接应用保存好的模型即可。此外,对预测结果给出置信度,用户可以有选择地采纳预测结果。Knowledge Flow环境提供数据的预处理,数据格式的转化,各种数据挖掘算法,并提供结果的可视化工具,还可以让用户创建、运行、修改和分析算法试验,比单独分析各个算法更加方便。

3 预测性维护信息系统实现

下面从数据挖掘不同模型的角度详细描述预测性维护信息系统核心功能的实现。

3.1 分类模型

分类是通过分析训练集中的数据,为每个类别建立分类模型,并用该模型对数据库中的其他记录进行分类。常用分类算法有贝叶斯(Bayes)、决策树(Decision Tree)等。

如图2所示,左侧是各个子系统的维护数据,CBI、ZC、VOBC主要是从诊断维护端口送出的内部状态和报警,以及各自嵌入式子系统的运行日志;计轴(Axle Counter)主要是内部串口版和并口版的工作状态信息;ATS主要有数据库Data Logger存储的信息,以及计划和实际时刻表;DCS主要有数据记录器(Data Recorder)抓取的网络通信数据包,以及各交换机和防火墙的运行日志。经过数据预处理后,通过类指定器(Class Assigner)标明决定分类的属性,再使用交叉验证模块(Cross Validation Fold Maker)分配训练集和测试集,然后就可以对数据集进行贝叶斯网络(Bayes Net)分类器分析。处理结果通过图形查看器Graph Viewer图形化显示到用户前端,并在通过分类行为评估器(Classifier Performance Evaluator)评估合格后,转存储到预测性维护数据库,同时提供XML扩展接口,便于大数据的二次开发。

信号系统维护信息的分类主要是依据故障发生时间、地点、子系统等进行处理,同时考虑系统外部和内部的接口特性,并在大量数据积累基础上对故障等级进行细致处理。因此,当发生故障时,须全面记录从故障发生时刻到设备恢复正常时刻之间的各项信息,以便后续利用预测性维护信息系统进行分析和总结。表2列举了信号设备故障信息收集模板,其中,每一个数据维度都可以按照不同的分析需要成为数据分类的依据。

图2 信号设备维护信息分类模型

表2 信号设备故障信息收集模板

3.2 聚类模型

聚类是数据挖掘中用来发现数据分析和隐含模式的一项重要技术,其目的是把大量数据点的集合分成若干类,使得每个类中的数据之间最大程度地相似,而不同类中的数据最大程度地不同。常用聚类算法有K方法(K-means)、基于密度含噪声的空间聚类应用算法(DBSCAN)、基于斜面的聚类算法(CLOPE)等。

如图3所示,聚类模型的分析对象主要是经过数据清洗的预测性维护数据库,通过训练集生成器(Training Set Maker)的学习,就可以正式使用DBSCAN算法建立预测模型,该算法是基于密度的聚类算法,从数据对象的分布密度出发,将密度足够大的相邻区域连接起来,从而发现具有任意形状的聚类,并能有效处理异常数据。处理结果通过文本查看器(Text Viewer)以表格形式显示给用户。

图3 信号设备维护信息聚类模型

DBSCAN算法主要用于分析通信故障的相关数据。信号系统中影响行车的通信故障主要有两类:车地无线信号不稳定和定位信标读取失败。城市轨道交通领域中目前大量使用符合IEEE 802.11标准的2.4 GHz无线通信,由于是ISM公共频段,在传输信道中存在很多干扰源。经过大量分析发现,无线信号在地下段主要受隧道参数影响,如:曲率半径、竖曲线半径等;而在地面和高架段主要受外来环境的干扰,如:繁华地段的商用WIFI信号、雷暴日、太阳风等。信标系统是基于RFID技术的列车绝对定位系统,主要有欧标和美标两种制式,通信频段分别是27 MHz和902 MHz。根据现场运行数据分析,信标读取失败故障主要与产品批次和工作环境相关,如:金属异物遮挡信标、道岔区域正线和侧线信标安装位置过近等。

3.3 关联模型

关联规则是当前数据挖掘研究的主要方法之一,它反映一个事物与其他事物之间的相互依存性和关联性。如果两个或者多个事物之间存在一定的关联关系,那么其中一个事物就能够通过其他事物预测到。常用关联规则算法有挖掘关联规则的频繁项集算法(Apriori)、频繁项增长算法(FPGrowth)、Tertius等。

如图4所示,关联模型的分析对象主要是经过数据清洗的预测性维护数据库,通过训练集生成器(Training Set Maker)的学习后,就可以正式使用Predictive Apriori算法建立预测模型,该算法基于Apriori算法,其步骤是:(1)通过迭代,检索出数据库中的所有频繁项集,即支持度不低于用户设定的阈值的项集,利用频繁项集构造出满足用户最小信任度的规则。(2)通过不断增大规则前项支持度和观察置信度来逐步逼近获得最大预测精度,从而返回最好的关联规则。处理结果通过Text Viewer以表格形式显示给用户。

WEKA-based Signalling Equipment Predictive Maintenance Information System

ZHAO Xiaofeng
( Shanghai Fuxin Intelligent Transportation Solutions Co.Ltd.,Shanghai 201210,China)

Signaling Equipment Predictive Maintenance Information System was used to implement data mining for maintenance information of subsystems in signalling system,combine with reliability,availability,and maintenanceability analysis result,set predictive maintenance strategy,defne fault information collection template,provide free software WEKA-based predictive maintenance method,use the method software integrity development,build models of classifers,cluster and association.This method was helpful to shorten development period as well as reduce software cost effectively.

predictive maintenance;free software;data mining;classify;cluster;association

U284.7∶TP39

A

1005-8451(2016)01-0052-04

2015-05-07

赵晓峰,高级工程师。

猜你喜欢
预测性数据挖掘信息系统
企业信息系统安全防护
哈尔滨轴承(2022年1期)2022-05-23 13:13:18
探讨人工智能与数据挖掘发展趋势
基于区块链的通航维护信息系统研究
电子制作(2018年11期)2018-08-04 03:25:54
信息系统审计中计算机审计的应用
消费导刊(2017年20期)2018-01-03 06:26:40
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
基于SG-I6000的信息系统运检自动化诊断实践
一种基于Hadoop的大数据挖掘云服务及应用
网络舆情诱因信息及预测性研判探析
新闻前哨(2015年2期)2015-03-11 19:29:27
词汇量测试对语言水平的预测性的实证研究
基于GPGPU的离散数据挖掘研究