马志明
(中车大连电力牵引研发中心有限公司,辽宁 大连 116085)
工业大数据的数据挖掘模式是指在工业及制造业中,应用数据产生数据价值的过程。而伴随着网络信息、数据融合、数据挖掘等技术的发展,以及复杂大系统运营维护的日趋精准化、智能化的需求,大数据的应用将具有重要意义。
我国的高铁技术同样也是制造业应用的关键点,高速铁路建设以及运行里程均为世界第一。列车运行维护中,产生了海量的数据内容,这些数据成为了动车组大数据运维的基础数据。动车组列车运行维护是一个复杂的系统工程,目前我国对动车组列车运行维护策略主要有计划性的检修维护、反应式维护、基于状态数据的维护等,这几种方式会造成维护过度、成本高等缺点。而结合运维大数据应用技术,不但会降低成本,避免过度维护,同时会使维护精准化、高效化,这将为动车组的精准维护和健康管理提供准确的依据。
相比较于传统的运行维护技术,智能运维技术运用数据融合、数据挖掘、网络信息平台等技术实现数据分析和决策输出,进而达到系统健康预测和管理的目的。从智能运维平台架构上来说,智能运维平台主要可以抽象成数据采集层、数据汇聚层、数据存储层、建模应用层、分析学习层、应用反馈层。这是目前理想的层次划分,但在实际的智能运维实践过程中,需要依据硬件设备条件及时地做出调整。智能运维平台的数据维度主要涵盖时间维度、空间维度以及系统级别维度等。运维数据时效性较强,并且往往出现多维度数据之间出现割裂采集的现状。如何在后续的建模过程中体现多维数据之间的高度关联,成为了智能数据运维平台的应用关键点。
对于动车组的运行维护来说数据挖掘技术主要是在基础运维平台的数据挖掘过程涵盖数据清洗、数据集成和转换,以及数据归纳。通过数据预处理,能够有效去掉数据中的噪音,纠正不一致的数据;数据归纳可以通过合并、删除冗余特征或聚类来压缩数据。
图1 动车组运维大数据平台多层级技术结构
在智能运维的算法集成系统中,依据不同的算法场景来适配不同的场合,依据不同的特征模式选择合适的算法。在这个过程中主要是根据阈值来判断数据模型的准确性,来达到实际的最优效果。算法的集成水平成为了挖掘内容的重要依据,智能运维是一项系统性的工程化过程,需要结合算法、算力、数据,以及平台自身与业务系统之间的回馈过程。
通过对动车组进行分段处理,能够结合各种接口技术实现数据的无缝衔接和处理。并在能够在动车组的运行和检修的过程中,构建好动车组运行和维护的基本数据库。并且结合已有的数据平台内容,充分发挥动车组大数据分析的基础性应用和基本作用。主要涵盖:历史能耗数据的动态分析、动车组的故障分布情况以及能耗影响因素的相关性分析。最终依据数据内容对动车组的综合质量进行评价实现典型故障的分析。并且依据预测数据分析内容实现动车组运行数据的综合质量评定。进而为动车组的智慧化运维提供有效的数据依据。平台的设计主要涵盖以下几方面的内容:
(1)数据收集。在这个过程中需要全面的收集动车组实际运行的基本故障数据以及车辆的信息数据。并且为故障数据的评定提供统一的数据标准。为全生命周期内的管理故障评定设定底层标准。
(2)数据挖掘分析。根据各个板块的数据内容,使用多层次、多维度的故障诊断信息对数据进行综合评定。并且实现数据分析的动态化结果。
(3)数据建模。通过数据挖掘实现动车组运行数据的综合建模。进而建立故障数据的动态模型库。能够实现阈值预警和过保预警等内容,进而对动车组的突变型故障以及隐性故障进行综合评定。
(4)大数据应用。以动车组为基本单位,能够对动车组的运行故障进行纵向的综合评定。进而量化了动车组的运行状态。尤其是对动车组在运行的过程中,可能出现的基本问题进行预警分析。实现动车组健康大数据的综合评定。其大数据平台的耦合层级结构如图1所示。
同时从数据层面上来说,数据架构的层次结构主要有以下几个内容为主:
(1)数据获取层。在这个层面中主要是根据动车组的工业运行大数据进行综合采集。这些数据的来源主要是根据关键的运行部件、以及设备的运行状态参数。这个过程可以由检修的工作人员或者是随车的机械师进行手工录入,也可以是由数据采集设备对各类部件的运行参数进行采集而来的。
(2)数据存储层。主要是根据各项采集来的数据内容进行统一标准和统一管理的形式进行存储。
(3)数据处理层。主要是根据采集得到的数据进行分析总结和归纳,并且在这个过程中依据故障的规律得分析预测的结果。传感器数据是依据智能运维的物联网平台进行数据传输和数据计算得到的。在这个过程中可以是有线的数据平台也可以通过局域网络进行数据传输。尤其是对于数据的在线抽取和数据转换之间,能够有很好的数据特征提取关系。实现多元数据的相关性拟合。
(4)运维决策层(数据展示层)。这部分层面需要有效的将得到的数据进行可视化的展示。供向管理人员进行科学的决策。结合历史数据和相关性数据(天气数据、地理位置参数数据以及结构特点)。基于统计学模型的方法和基于数据驱动的方法来建立故障诊断和预测模型。对故障诊断层面的数据量化和故障水平进行预测。
(5)健康状态评估层。通过对故障诊断预测完成之后,对于剩余寿命进行评估。综合的评判部件、设备以及车辆的基本参数。尤其是对于计算量较小的参数需要在综合系统内进行综合评估。对于计算量较大、复杂的体系需要在地面评估系统中依据云平台进行综合评估。
(6)可视化层。根据评估的数据结果,通过EChart平台展示在web图表中。有效的转化成为二维的静态图像。数据结果展现形式更加直观。
(7)维修决策层。通过数据展示情况,基于专家组以及有经验的工程师的经验对部件的使用寿命进行联合预测。并且依据故障水平程度和健康登记联合提出能够实现的维修计划。
综合以上,数据平台搭建、数据采集与传输、数据汇聚、存储与建模、数据计算、AI体系化、场景与工程化融合等方面均提出了极其苛刻的要求,需要更专业的、更高质量标准的运维数据库,还需要一支强有力的分析、架构和开发团队支撑,才能真正实现智能运维中大数据的应用价值。
目前,我国正线运营的动车组形式非常多,同时与之相匹配的动车组检修技术非常全面。其间产生了许多宝贵的监测和检修数据,而我们对数据资源的应用还仅仅处于探索阶段。本文针对动车组运维大数据的相关应用考虑了一些能够实现的基本形式,给出了一些设计思路,以实现数据诊断分析和故障预测,为动车组的故障预测和健康管理提供有效的技术基础。