李 刚,卢佩玲
(1.中国铁道科学研究院 研究生部,北京 100081;2.中国铁道科学研究院集团有限公司 通信信号研究所,北京 100081;3.中国铁道科学研究院集团有限公司 国家铁路智能运输系统工程技术研究中心,北京 100081)
近年来,我国高速铁路快速发展,大量具有自诊断功能、高技术含量的信号系统应用于铁路运营线上。与此同时,随着高速铁路运用规模的逐渐扩大、运行速度的不断提高,高速铁路信号系统也已经从保障高速铁路安全高效运行,拓展到多层域状态智能感知、系统协同控制、安全态势评估、大数据融合与智能维护、行程智能引导等前沿技术与应用领域[1-3]。此外,随着分布式计算、4G/5G 通信、大规模数据并行处理[4]、深度学习[5]、3D 建模、高精度地图、模拟仿真、虚拟现实、智能控制等计算机通信与智能相关技术的加快集成,建设基于数据驱动的信号智能运维系统成为可能。因此,从高速铁路信号智能运维系统架构、关键技术、系统功能等方面对基于数据驱动的高速铁路信号智能运维技术进行研究。
为构建适用于高速铁路的信号智能运维系统,要解决数据汇集、数据存储、数据分析、数据应用和数据展示等问题。信号智能运维系统架构如图1 所示。
图 1 信号智能运维系统架构Fig.1 Architecture of the intelligent signal operation and maintenance system
接入信号智能运维系统的数据源,主要包括检测监测数据、检修维护数据、生产作业数据和公共信息数据。检测监测数据主要包括计算机联锁、列控中心、信号集中监测等信号系统/设备数据;检修维护数据主要包括信号技术履历、器材入所检修和日常维护检修等数据;生产作业数据主要包括作业卡控和调度生产指挥等数据;公共信息数据主要包括气象和产品认证等数据。
数据汇集是对各类数据按照接口规范进行归并与收敛,确保数据格式符合要求,数据质量可知、可控,并完成数据清洗、抽取、转换及相关的数据治理,为后续数据分析提供标准化、规范化、可解析的数据。
数据存储是将经过数据汇集处理后的数据,按照关系型数据、非关系型数据、分布式文件数据等类型分类存储,为后续数据分析奠定基础,该存储方式具有横向扩展能力强及支持快速访问的特点。
采用大数据分析、逻辑分析、聚类分析和回归分析等分析方法,采用内存计算、云计算、流计算和分布式计算等计算方法,对信号设备相关的各类数据进行综合分析和计算,为电务专业用户在数据分析层面的各项应用提供支撑,可以实现电务专业定制化数据分析。
以数据分析为依托,以实现设备状态智能化分析、故障处理智能化定位、设备健康智能化管理、检修维护智能化辅助、应急处理智能化支持和作业过程智能化卡控为目标[6],为用户提供设备综合监测、全生命周期管理、智能故障诊断、综合运维分析、生产作业管理、应急调度指挥、设备故障预测与健康管理(Prognostics and Health Management,PHM) 和车地一体化分析等多个应用功能。
数据展示是按照用户的需求对数据进行多维度可交互可视化展现,能够以线路、二维/三维图形、网络拓扑、地理空间等方式进行可视化呈现,能够适配不同显示终端,满足电务专业各类用户在展示层面的各项需求。
由图1 可知,接入到信号智能运维系统中的信号系统有很多,接入的数据类型也多种多样,既有结构化数据,也有半结构化和非结构化数据,如何将这些数据融合到一起,是信号智能运维系统要解决的首要关键问题。
数据融合是将带有一定冗余性质的数据,在一定的理论基础上进行合并的过程,目的就是用高效率低成本的方式将信息综合起来,这样就对接下来的状态的态势有了预估[7];数据融合是针对各信号系统中不同时间(采集间隔)和空间(不同部位) 维度的数据,分析其多源异构的信息特征,包括广域空间( 位置) 标识、事件标识、连续或离散性质、传输特性等,从各类数据中挖掘趋势信息。在各个时间维度下的数据采用去噪、剔冗余、解耦和特征提取等算法;在各个空间维度下的数据采用分类、聚类及相关性分析等方法。采用联邦数据库系统和数据仓库法进行数据融合。
道岔是转换列车运行径路的重要信号设备,因其频繁转换的特点,也是最容易发生故障的设备。考虑从道岔动作曲线入手,以数据为驱动,对标准模板曲线选取和曲线拼接及建模识别2 项技术做重点研究[8]。
2.2.1 自动选取标准模板曲线
首先采用动态时间归整(Dynamic Time Warping,DTW) 算法为每台转辙机的每个动作方向自动选取一条标准模板曲线,DTW 算法是衡量2 个长度不同的时间序列之间的相似度的一种算法,采用DTW 算法既可以解决欧式距离对数据对称性的要求,又可以避免曲线噪声对比较结果的影响。DTW 曲线相似度对应点选取过程示意图如图2 所示。
图2 中给出了某个转辙机的2 条动作曲线,从形态上来看这2 条动作曲线是相似的,图中给出的是2 条曲线的最小包络路径。用DTW 算法自动选取标准模板曲线过程如下。
从某台转辙机的同一个动作方向的历史动作电流曲线中任取2 条,设其时间序列分别为A= {a1,a2,…,am}和B= {b1,b2,…,bn},则存在一个局部距离矩阵Dm,n,计算公式为
式中:Dm,n中第i行,第j列的元素在下文表示为D(i,j),||ai,bj||表示2 个点之间的欧式距离。经典的DTW 算法的核心思想是通过Dm,n找到一个最小的累计包络距离Dist(i,j),计算公式为
其中,Dist(i,j)表示转辙机动作曲线的反向包络距离。算法可以归结为寻找一条通过转辙机动作曲线中若干序列点的路径,路径通过的序列点即为2 个序列进行计算的对齐的点。对于每台设备,通过DTW 算法计算出各条动作曲线之间的反向包络距离,选取其中与其他所有动作曲线包络距离最小的曲线作为此设备的标准模板曲线。
2.2.2 曲线拼接及建模识别
每次转辙机动作会产生1 条功率曲线和3 条电流曲线(A,B,C)共4 路数据,实际应用中,转辙机动作时间约为5 ~ 10 s,以每秒25 个点的采样间隔对其采样,得到大约250 个点数据。但是,当转辙机动作异常或连续扳动时曲线延续时间可以达到30 s 之多,为了提高训练和识别的精确度,对每路数据,取其前800 个点作为有效数据,这样转辙机每次动作就会得到4×800 个数据,再与其对应的标准模板曲线数据(也是4×800 个数据)一起转换成矩阵形式,作为训练和识别的输入,曲线拼接示意图如图3 所示。
拼接完成后,曲线数据就变成80×80 的伪图片数据,作为特征被输入到卷积神经网络中去进行学习,通过深度学习的方法,自适应地学习实时道岔动作曲线与标准模板曲线之间内在的联系,从而建立分析模型,使用该模型对实时动作曲线进行识别,识别完成后将输出曲线状态(正常或异常),并给出曲线故障概率。此方法可避免传统的通过人工设置阈值实现故障诊断引起的模型“水土不服”问题,相比于专家系统,此模型具有更强的适应性,可以保证算法在不同使用场景下的健壮性。
图 3 曲线拼接示意图Fig.3 Curve splicing
轨道电路是保障铁路运输安全的重要基础装备,其主要承担列车完整性检查及列车运行控制信息传递等功能,轨道电路一旦故障将会对正常运输秩序造成影响。轨道电路的类型主要有ZPW-2000移频轨道电路、交流连续式轨道电路、25 Hz 相敏轨道电路等,研究以ZPW-2000 移频轨道电路为例,实时不间断地分析其主轨、小轨电压数据,结合站场信息建立轨道区段的链接关系,分析相邻轨道区段的电气关联性(物理位置关系、时间维度关系),通过对轨道电压曲线的分析,及时发现故障隐患,减少因轨道电路故障对行车造成的影响,同时也可以减少因判断错误引起的错误报警。
设备状态是通过各个传感器的模拟量或开关量值体现出来的,在时间维度上就会形成有规律的波形,因而波形状态的提取是区分设备状态的关键步骤,而建立相邻轨道序列是轨道分析的基础,也是轨道分析模型的训练基础。轨道电压曲线分析流程如图4 所示。
从图4 中可以看出,在分析过程中首先需要有大量的历史数据,如果是新开通车站,在初始阶段没有运行数据,则需要系统运行一段时间累积一定量的数据才能进行分析,或者运用相关轨道类型的历史数据训练好模型,然后使用训练好的模型进行分析。从大量历史数据中提取特征,建立轨道电路特征库,随后对时间相关性进行分析,接下来开展线性回归测试,进而建立轨道电路的预测模型。有了预测模型之后就可以开展预测工作了,在这过程中可能需要人工干预,以保证模型的准确度,人工干预后还需进行回归测试。在分析的过程中还需要纳入相关设备的数据,如信号机状态数据、环境温湿度数据等,用以帮助改善训练模型。这是个周而复始循环的过程,随着历史数据的增多,模型会随着分析过程动态调整,预测的准确度也会不断地提高。
图 4 轨道电压曲线分析流程Fig.4 Analysis process of the track voltage curve
高速铁路信号系统采用了许多新技术、新工艺,数字化、信息化程度很高,具有很好的PHM[9-10]技术应用基础。应用PHM 技术,不仅能监测和诊断信号设备故障,还能提前预测故障的发生,从而在系统故障之前及时采取安全容错管控手段或维护措施,进而实现防患于未然。利用各信号系统的自诊断信息、信号集中监测采集到的信息,PHM 能够实现从板卡/ 模块到部件到设备再到系统的不同层级、不同级别的综合诊断、预测和健康管理。与传统的局部信息预测不同,PHM利用获取到的信息,提取各信号设备/ 系统的特征参数,并对这些特征参数进行信息关联,运用算法和模型对特征参数及关联信息进行分析,从而实现系统或设备的工作状态管控。PHM 一般具有故障检测、隔离、诊断、预测、健康管理和寿命追踪等功能。故障预测与健康管理模型如图5所示。
图 5 故障预测与健康管理模型Fig.5 PHM model
2.4.1 关键参数挖掘
信号系统/设备的监测数据多维度、数据量极大,因而为每一设备或系统抽取关键评估参数和指标而排除冗余信息具有重要意义。关键参数和指标的选取应具有代表性、独立性和可行性,要遵循互补且不相互交叉的原则。
2.4.2 故障识别与诊断
由于在用的信号系统/设备是不能进行老化试验的,因而进行故障识别依赖于故障历史数据和报警信息的收集,再根据这些信息构建适用的诊断模型,来给出故障原因分析和维修策略。历史数据充分、模型适当才能得到很好的识别与诊断结果。
2.4.3 维修策略
维修策略的推断更依赖于智能诊断和历史数据,利用智能诊断和FMEA 表单描述已经发生或者可能发生的故障,类似互联网行业中常常根据用户的使用习惯和浏览足迹对用户做“用户画像”,需要根据先验数据对故障做“故障画像”,之后基于故障识别与分类结果,劣化模型建立结果,利用贝叶斯网络或隐马尔可夫链等智能算法对故障做推理和诊断。
2.4.4 健康状态评估
(1)计算健康偏离程度。设备出厂时都会标注运行时的标准参数,但设备实际运行中由于存在环境干扰或者设备老化,会出现运行参数基于出厂标准的上下浮动。为直观、定性地描述这种浮动,可以依据欧氏距离、马氏距离等算法估计运行状况偏离正常状态的程度,从而可以跟踪描绘设备的退化过程[11]。
(2)建立健康评价指标。健康偏离程度是以定性的方式对系统/设备的运行状态进行判断,有些判断依据没有统一的标准,多以工程人员经验为准。为定量、标准化地描述设备或系统健康状态,需要建立健康评价指标。
(3)劣化模型建立与剩余寿命预测。信号系统/设备衰退的过程大体上可以分为2 个阶段:①常状态阶段。系统或者设备的性能相对稳定,变化幅度在较小的范围内波动。②退状态阶段。系统的性能加速退化,但尚未失效。劣化模型的建立需要基于设备上述2 种状态下的监测数据收集,并且需要系统判定属于哪种退化阶段。
信号智能运维系统在功能设计上,要考虑日常测试检修、日常生产作业和应急抢修3 种应用场景,为此系统设计了设备综合监测、全生命周期管理、智能故障诊断、综合运维分析、生产作业管理、应急调度指挥、设备PHM 和车地一体化分析等功能。根据运营维护的需要,后续还可以扩展相应的功能。
实时监视车载和地面信号设备的工作状态,并集中显示各信号设备状态信息、业务信息和管理信息。可以全线或单站等多种方式展示,对同一设备的不同特征进行关联展示。
利用各信号系统上传的各项数据指标实现对信号设备的全生命周期管理,保证设备健康、高效、低成本的运用,创造显著的能源、备件、人力、时间的节约效益,实现精细化管理。
智能故障诊断主要实现:①对信号各子系统间关键数据进行比对;②对信号设备进行智能诊断,在设备存在隐患时,提前发现设备隐患;在设备故障时,能诊断定位故障范围及原因;③对存在内在联系的事件进行综合统计及预测分析,以辅助监督电务设备运行正常。
综合运维分析提供的主要功能如下。①整合分析:对存在因果、从属和归并关系的报警信息进行整合,并给出根源性的报警,减少无效报警,便于现场人员快速定位故障点。②质量分析:根据监测数据,可按单个设备、同类设备、车站/线路来生成质量评价指标,为设备维护提供参考依据。③同比环比分析:在设备报警类别、报警原因、报警数目及管界范围等方面,对同比与环比2 类指标进行对比分析和趋势分析,并生成可视化图表供分析人员进行分析。④辅助人工分析:根据人工设置的波动范围等分析参数,自动筛选满足条件的监测数据,为现场用户提供有针对性的调阅,提高人工分析效率。
通过系统可以实现作业任务单自动下达,作业内容自主可查看,作业结果自动提交,能够实现对作业任务全过程的闭环监督。
应急情况下,能够实现备件、技术资料、人员及交通工具等信息的快速协同。通过系统能够快速定位到故障点或故障范围,通过智能故障诊断分析确定故障原因,通过系统可以快速关联相应的应急线路、技术人员、应急保障车辆、备品备件及技术资料等信息,通过系统下发应急调度单,并可以通过视频指挥现场进行应急处理。
采用故障预测与健康管理技术,对信号机、道岔、轨道电路等轨旁基础设备,对计算机联锁、列控中心等基础控制设备,进行故障预测和健康状态评估。能够按单个设备、同类设备、车站3 个维度给出健康度,以图表、曲线等展示方式直观给出设备所处的健康状态及剩余寿命情况。
综合运用车载和地面信号状态、报警等信息,进行实时分析和集中监督,对发生的信号设备故障进行精准定位,对故障所涉及和影响的信号设备工作状态,进行全程跟踪和不间断分析,从而实现车地一体化运维。
智能高速铁路已成为全球铁路的前沿发展方向,以数据为驱动,综合运用智能分析、故障诊断、设备健康状态评估等技术,使信号设备时刻处于可监督、可管控状态下,从而实现高速铁路信号的智能运维,也是顺应了这一发展方向。随着高速铁路建设规模的不断扩大,实现信号设备的智能运维已成为电务维护人员的迫切需要。电务部门积累了大量高速铁路信号监测检测、运营维护等数据,但数据还比较分散,数据的综合效能还没有发挥出来。以数据为驱动,深入挖掘数据的价值,发现数据内在规律,实现信号设备全生命周期管理,提高信号设备的可靠性、可用性,减少信号设备故障对铁路运营的影响,保证旅客快捷、安全出行,是下一步需要深入研究的方向。