基于卷积神经网络的ZPW-2000R轨道电路运行状态智能识别

2022-07-20 13:09陈洪根李诗宇禹建丽黄春雷
郑州航空工业管理学院学报 2022年4期
关键词:轨道电路灰度图谱

陈洪根,李诗宇,邓 阳,禹建丽,黄春雷

(1.郑州航空工业管理学院 管理工程学院,河南 郑州 450046;2.黑龙江瑞兴科技股份有限公司,黑龙江 哈尔滨 150030)

1 引 言

保障铁路运输安全是实现铁路整体高效运行的基本保证[1]。ZPW-2000R轨道电路是列车运行控制系统的基础设备,主要用于准确判别轨道区段的占用、空闲状态,其中有列车运行时即为占用状态,无列车运行时即为空闲状态。ZPW-2000R轨道电路诊断系统作为ZPW-2000R轨道电路运行状况的集中监测平台,承担着准确判别各轨道区段的调整、分路、故障等状态的预测和诊断功能,对于提升区间设备故障定位准确度,提高设备维护维修效率具有重要作用[2]。然而在实际应用中,ZPW-2000R轨道电路诊断系统对ZPW-2000R轨道电路的运行状态识别目前仍处于传统的电路逻辑判定阶段,其在多种场景下存在误报警、报警延迟等问题[3],从而对设备的维护效率和效果造成重要影响,甚至影响铁路运行效率和行车安全[4]。如何结合智能技术与方法提高ZPW-2000R轨道电路诊断系统对轨道电路运行状态识别的准确性及其效率,是ZPW-2000R轨道电路诊断系统亟须解决的问题。

随着大数据、人工智能的发展,深度学习等利用机器进行学习的分类方法被应用于轨道电路诊断系统的研究当中。例如,王梓丞等[5]构建区间二型神经模糊系统(interval type-2 neural-fuzzy system,IT2NFS),实现对轨道电路故障模式的智能识别;陈姝姝等[6]提出一种基于功率谱熵(PSE)及自适应神经模糊推理系统(ANFIS)进行轨道电路的故障诊断;卢皎等[7]提出一种基于一维卷积神经网络(convolutional neural network,CNN)的轨道电路故障智能自诊断模型。

卷积神经网络作为近年来深度学习算法热点之一,通过构建深层次的网络结构,能够提取目标的深层特征,故卷积神经网络具有强大的分类能力[8],被成功应用于语音处理[9]、字符识别[10]等领域。而且,由于卷积神经网络具有提取图像特征的能力,经常被用于图像识别。例如,熊红林等[11]利用多尺度卷积神经网络对玻璃表面缺陷图像进行识别;Bai等[12]提出了一种基于多通道卷积神经网络(MCNN)结合多尺度裁剪融合(MSCF)数据增强技术对滚动轴承进行故障诊断;苏本跃等[13]基于改进的卷积神经网络对动力下肢假肢运动意图进行识别。数字图像是以二维数组表示的图像,因其具有的数字特性,能被计算机处理。AMAR等[14]基于灰度图建立了轴承故障图谱,并采用神经网络对轴承进行故障诊断。周昊飞等[15]基于灰度图像建立大数据制造过程质量图谱,以精准表达制造过程运行状态,并构建深度置信网络(deep believe network,DBN)对质量图谱进行识别,实现对制造过程的实时监控。上述研究利用灰度图像的黑白灰度值来表达复杂设备的过程运行状态,并取得良好的效果。

在轨道电路的研究中,机器学习、深度学习只涉及故障诊断领域,还未延伸到运行状态识别等其他领域。本文基于深度卷积神经网络,加入了能够表达ZPW-2000R轨道电路运行状态的灰度图像,设计了基于卷积神经网络的轨道电路运行状态智能识别模型,提出了一种ZPW-2000R轨道电路运行状态智能识别方法。

2 轨道电路运行状态智能识别模型

作为ZPW-2000R轨道电路运行状况的集中监测平台,ZPW-2000R轨道电路诊断系统通过诊断主机等设备对每个轨道电路区段的主接入电压、调接入电压等48个变量进行实时监测,并对该区段占用空闲是否正常、占用是否符合行车逻辑进行结果判断。针对电路逻辑判断模式存在的误报警、报警延迟等不足,本文构建的智能识别模型如图1所示。

图1 轨道电路运行状态识别流程

由图1可知,轨道电路运行状态智能识别模型主要由轨道电路运行状态数据获取、轨道电路运行状态图谱构建、卷积神经网络模型构建和运行状态识别与评估4部分组成。

(1)轨道电路运行状态数据获取:获取实地轨道电路设备实时监测数据集,该数据集包含轨道电路运行过程中的多个设备电流电压等信号数据。

(2)轨道电路运行状态图谱构建:由于轨道电路运行过程中涉及多个监测变量,为此,本文设计了轨道电路运行状态灰度图谱,通过图像的灰度级变化可直观表达轨道电路运行过程中多个监测变量的变化。

(3)卷积神经网络模型构建:选择Keras深度学习框架作为构建卷积神经网络模型环境,将灰度图像作为卷积神经网络的输入,将轨道电路空闲状态、正向占用状态和逆向占用状态三种类型作为输出,建立输入图像与运行状态之间的映射关系,构建卷积神经网络模型。

(4)运行状态识别与评估:将训练样本输入神经网络模型中进行训练和验证,得到最优神经网络模型,将测试样本输入训练好的卷积神经网络模型中进行测试,对模型检测轨道电路运行状态分类结果及准确率进行分析与评估。

3 轨道电路运行状态图谱

ZPW-2000R轨道电路由室外部分和室内部分组成,室内部分包括发送器、功放器和防雷模拟网络盘等设备,室外部分包括电气绝缘节、补偿电容和隔离匹配盒等设备。由发送采集器监测发送器、接收器、功放器等设备采集其电压、电流等信号,得到多个监测变量。各种监测变量名称如表1所示。

表1 轨道电路监测变量

假设轨道电路监测数据集包含m个监测变量(记为X1,X2,…,Xm),各监测变量在t时间段内有n个测量值。定义X为t时间段内轨道电路监测变量数据矩阵,则:

将数据矩阵X的各个变量元素进行归一化处理得到X的标准化矩阵并定义为X*,归一化公式为:

将标准化数据矩阵X*中各个元素进行灰度级映射得到灰度图Rx所对应的灰度值矩阵Fx,则:

其中,INT[.]为取整函数;fij为xij所对应的灰度值,0≤fij≤255,当fij=0的时候,表示黑色,fij=255时,表示白色。

矩阵Fx即为灰度图Rx的像素值矩阵,通过构建矩阵Fx,即可形成可直观反映轨道电路被监测设备输出数据在一段时间内变化规律的运行状态图谱。为说明图谱能够有效描述轨道电路运行状态,根据上述灰度图Rx的构建过程,对48个监测变量在列车经过时间段内的过程形成轨道电路运行状态图谱,如图2,并构建相同时间段内无列车运行的轨道电路运行状态图谱,如图3。

图2 有列车运行时轨道电路运行状态图谱

图3 无列车运行时轨道电路运行状态图谱

由图2和图3可知,某变量在图谱上的灰度级没有发生明显变化,则表示该变量的监测值在目标值附近发生微小波动;某变量在图谱上的灰度级有明显的由暗到明或由明到暗的变化时,则表示该变量的监测值发生了较大的变化。

4 卷积神经网络模型构建

4.1 模型理论

卷积神经网络(Convolutional neural network,CNN)是一种基于猫大脑皮层局部敏感性和方向选择性神经元结构的网络模型,这种生物神经网络独特的结构可以有效地降低模型的复杂性和网络学习的参数。传统的神经网络通常由卷积层和池化层提取输入图像特征,然后通过全连接层对上述特征进行分类并输出。卷积神经网络结构如图4所示。

图4 卷积神经网络结构

图像可以直接导入网络输入层,通过卷积层中的卷积核进行卷积,提取、滤波和增强图像特征,然后通过激活函数得到图像高维特征图,卷积公式为:

常见的卷积层激活函数有Sigmoid函数、Tanh函数和Relu函数,由于Relu函数具有收敛速度快、缓解梯度消失以及反映神经网络稀疏表达能力等优点而被广泛应用,公式为:

池化层即下采样层。为了避免由于特征维数过大造成计算量过大,通过池化层对经过卷积操作后的特征图进行下采样来稀疏参数,简化网络结构。池化方法主要为最大值池化和平均值池化,最大值池化是指取池化操作区域中的最大值输出,平均值池化是指取池化操作区域中的平均值输出,池化公式为:

对二维图像特征的所有神经元进行叠加,形成一维特征向量,并将其作为全连通层的输入。在完全连接层次上,每个神经元都与上层特征中的所有神经元相连接,对激活函数求和并进行映射即可得出输出结果。全连接层激活函数通常为Sigmoid函数和Softmax函数,Sigmoid函数通常对应二分类,Softmax函数通常对应多分类。全连接层输出公式为:

式中,f(.)表示全连接层激活函数;wl表示全连接层权系数。

在深度学习领域中,机器学习模型会出现过拟合现象,针对此类问题,Dropout技术被提出并被应用到解决模型过拟合问题。Dropout是指节点丢弃,每个神经元都有一定概率从网络中被丢弃,该神经元不会参与向前传播和向后传播,从而每个神经元都有机会训练而不依赖某个神经元。经过Dropout操作的模型参数具有较强鲁棒性且模型泛化性更强。

4.2 网络模型构建

本文设计的卷积神经网络模型主要包括3层卷积层、3层池化层、2层全连接层以及softmax层,具体参数如表2所示。输入图像均为尺寸大小一样的灰度图像;图像经卷积层提取高维特征,每个卷积层都采用Relu激活函数来增强神经网络非线性特性;通过最大值池化的方法对高维特征图进行下采样,简化模型结构;最后连接Softmax分类层进行分类识别。此外,本文在全连接层处添加Dropout防止网络过拟合。

表2 模型参数

4.3 模型超参数设置

由于训练样本量较大,采取单个样本更新参数影响模型性能以及泛化能力[5],因此本文模型采用批处理进行训练,最终设定参数如下:批处理量(batch size)的值设置为32;优化算法采用自适应调整学习算法Adam[16],Adam算法由于其需要资源少并且令模型收敛速度快被广泛使用;下采样率Dropout为0.4。

4.4 模型评估标准

式中:TP(True Positives)表示正样本判断为正样本;FP(False Positives)表示负样本判断为正样本;FN(False Negatives)表示正样本判断为负样本;TN(True Negatives)表示负样本判断为负样本。

混淆矩阵(confusion matrix)又被称为错误矩阵,矩阵的每一列表达了模型对实验样本的预测类别。在深度学习领域中,混淆矩阵是一个评价模型性能的通用指标。

5 实例验证

5.1 样本集构建

根据RX铁路公司真实数据,在列车占用某段轨道电路的时间段内,每台被监测的设备产生56个数据,则每经过一次列车对应一个48×56的变量数据矩阵。其中,主机主接入电压、主机调接入电压为连续的动态变化曲线,如图5和图6所示。根据监测数据集构建的轨道电路正向占用、逆向占用以及空闲状态灰度图像样本示例,如图7所示。

图5 主机主接入电压变化曲线

图6 主机调接入电压变化曲线

图7 样本示例

由于每次列车占用轨道电路的时间不同,那么它所对应的变量数据矩阵尺寸不同,便导致轨道电路运行状态灰度图谱的尺寸不一致。为了能够让所有的灰度图谱均可作为卷积神经网络模型输入,考虑绝大多数灰度图谱的尺寸均为48px×56px,因此本文利用基于Python的图像和视频处理库Opencv对图像进行缩放处理,将所有占用状态的灰度图谱尺寸统一为48px×56px。图8为灰度图像尺寸48px×39px和尺寸48px×68px缩放成尺寸48px×56px的对比图。由图8可以看出,经过缩放后的图像依旧可以表达原图像所蕴含的信息。针对轨道电路无列车运行的空闲状态,采用48px×56px尺寸的滑动窗口从数据集中截取数据,建立轨道电路空闲状态数据集。

图8 灰度图像缩放前后对比

通过对监测数据集进行整理,共得到4400组数据集,包括1200组轨道电路不同占用状态数据集和2000组空闲状态数据集,其中,将600组不同占用状态数据集和1000组空闲状态数据集作为训练样本用于神经网络模型训练,剩下的数据集作为测试样本检验神经网络模型准确性,具体样本量分配如表3所示。

表3 图像样本

5.2 实验结果与分析

本文选择keras深度学习的开源框架作为构建卷积神经网络模型的实验环境,Tensorflow作为keras框架后端,keras框架提供了深度学习所需的模型构建、训练、测试、调整的完整工具包。本文构建的轨道电路运行状态识别模型采用有监督的训练方式,其训练图像集与测试图像集均由(灰度图像,类型标签)的向量对构成,类别标签表示灰度图像的分类标签,分为“正向占用”“逆向占用”和“空闲”三类。

将训练图像集输入设置好的神经网络模型中,从训练图像集中随机选取700组灰度图像作为模型训练时的测试数据,以此来训练神经网络模型。训练迭代次数100次,训练过程中的损失值变化曲线和准确率变化曲线如图9和图10所示,图9、图10中,train为训练样本,valid为验证样本。此时网络回检损失值和验证损失值无限趋于0,表明模型鲁棒性较好,回检准确率和验证准确率均为100%,表明模型分类效果好。

图9 训练损失值变化曲线

图10 训练准确率变化曲线

将测试样本输入训练好的神经网络模型进行预测,测试结果如表4所示,混淆矩阵如图11所示。

表4 模型测试结果

图11 模型测试混淆矩阵

根据表4和混淆矩阵可以看出,训练好的神经网络模型能够准确地识别轨道电路占用状态和空闲状态,对轨道电路正向占用状态和逆向占用状态以及空闲状态的分类识别准确率均为100%。实验证明,本文的方法对轨道电路运行状态有很好的识别效果。

6 结 语

本文基于灰度图像设计了轨道电路运行状态灰度图谱,结合深度学习的分类功能,提出了一种基于卷积神经网络应用于轨道电路运行状态识别的可行方案。通过整理监测数据集并构建轨道电路运行状态灰度图谱,分析轨道电路运行状态样本特征,搭建卷积神经网络对灰度图谱进行训练,实现对轨道电路运行状态的智能识别。实验结果表明卷积神经网络模型的识别准确率达100%,验证了该方法的有效性。

本文提出的识别方法,能够为ZPW-2000R轨道电路监控系统提供更为有效且准确的轨道电路运行状态智能识别方法,提高轨道电路运行状态识别的准确性和运行效率,为最大限度保障列车行驶安全和人民生命安全提供技术支持。目前,本文对于轨道电路占用状态的研究只涉及正向占用状态和逆向占用状态,对于列车在轨道上进行不规则往复运动等状态还需要进一步讨论。

猜你喜欢
轨道电路灰度图谱
高清大脑皮层发育新图谱绘成
基于图对比注意力网络的知识图谱补全
采用改进导重法的拓扑结构灰度单元过滤技术
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
绘一张成长图谱
基于通信编码的区间ZPW-2000轨道电路最小道砟电阻取值探讨
基于HHT及LCS的轨道电路传输变化识别探讨
HXD电力机车牵引电流高次谐波对25Hz轨道电路干扰问题的解决
全电子高压脉冲轨道电路系统设计
Arduino小车巡线程序的灰度阈值优化方案