刘可兴,黄海于
在地铁运营信号系统中,当列车遇到分叉路口时,需通过扳动道岔来选择不同路线,因此转辙机的控制和维护极其重要,其动作的正常与否直接影响地铁行车安全。由于转辙机机械结构复杂,且处于室外,容易受外界环境的影响,据统计在信号设备发生的故障中,转辙机故障约占信号故障总数的30%[1],故障率较高。
近年来,国内外学者对道岔转辙机的故障诊断做了许多研究,如:刘新发等[2]以道岔转辙机的功率数据作为输入,提取不同故障模式下的特征矩阵,采用模糊聚类算法,从上述特征矩阵中求解模糊等价矩阵,并将其转变为布尔矩阵,得到动态聚类图后完成故障诊断;LEE 等[3]利用所采集的转辙机音频数据作为提取特征,采用声学分析法对转辙机进行故障诊断,试验证明该方法具有较高的准确率;黄世泽等[4]总结不同转辙机故障的功率曲线特点,采用基于弗雷歇距离定义的相似函数完成故障诊断。上述方法主要是依靠人工提取故障信号特征,但道岔转辙机结构复杂,影响因素繁多,导致相同故障模式下信号有不同的表现形式,所以很难提取到有效特征,造成这些算法在实际情况下泛化能力不强。
随着深度学习的发展,非线性函数自动映射能力已广泛应用于故障诊断领域,如:唐维华等[5]构建了LSTM 网络形成道岔故障,但需要大量有标签数据集进行训练;陈欣昌等[6]构建了深度自编码器模型,实现机械故障诊断,通过试验验证方法有效;薛嫣等[7]通过对故障信号提取时频域以及熵特征,构建堆叠稀疏自编码网络模型进行训练,来提高故障诊断准确率,但自编码网络在特征提取阶段,仅仅是无监督地对原始输入数据进行重构,无法保证所提取的抽象特征与所识别的故障类型的关联性;习晨博等[8]采用堆叠去噪自动编码器与BP 神经网络相结合的方法,试验证明准确率更高;徐子弘等[9]采用自编码器提取不同故障信号的高阶抽象特征,并将该特征作为其他分类器的输入,完成了早期的故障诊断。
基于以上研究,本文以S700K 型道岔转辙机作为研究对象,应用深度学习技术,对信号集中监测系统中所收集的功率数据进行分析,利用深度卷积降噪自编码器与循环神经网络相结合的方法,完成转辙机故障诊断。此外,由于自编码器中的隐藏层采用全连接神经神经网络,训练时间复杂度偏高,而卷积神经网络因其权值共享等特点,训练时间复杂度较低,因此将自编码器改进为一维卷积神经网络,经试验证明该方法可以进一步提高准确率。
S700K型道岔转辙机三相交流电动机的工作拉力为
式中:η为电动机效率;Re为转辙机传动系统等效力臂;p为输出功率;n为电动机转速。
由式(1)可得,S700K 转辙机的动力与其功率呈线性关系,功率值的改变反映了工作拉力的变化,所以转辙机的运行情况可以通过其输出工作拉力的变化表示[10]。据此,本文选取功率数据作为研究对象,通过研究转辙机正常功率数据和不同故障模式下的功率数据,完成S700K 型道岔转辙机的故障诊断。
通过对SDAE-BiLSTM 算法的堆叠式降噪自编码网络结构进行改进,提出了深度卷积降噪自编码器——双向长短期记忆网络DCDAE-BiLSTM(Deep Convolutional denoised autoencoder and Bidirectional Long Short-Term Memory)算法,用于对转辙机的故障诊断,具体流程见图1。该方法主要包含:①数据预处理,由于一次道岔动作在不同的阶段,其功率数据值差异较大,因此需先对功率数据进行归一化,便于不同量级的功率能够进行计算;②DCDAE 网络预训练,对大量数据进行自监督学习,复用编码层参数后,进入下一阶段的分类任务;③BiLSTM 网络微调,当上述自编码器训练完成后,将BiLSTM 网络接入到卷积自编码器编码层,开始训练带有标签的数据集,最终完成故障诊断。
图1 诊断流程图
数据归一化方法主要分为线性函数归一化(Min-Max Scaling) 和零均值归一化 (Z-score standardization),本文采用线性函数归一化方法,具体计算公式为
式(2) 将训练数据和测试数据归一化到[0,1]区间内,然后把归一化后的数据作为自编码器模型的输入,先进行无监督深层特征提取,再开始微调整个网络。
传统深度降噪自编码器见图2,包括编码层和解码层[11]。其中降噪主要是对输入数据加入噪声,模拟数据被损坏的情况,从损坏的数据中重构出原始数据,提高模型的鲁棒性。
图2 深度降噪自编码结构示意图
传统自编码器的隐藏层采用全连接神经网络,虽然有一定的特征提取能力,但因参数较多,训练复杂;而卷积神经网络具有局部链接、权值共享等优点,减少了训练参数,因此本文将传统自编码器中的隐藏层改为一维卷积神经网络,见图3。卷积自编码器编码网络与解码网络具体参数见表1。将上述编码网络的最后一层(max_pool 层),通过ReShape 操作改变其维度为(1,396)后,作为BiLSTM网络的输入。
表1 卷积自编码器网络模型结构参数
图3 深度卷积降噪自编码结构示意图
LSTM 神经网络核心单元见图4。其中,xt表示t时刻的输入序列,Ct表示第t时刻的记忆单元,ht表示t时刻LSTM 神经网络细胞的输出值,ft、it、Ot分别表示遗忘门、输入门以及输出门的值,具体计算方式如下。
图4 LSTM 核心单元结构
式中wf、wi以及wo表示遗传门、输入门、输出门的权重,bf、bi、bo分别表示各个门的偏置。
由于反映转辙机工作状态的功率曲线下一阶段的动作紧挨着上一阶段,具有时序性,因此将上述自编码器所提取的特征作为循环神经网络的输入,最终完成故障诊断,具体的网络结构设计见表2。
表2 Bi LSTM 网络模型结构
真实数据及模拟数据共同组成模型训练测试数据,其中训练集数量总共为3 600 个,每种类型各600 个;测试数量总共为1 200 个,每种类型各200个。
为了评估本文所提算法的性能,采用准确率、精确率、误报率、漏报率以及ROC 曲线等指标进行验证,其中各指标计算公式如下:
式中:ACC为测试准确率;TP表示实际为正类别,预测为正类别;FN表示实际为正类别,预测为负类别;TN表示实际为负类别,预测为负类别;FP表示实际为负类别,预测为正类别。ROC曲线为接受者操作特性曲线(Receiver Operating Characteristic Curve ROC),ROC 曲线的横坐标是FPR,纵坐标是TPR,表示将正样本预测为正的比例,ROC 曲线与横纵坐标封闭的区域面积称为AUC(Area under roc Curve),面积越大,表示模型越好。
在确定网络结构基础上,为了使试验结果的差异来自不同的神经网络模型,设置了同样的超参数,包括优化器使用Ndam 算法,训练批次大小32,学习率设置为0.001,epoch设置为200时。对输入采用dropout 降噪方式,本文比例设置为0.1,最后在Win10 64 位环境下试验,并采用keras 3.6版本的深度学习框架。
1)基于DCDAE_BiLSTM 模型的故障诊断试验结果。本课题采用预训练阶段和微调阶段训练策略,即先将预训练的深度卷积降噪自编码器模型,作为微调阶段编码网络的初始化参数;然后加入双向循环神经网络,开始微调整个分类网络,图5 表示训练准确率ACC曲线。其中ACC表示样本被正确分类的个数占总样本个数的比例,可以看到本文最终准确率达到了98.82%,为了更加细致地观察试验结果,画出如图6 所示的ROC 曲线,该曲线中有每一类别的AUC值,即为图中area 值所示,而表3为每类的精确率等指标。
图5 测试准确率
图6 ROC曲线
表3 分类试验结果
2)与其他算法的对比。随着对道岔转辙机故障诊断的大量研究,已出现了许多不错的研究成果,如文献[13]中构建了多层CNN 模型来完成转辙机故障诊断,文献[14]采用CNN-GRU 联合神经网络的方法来完成故障诊断等。此外,为了验证本文所提算法的有效性,还搭建了SDAEBiLSTM模型来作为对比。
几种算法进行比较的试验结果见表4。采用多层CNN 模型时,其准确率95.14%,误报率4.26%,漏报率4.83%;采用CNN-GRU 模型时,其故障诊断的准确率为95.85%,误报率为3.06%,漏报率为3.17%;而采用SDAE-BiLSTM 模型,其故障诊断的正确率为97.16%,误报率为1.87%,漏报率为2.99%。相比于上述算法,本文所提的模型故障诊断正确率更高。
表4 算法对比结果
通过分析S700K 型道岔转辙机故障功率数据,总结归纳出需要诊断的故障类型,在此基础上,提出深度卷积降噪自编码器与双向长短期记忆网络相结合(DCDAE-BiLSTM)的方法,完成转辙机故障诊断,试验结果表明该算法的准确率可达到98.82%。相比于其他算法,该算法具有更高的准确率。