杨培盛 ,付 宇 ,李鸿飞 ,初开麒 ,王梦谦 ,李政达
(1.济南轨道交通集团建设投资有限公司,山东 济南 250014;2.中车青岛四方车辆研究所有限公司,山东 青岛 266033)
近年来,电力电子系统的可靠性越来越引起社会各界的广泛注意[1-2]。大量的研究及实践表明,在轨道交通领域,实现轨道列车牵引系统的实时健康状态监测,做到及时的故障预警和提前维修[3-4],将大大提高系统的可靠性,节约维修成本。
直流母线支撑电容作为牵引系统的关键部件,其健康状态随着投入运行年限的增加而变差,直流母线电容失效导致的列车系统停机甚至损毁给社会带来了巨大的经济损失[5-6]。因此,支撑电容的状态监测技术成为了当前研究的热点[7-8]。支撑电容的容值能够表征其真实的健康状态[9],本文提出了一种大功率变流器直流母线电容容值的在线监测方法,利用数据训练得到基于卷积神经网络-长短期记忆网络(Convolutional Neural Networks-Long Short Term Memory,CNN-LSTM)的神经网络模型[10],可以根据列车系统运行过程中采集到的实时运行数据进行支撑电容值的准确软测量,对于实现支撑电容健康状态在线监测、提高功率变流器的可靠性具有重要意义。
CNN(卷积神经网络)能够充分挖掘传感器传回的大批量电压、电流数据中与支撑电容容值有关的数据特征,LSTM 长短期记忆模型能够使得数据特征信息完整化和丰富化[11]。采用CNN 和LSTM 结合的方式对支撑电容相关的电压电流数据进行数据处理和神经网络模型搭建,能够显著提高电容容值软测量的准确度。
CNN 由数据输入层、卷积层、激活层、池化层、全连接层和输出层构成[12-13],如图1 所示。
图1 CNN 神经网络结构
卷积层可进行参数共享、卷积等操作,并通过卷积层滤波器提取输入数据之间的关系;激活层主要完成卷积层输出的非线性映射,使得整个网络有更丰富的表达能力,激活层在结构上属于卷积层;池化层进行参数降维,减小过拟合;全连接层对特征进行重新拟合,减少特征信息的丢失。
实时采集支撑电容相关的信号数据量大,通过传统的数理统计方法梳理出传感器数据和容值的统计规律难度较大。卷积层作为CNN 神经网络的核心,其参数共享操作能够很大限度减少运算量,尤其适用于大数据量应用场合;局部感知功能使得每一个卷积核都关注局部的数据信息,最后结合卷积层多核特性,实现多维度数据特征提取,最大化反映数据信息中包含的所有电容相关特征信息。CNN 神经网路模型能够提取信号特征,基于提取的信号特征进行支撑电容值的软测量分析。
牵引系统支撑电容的运行状态,不仅与当前时刻主回路状态参数有关,准确预测电容容值还需要结合历史数据状态信息。LSTM 长短期记忆网络单元能够对长期依赖信息进行学习,可实现支撑电容时序信息的回归预测,并且能够避免传统的RNN(循环神经网络)的梯度下降、梯度爆炸等问题[14]。
LSTM的关键环节是“电容细胞状态更新”,细胞更新后的状态决定了最终的输出信息。图2 为LSTM 单元结构图。从图中可以看到,LSTM 单元内部通过4 个神经网路层相互交互。
图2 LSTM 单元结构图
在图2中可以看到,LSTM 神经网络单元的链式结构中,电容细胞状态Ct在整条链上贯穿前行,LSTM 通过忘记门、输入层门和输出层门,对信号状态信息进行更新和调控,旨在丢弃无价值的信息,保留并填充有用信息。LSTM的“门”结构由σ(即sigmoid 激活函数)神经网络层和一个按位乘的操作构成。sigmoid 激活函数层输出0~1的数值,其中,0 表示信息完全被丢弃,1 表示信息完成保留。
忘记门层通过sigmoid 激活函数决定丢弃何种信息,公式如下:
其中,ft为忘记层门输出,xt为LSTM 单元在t 时刻的输入,ht-1为LSTM单元在t-1时刻的输出,Wf为权值矩阵,bf为偏置参数。
输入层门通过sigmoid 激活函数选择何种信息保留在状态中,tanh 层创建一个新的候选值向量,用于状态信息的填充,公式如下:
其中,it为输入层门输出,tanh 为双正切激活函数为tanh层创建的候选值向量,Wi、WC为权值矩阵,bi、bC为偏置参数。
经过信息丢弃、填充后,细胞状态已经更新为新状态Ct,如下式:
其中,⊙表示哈达马乘积。更新后的细胞状态Ct通过tanh 激活函数后和输出层门的输出ot相乘决定最终的输出ht,Wo为权值矩阵,bo为偏置参数,公式如下:
在网络模型中,定义损失函数为MSE(均方误差),MSE 主要用于反映估计量与观测值之间的差异程度,其公式如下[15]:
其中,yi是真实数据是对应模型输出结果。其值越小表示估计量与观测值之间的差异越小,越符合人们的期待和优化目标。
在卷积操作中,使用ReLU(Rectified Linear Unit)激活函数,ReLU 函数相较于其他激活函数,能够有效地防止梯度弥散,引入了稀疏激活性,在同样的条件下,能够加快网络计算,其公式如下[16]:
利用基于随机梯度下降的优化方法来最优化网络参数估计,利用反向传播算法来最小化损失函数。为了防止过拟合,给LSTM 部分加上了Dropout 层。Dropout的实质就是按照一定的概率随机地删除部分神将元,然后进行计算、梯度传播和更新,下一次再选取其他的神经元丢弃的一个过程。训练过程主要由3 阶段组成:前向传播、后向传播、梯度更新。
前向传播的目标是将数据输入网络,沿着网络前进计算,最后得到输出,比较输出与观测值的关系。计算卷积和池化得到最后的输出。
后向传播基于前向传播得到的网络输出值,然后计算输出与观测值的MSE,通过各层的参数,将误差从输出层反向传递往输入层,经历上采样,与卷积和的倒置相乘等逆操作。
梯度更新采用随机梯度下降的方法,计算参数的梯度,更新参数,以使得MSE 最小。学习率是梯度学习的关键因子,随着模型训练的深入,需要适时改变学习率才能更好地调整模型。学习率过快可能跳过最低点,导致信息丢失;过慢则时间消耗太大,严重影响代码效率。应让学习率随着训练的深入等比例地降低。
针对列车运行过程中牵引系统预充电、牵引加速、恒速运行、减速制动等不同工况下的电压、电流数据,基于CNN-LSTM 神经网络模型实现支撑电容容值的软测量,本次试验共测得35 组实时运行数据,对应的电容值范围为9.50 mF~10.0 mF。
其中,每组数据包含7 个运行参数,分别为网压、网流、电容电压、电容电流以及逆变桥三相输出电流。从数据集中随机选取30 组数据作为训练集对LSTM 卷积神经网络模型进行训练;剩余5 组作为测试集,验证模型的准确度。
首先对传感器采集的电压、电流数据进行预处理,各路电压电流数据的时域特征不明显,因此对数据集进行快速傅里叶变换,将时域信号转化为频域信号,作为卷积神经网络的输入。
基于CNN-LSTM 神经网络模型,制作数据集(包括训练集、验证集和测试集)。验证试验数据集共5 组,采样频率为100 kHz,采样参数同之前相同,均为网压、网流、电容电压、电容电流以及三相电流。实验目标是通过神经网络软测量上述5 组验证数据对应电容值。
定义寿命误差计算公式为:
其中,ErrorLife为寿命误差,E 为绝对误差,Cs为初始电容值(取10.00 mF),Ce为寿命阈值电容值(取9.50 mF)。
在预先不知道真实电容值的情况下,用神经网络软测量,之后对比真实值,结果如表1 所示。
表1 验证数据集电容值预测结果
对不同运行功率下的试验数据进行容值软测量,结果如表2 所示。
表2 不同运行功率下,电容值预测结果
由表1 和表2 可见,CNN-LSTM 模型对于试验数据的软测量结果较好,具有较高的精度。
为进一步验证CNN-LSTM 神经网络模型的软测量结果,分别以BP 神经网络模型、CNN 模型、LSTM 模型和本文应用的CNN-LSTM 模型为对比模型,由相同的数据集进行训练和测试,随机选取20 组试验数据作为数据集,每组数据集由不同随机种子随机得到。由于以间隔0.1 mF的试验数据作为训练和验证数据,以间隔0.01 mF的试验数据作为测试数据,因此设定训练误差阈值为0.1 mF的10%,即0.01 mF。
定义ACC(正确率)为:
其中,TPos是在误差阈值内的样本个数,N 总样本个数。ACC 主要用于反映估计值与观测值相符合的程度。其值越大越好,表示软测量的准确度越高。
图3、图4 为不同神经网络模型下,正确率ACC 和寿命误差ErrorLife随组别的变化曲线。从对比结果中可以看出BP 神经网络和LSTM的正确率较低,寿命误差较大,且曲线波动比较严重,CNN 和CNN-LSTM 模型ACC和ErrorLife曲线较平稳,正确率较高且寿命误差较小。
图3 不同神经网络模型正确率对比
图4 不同神经网络模型寿命误差对比
表3 为不同神经网络模型下均方误差MSE 均值、正确率ACC 均值和平均寿命误差ErrorLife。由表3 可知,CNN-LSTM 神经网络模型综合了CNN 高级数据特征提取能力和LSTM 对时序数据的长期依赖特性,预测精度最高,反映出模型能够对网络进行较好的回归。BP 既无特征提取能力,也无历史数据信息保存神经层结构,因此预测精度最差。因为LSTM 无数据特征提取能力,所以仅使用LSTM 模型做容值软测量并不能提升容值测量精度。
表3 不同模型电容值预测准确率比较
本文基于列车系统实时监测的数据,充分利用CNNLSTM 在信号特征提取和对时序数据长期依赖的优势,实现对支撑电容容值的在线软测量。通过提取不同工况下的支撑电容相关试验数据作为CNN-LSTM 神经网络模型的训练样本,以均方误差、正确率和寿命误差作为容值软测量精度的评价指标。
利用试验数据训练得到的神经网络模型可以准确软测量不同试验数据对应的容值,最后与BP 神经网络模型、LSTM 神经网络模型和CNN 神经网络模型进行对比。实验结果表明,该方法辨识精度较高,能够满足电容测量的工程需求。
电解电容的健康状态与电容容值高度相关,因此监测电容容值对评测电容的健康水平具有重要意义。本文所提出的基于CNN-LSTM 神经网络模型的容值软测量方法能够大大减轻传统列车系统电气部件检修和测量的工作量,工程应用意义较大。