徐彦伟,蔡薇薇,颉潭成,陈立海,刘明明
(1.河南科技大学 机电工程学院,河南 洛阳 471003;2.智能数控装备河南省工程实验室,河南 洛阳 471003)
地铁牵引电机轴承在高温、交变负荷和长时间疲劳的恶劣工况下运行,其内、外圈滚道及滚动体上容易出现裂纹、点蚀等局部损伤或缺陷,导致牵引电机产生噪音和异常振动[1]。作为地铁动力系统的关键部件,牵引电机轴承一旦出现故障,轻则影响地铁平稳行驶,出现运行异常,重则损伤设备,造成牵引电机卡死、异常停车等险情,还可能造成重大经济损失甚至人员伤亡。若能准确、及时、智能地识别牵引电机轴承运行中萌生和演变的故障并及早进行维护,则对地铁安全运行具有重大意义[2]。
传统的机械故障诊断方法主要通过信号处理与诊断经验提取浅层故障特征,然后利用不同的模式识别方法进行分类诊断[3],例如AMIRAT等[4]采用整体经验模态分解方法研究风轮机轴承的故障诊断,辜振谱等[5]基于改进密度峰值聚类方法对航空发动机故障进行诊断,王保建等[6]研究支持向量机在故障智能诊断中的应用,这些研究取得了较好的效果,但需要掌握大量的信号处理技术和丰富的工程实践经验进行故障特征提取[7-10],且较少考虑工况变化对故障诊断结果的影响。变工况下的滚动轴承故障信号中蕴藏着丰富的故障特征信息,近年来,众多学者对变工况下滚动轴承故障的特征提取方法进行了深入研究,例如赵德尊等[11]研究了基于自适应广义解调变换的滚动轴承时变非平稳故障特征提取方法;高冠琪等[12]通过时频挤压和重采样阶比分析对轴承故障进行诊断;针对变转速工况,夏均忠等[13]提出基于集成阶频谱相关的滚动轴承故障特征提取方法,唐明等[14]提出一种基于阶次解调谱的滚动轴承故障诊断方法,周勇[15]提出一种基于独立特征选择与相关向量机的滚动轴承故障智能诊断模型。这些变工况下的滚动轴承故障诊断方法虽然取得了良好的效果,但是主要集中在信号的时频分析、处理和提取特征等方面。由于在转速、载荷交变的复杂工况下测得的地铁牵引电机轴承故障信号,会因不同类型故障的频段相互重叠而发生不同程度的耦合与畸变,容易被调制呈现出典型的非平稳性和非线性,很难通过浅层故障特征对其二维时域和频域信息进行全面、准确地描述,而且很难评价所提取的浅层故障特征与所采用的模式识别算法间的匹配程度。
通过学习样本数据的内在规律和表示层次,反复嵌套特征变换,自动学习数据的内部特征,深度学习可以主动挖掘隐藏于海量原始数据中的代表性诊断信息,并直接建立运行状态与原始数据之间的精确映射关系,以在很大程度上摆脱依赖人工特征设计与工程诊断经验的思路[16],在故障诊断领域中的应用日益广泛,例如雷亚国等[17]利用深度神经网络和大数据进行机械装备健康监测,姜洪开等[18]利用深度学习对飞行器故障进行智能诊断,金棋等[19]利用深度学习对行星齿轮箱故障进行诊断,李川等[20]利用深度学习对3D打印机故障进行诊断。深度学习能够自动学习数据内部特征的优势,使其成功应用于滚动轴承故障诊断领域,例如陈法法等[1]采用短时傅里叶变换、张弘斌等[21]采用多通道样本构造方法、陈仁祥等[22]采用离散小波变换,曲建岭等[23]基于“端到端”的方法,分别结合卷积神经网络(Convolutional Neural Network, CNN),研究了基于深度学习的滚动轴承故障诊断方法。这些方法虽然取得了良好的效果,但是基本上都是用美国凯斯西储大学基于振动传感器采集的试验数据进行研究。
多传感器信息融合技术是根据一定的准则,通过计算机对按时序获取的多个传感器的测量信息进行多方面与多层次综合处理,得到精确估计,并及时对态势、威胁与重要程度进行全面、综合评估的决策过程,具有较高的实时性、互补性、容错性和经济性等优点[24-26]。近年来,信息融合技术在滚动轴承故障诊断领域中的应用日益广泛[27-28],但尚未形成统一规范。
为解决变工况下滚动轴承故障诊断过程中,通过时域、频域或时频域分析提取特征,过于依赖先验知识和专家经验,且泛化能力受约束以及单一传感器可靠性较低的问题,本文采用CNN对不同工况下地铁牵引电机轴承试验过程中的声发射和振动信息特征进行融合,研究变工况下基于深度学习与信息融合的地铁牵引电机轴承故障智能诊断方法。
用滚动轴承试验台、试验轴承、声发射和振动传感器、信号放大与调理器、数据采集卡和计算机共同搭建的滚动轴承试验与信息采集系统原理如图1所示。
由河南科技大学、洛阳轴承研究所和智能数控装备河南省工程实验室联合开发的滚动轴承试验平台(可径向加载300 kN、轴向加载200 kN,试验轴承最大允许内径为120 mm)、PCI-8声发射仪(信噪比为4.5,频率范围为1 kHz~3 MHz,最高采样频率为10 M/S)、R50S-TC声发射传感器(测量范围为50 kHz~700 kHz,谐振频率为500 kHz)、LC0151T加速度传感器(灵敏度为150 mv/g,量程为33 g,分辨率为40 kHz,谐振频率为0.000 2 kHz,频率范围为0.7 Hz~13 kHz)、LC0201-5信号调理器、PCI8510数据采集卡(采样频率为500 kS/s,8通道同步采样)和NU216地铁牵引电机轴承(内圈直径为80 mm,外圈直径为140 mm,宽度为26 mm)共同搭建的地铁牵引电机轴承试验与信息采集系统实物如图2所示。
试验轴承为NU216圆柱滚子轴承。采用大族YLP-MDF-152型三维光纤激光打标机,分别在轴承的内圈、外圈和滚动体上制作裂纹和点蚀缺陷,共计6种类型(缺陷尺寸:裂纹宽度为30 μm,点蚀直径为40 μm,深度均为激光能量的30%)。图3所示为预制轴承的外圈缺陷。
实际工况下地铁牵引电机轴承稳定运行时的径向载荷为7 kN,转速为4 800 rpm,由于加载轴承转速限制,试验平台的最高转速设置为2 400 rpm。理论上,地铁牵引电机轴承的多种缺陷在相同的转速和载荷下产生的信号特征应存在区别,而地铁车辆运行过程中反复进行提速、相对匀速、减速,而且站点间隔、客流量和坡度亦不断变化,在分析地铁牵引电机轴承信号时,如果采用同种载荷和转速下的数据,则会大幅减少有效数据;另外,转速载荷的变化有可能使不同缺陷的地铁牵引电机轴承在某些转速和载荷下产生类似的信号特征,从而进一步影响诊断结果。因此,设置3种载荷和转速来模拟地铁牵引电机轴承高速、中速、低速和大载荷、中载荷、低载荷下的工况。根据实际工况,以地铁牵引电机轴承稳定运行时径向载荷的1/4为波动值,取整后按梯度当量动载荷5 kN,7 kN,9 kN进行试验,同时选取梯度转速800 rpm(低速),1 600 rpm(中速),2 400 rpm(高速)为试验转速。试验中存在的变量为故障类型、转速、载荷,一共54种子试验(6×3×3=54),试验安排如表1所示。
表1 试验安排表
续表1
引入载荷和转速的变化,以适用已知工况(转速和载荷)样本与未知工况样本之间的诊断(或跨工况样本之间的诊断),并期望实现自适应工况的诊断。
在2 400 rpm,7 kN的工况下采集6种故障类型轴承的振动信号,得到的频率分布如图4所示。
从图4可见,6种故障类型轴承的信号在5 000 Hz~10 000 Hz频段有明显的差异,在0 Hz~5 000 Hz和10 000 Hz~25 000 Hz段差异细微。
然而,在实际工况下,由于地铁出入站,以及地铁轨道坡度和乘客数量发生变化,载荷与速度亦会发生变化。采集外圈裂纹故障轴承在相同转速(2 400 rpm)、不同载荷(5 kN,7 kN,9 kN)试验条件下的振动信号,得到的频率分布如图5所示;采集外圈裂纹故障轴承在不同转速(800 rpm,1 600 rpm,2 400 rpm)、相同载荷(5 kN)试验条件下的振动信号,得到的频率分布如图6所示。
从图5和图6可见,转速变化比载荷变化对信号的影响大;对同种故障轴承,不同转速和载荷下,频率分布和幅值差异明显。全局看,转速、载荷带来的差异可使不同故障类型轴承之间的差异出现重叠。
声发射信号与振动信号情况相似,不再详述。
当轴承故障较小甚至微弱时,信噪比过低,提取的信号特征不能反映故障的真实情况,可预定频率区间,用滤波器对信号进行处理后再提取特征。本文各种故障类型的轴承在全频段均存在差异,常规滤波方法不能很好地描述各种故障类型轴承之间的差异。小波包分解[29-32]是一种在时域和频域均存在良好局部特性的分析方法,本文首先采用8层小波包分解方法将原始信号分成256个频段,然后根据试验得出的频率分布选择特征。故障轴承在运转过程中会产生比正常轴承更强的信号,这一特性可以从宏观角度用信号能量以均方根值(Rms)体现;轴承故障在一段信号里间断出现,这一特性可用对冲击性信号敏感的峭度(Kr)来捕捉;故障轴承可以视作运转后产生磨损的轴承,磨损情况可用裕度(C)描述。因此,本文选取均方根值、峭度值和裕度值作为初始特征值,组合后形成初始特征向量:
(1)
(2)
(3)
考虑到原始信号的影响,初始特征向量zm中一共有(256+1)×3×2=1 542个元素。初始特征向量zm经归一化处理后,得到特征向量Zm。
信息融合是在一定准则下,利用计算机对按时序获取的若干传感器的测量信息进行自动分析和综合处理,从而完成决策和估计任务的信息处理过程,相比单信息源信号处理技术,信息融合技术更加可靠、有效[3,33]。根据融合的层次可将信息融合分为数据层融合、特征层融合和决策层融合。其中,特征层融合是先对信息进行预处理并提取特征,然后再对特征信息进行融合,不但保留了输入信息的重要特征,而且可以极大减少运算量。与数据层融合相比,特征层数据量虽然没有数据层多,但是数据量仍然较大。由于CNN能够自适应地提取诊断对象的特征,本文选用CNN在特征层对信息进行融合。
CNN可以直接处理原始信号。然而,振动传感器和声发射传感器采集到的信号量纲不同,即便是单一传感器信号提取的特征,在不同尺度上的量级也不尽相同,因此在信息融合之前必须对原始信号进行比较严格的预处理。
本文首先采用小波包分解对原始信号进行处理,得到具有不同频率信息的多段信号;然后对产生的多段信号进行处理,将各种特征量化后得到原始特征,再将原始特征组合后形成特征向量。设处理单传感器采集到的信号得到的特征向量为zi(i∈1,2,…,n),多传感器综合得到的特征向量为A,A与zi之间的关系如式(4)所示,A内元素如式(5)所示:
A=[z1,z2,…,zm]T;
(4)
(5)
式中:n为提取的特征值个数;m表示多个样本。
特征向量矩阵A内各元素的量纲仍然不统一,不符合神经网络处理的数据格式。因为神经网络着重捕捉不同类型数据之间的差异,且特征向量之间只比较相同位置的元素,所以将各元素的值由绝对值转换成相对值后才能符合神经网络的要求。设每列元素的集合为Nj(j∈1,2,…,n),归一化转换后的特征矩阵为B,Nj与B之间的关系如式(6)所示;B内元素为bij,其表达式如式(7)所示:
B=(N1,N2,…,Nn);
(6)
(7)
此时bij内的最大值
(8)
因此,Nj内元素的数值范围为(0,Fj-1]。转换后的特征矩阵B内的元素为
(9)
转换后的特征值均大于0,各列元素的最大值Fj仍不确定,需进一步对B内的元素bij进行归一化后才能输入神经网络。传统的归一化方法通常是将全部数据经线性或非线性处理后转换至特定区间,该方法处理的前提是已知数据的数值范围,数据可以相互比较。然而本文数据由两种传感器采集而来,而且由3种特征值排列组成,每列数据Nj的数值范围为(0,Fj-1],此处Fj的数值大小并不确定,即不同列数据之间的数值范围不同,因此不能相互比较。逐列处理后的数据仍能体现不同行数据之间的差异,因此采用逐列归一化的方式将特征值进一步转换至同一数值范围,供神经网络使用。本文采用的逐列处理归一化方法与传统归一化方法的区别如图7所示。
设特征矩阵B中的每列元素为Mj,归一化后的信号为cij,则bij与cij之间的转换关系为
(10)
CNN是一种包含卷积计算且具有深度结构的前馈神经网络,其采用非监督或半监督的学习方式,可以按其阶层结构对输入信息进行平移不变分类,自动、准确地识别出相同种类信号的共性特征和不同种类信号的差异化特征,从而获取图像数据的高层抽象化表达,克服传统的提取特征过于依赖先验知识和专家经验、精度不高、难以泛化的缺点[34]。
图8所示为本文采用的CNN结构[35-36],其包括输入层、卷积层、池化层、全连接层和输出层,卷积层、池化层和全连接层组成隐含层。卷积层为特征提取层,采用局部链接与权值共享,用多个卷积核从数据中提取特征。本文两个传感器的数据特征融合后得到的特征向量Zm中一共有1 542个元素,因为采用的是二维CNN,所以需要对Zm内的元素进行补0操作,补充为1 600个元素,再转换成40×40的矩阵,作为二维CNN的输入。卷积层内部包含多个大小为3×3的卷积核,卷积核的移动步长取1,每个卷积核元素对应一个权重矩阵;卷积层内的每个神经元都连接上一层中位置接近区域的多个神经元,区域大小为卷积核的大小,卷积层的主要作用是提取输入数据的特征。
卷积层可以用数学函数描述,设卷积层的输入为
z(l+1)=w(l)+x(l)+b(l)。
(11)
式中w(l)为第l层的卷积核;x(l)为上一层的输出,
x(l+1)=f(z(1)),
(12)
f为激活函数;b(l)为偏置。
如果在卷积层后面直接跟分类器,则可能会因输入维度过高而导致过拟合现象,因此需加池化层进行降维。如果定义池化函数为lower,则
(13)
式中:wl+1为权重;bl+1为函数的偏置。
池化层对卷积层提取到的特征图进行选择和信息过滤,并将特征图中单个点的结果替换为其相邻区域的特征图统计量,可以减少最后全连接层的节点数。本文采用2×2池化矩阵来减少最后全连接层的节点数,移动步长为2。
卷积层可以提取数据的特征,整个卷积层的输出可以看做一个新的数据矩阵,其中包含输入数据的特征信息,因此可以再添加第二个卷积层,用来提取更深层次的特征,两个卷积层中间添加一个池化层用于数据降维。经过第一层卷积层后,数据由原来的40×40减少到38×38,接着经过一个池化层,由于池化层池化矩阵的移动步长为2,数据由38×38矩阵转换为19×19矩阵,完成数据降维;接着进入第二个卷积层,数据由19×19减少至17×17;随后再添加一个池化层,池化矩阵的参数和前一个池化层的参数保持一致,池化层边界采用补0填充,此时数据由17×17减少至9×9。经过两个卷积层和池化层后,完成特征的深度提取,同时大大减小了数据维度。
全连接层是CNN隐含层的最后部分,通过对提取的特征进行非线性组合得到输出;输出层一般采用Softmax分类器,这种分类器在多分类中的效果非常好。全连接层和输出层可对样本进行分类,得到当前样本属于不同种类的概率分布。
本文构建的CNN结构参数包括网络层数、卷积核大小、滑动步长、学习率和训练次数等。根据输入层元素的个数,选定卷积层为2层,池化层为2层,全连接层为1层,输出层采用Softmax分类器。卷积核设置为3×3,滑动步长设置为1,学习率为0.001,激活函数为relu。训练次数(Epochs)设置过高会大幅延长训练时间甚至导致过拟合,设置过低则会影响识别准确率,故需测试后才能确定。本文选取转速为800 rpm时,载荷分别为5 kN,7 kN的数据为训练集数据,载荷为9 kN的数据为测试集数据,通过单工况变化初步测试得到的诊断误差率和准确率曲线如图9和图10所示,可见在训练次数为15时首次达到理想状态,此后经历多次起伏,因此训练次数为25即可满足精度要求。
为实现不同工况、不同类型地铁牵引电机轴承故障的智能诊断,首先采用已知工况和故障类型的信号作为样本输入CNN模型进行训练,然后对未知工况、故障类型的轴承信号进行智能诊断。基于深度学习与信息融合的地铁牵引电机轴承故障智能诊断流程如图11所示,主要包括以下步骤:①采集信号;②信号预处理;③提取特征并对其归一化;④基于CNN进行信息融合并训练深度学习模型;⑤对测试样本进行测试和诊断;⑥输出结果,完成对轴承故障的智能诊断。
本文用Google开发的TensorFlow模块作为CNN的基础环境,用Python 3.5作为软件编程环境。根据测试集与训练集的关系,分为如图12所示的4种推导模式进行智能诊断。
图12a所示为测试集样本大于训练集样本区间的上限;图12b所示为测试集样本在训练集样本区间内;图12c所示为测试集样本小于训练集样本区间的下限;图12d所示为测试集样本区间等于训练集样本区间。
地铁车辆的实际工况差异主要为转速和载荷,这两种因素对轴承的故障信号影响较大。本文通过改变转速和载荷模拟高低中3种工况以及两种因素的混合工况,来验证多种工况下本文诊断方法的鲁棒性。表2所示为8种基本诊断模式。
表2 8种基本诊断模式
续表2
试验中共有6种故障轴承,在9种工况下分别对每种故障轴承进行4次信号采集,共采集216个样本。
基于表2所示的8种基本诊断模式,分别控制转速和载荷不变,采用CNN进行单工况故障诊断,诊断结果如表3所示。
表3 单工况故障诊断正确率
表3中训练集与测试集的关系涵盖了实际试验过程中的多种情况,在训练集涵盖工况与测试集涵盖工况相同的条件下,训练集与测试集的样本比例为3∶1(每种轴承的4个样本中,3个为训练集,其余1个为测试集),其余为2∶1(训练集为2种工况,测试集为1种工况)。从测试集与训练集的工况关系来看,当测试集样本涵盖工况类型与训练集样本涵盖工况类型相同时,诊断准确率平均值达到100%;当测试集样本在训练集样本区间内时,诊断准确率的平均值达到97.92%;当测试集样本大于训练集样本区间的上限时,诊断准确率的平均值达到94.44%;当测试集样本小于训练集样本区间的下限时,诊断准确率的平均值达到74.31%。
从各传感器的诊断结果来看,采用信息融合技术得出的诊断准确率平均值达到91.67%;单独使用振动传感器作为信息源时,诊断准确率平均值达到88.08%;单独使用声发射传感器作为信息源时,诊断准确率平均值达到74.31%。
表3中序号为23的诊断准确率较低,此时采用信息融合技术的诊断准确率小于单一信息源诊断准确率,与单一信息源诊断准确率较低且测试集样本小于训练集样本区间有关。
实际运行过程中,还可能出现如表4所示的复合变化工况,在其诊断中训练集和测试集会同时掺有载荷和转速的变化。复合变化工况的诊断结果亦如表4所示。
表4 多工况故障诊断正确率
从表4测试集与训练集的工况关系来看,当测试集样本在训练集样本区间内时,诊断准确率平均值达到95.14%;当测试集样本大于训练集样本区间的上限时,诊断准确率平均值达到90.28%;当测试集样本小于训练集样本区间的下限时,诊断准确率平均值达到65.28%。
从各传感器的诊断结果来看,使用信息融合技术得出的诊断准确率平均值达到83.57%;当单独使用振动传感器作为信息源时,诊断准确率平均值达到80.79%;当单独使用声发射传感器作为信息源时,诊断准确率平均值达到70.14%。表4中序号为3的诊断准确率较低,与单一工况下的诊断结果类似,且原因相同。
表3和表4中的训练集和测试集均未泛化至全部工况,故令训练集和测试集同时包含54个类型的试验数据,得出的诊断结果如图13所示。图中,纵轴表示轴承的实际故障类型,其对应6种故障类型(A为内圈裂纹,B为内圈点蚀,C为外圈裂纹,D为外圈点蚀,E为滚动体裂纹,F为滚动体点蚀),每种故障类型内含9种工况,被测样本共54种信号;横轴表示神经网络预测6种故障类型的概率。最终输出类型为行最大值所在的类型,因此当诊断正确时,概率值所在块的列故障类型与行故障类型相同。
CNN输出的为概率值(范围为0%~100%),对未知信号的输出值有6个,即故障为内圈裂纹的概率值a、故障为内圈点蚀的概率值b、故障为外圈裂纹的概率值c、故障为外圈点蚀的概率值d、故障为滚动体裂纹的概率值e、故障为滚动体点蚀的概率值f。若a为其中的最大值,则最终判断结果为A类型;若a值的大小远超其他值,则神经网络的置信度较高;若a值的大小与其余值相差不大,则神经网络的置信度较低。从图13可见,未采用信息融合技术时,在基于振动传感器与基于声发射传感器的诊断模式下,对内圈裂纹和内圈点蚀故障类型均出现误判,且诊断准确率均未达到100%,整体置信度较低;采用信息融合技术后,不但诊断准确率提升至100%,而且置信度也更高。
针对变工况下滚动轴承故障诊断过程中的时频特征自适应提取与智能诊断问题,本文提出一种变工况下基于信息融合的地铁牵引电机轴承故障诊断方法。
本文搭建了地铁牵引电机轴承试验与多信息数据采集系统,在不同工况下进行了试验,用小波包分解方法对试验过程中采集到的振动和声发射原始信号进行分解并提取特征,对振动、声发射信号的特征信息进行融合并用已知工况、故障类型的信号对CNN进行训练,最后对地铁牵引电机轴承测试样本数据进行了单工况、复合工况、泛工况下的故障诊断。结果表明:①转速对诊断结果影响较大,载荷对诊断结果影响较小;②增大训练样本中各种工况涵盖的区间可有效提高准确率;③当训练样本工况涵盖被测样本工况时,诊断准确率可达100%。
本文仅考虑了地铁牵引电机轴承3个部位的故障,后续可对轴承保持架故障以及磨损、变形等故障进行研究。另外,本文采用实验室搭建的平台展开研究,若加入能施加振动载荷及冲击载荷的器件,将更接近地铁工况。