郭秀才, 吴妮, 曹鑫
(1.西安科技大学 电气与控制工程学院, 陕西 西安 710054;2.甘肃靖远煤业集团有限责任公司, 甘肃 白银 730913)
在矿井恶劣的工作环境下,通风机受客观因素、机械磨损等的影响,经常发生故障。滚动轴承作为通风机主要部件,发生故障的概率较高。据统计,通风机滚动轴承故障发生率高达30%以上[1],因此,研究矿用通风机滚动轴承故障诊断方法对煤矿安全生产具有重大意义。
滚动轴承故障智能诊断方法一般由信号采集与预处理、特征提取、故障识别、评估决策等构成,其中特征提取和故障识别最为主要。有效的信号特征提取是确保故障识别高准确率的基础,目前多用时频特征提取法,如小波变换、经验模态分解(Empirical Mode Decomposition,EMD)等。鞠晨等[2]对采集的滚动轴承振动信号进行小波包分解并提取分量能量特征,通过粒子群优化算法优化BP神经网络(Back Propagatiom Neural Network,BPNN)完成故障诊断。王林军等[3]利用EMD分解振动信号,获取分量并提取其能量特征,结合遗传算法优化的BPNN完成轴承故障类型识别。上述信号特征提取方法仅提取时频分量特征,失去了原有信号直观特征,导致故障诊断精度不高。在时频分量信号特征的基础上,加入原始振动信号相关时域、频域特征可对信号特征全面挖掘,相对精确地描述轴承运行状态,但特征的增加会加大计算复杂度。核主成分分析法(Kernel Principal Component Analysis,KPCA)将多个高相关性变量转换成少数包含原变量大部分信息且彼此不相关的变量,实现融合降维,减少计算量。徐卫晓等[4]提出KPCA与BPNN相结合的轴承故障诊断方法,提取振动信号的时域、频域特征,并采用KPCA有效解决特征冗余问题,提高了故障诊断准确率。
在故障类型识别方面,目前多采用BPNN和支持向量机(Support Vector Machine,SVM)等识别方法。皮骏等[5]通过改进遗传算法优化的BPNN完成了滚动轴承故障诊断。董建平等[6]采用改进的果蝇优化算法对SVM的惩罚因子和核函数进行优化,对滚动轴承的故障模式进行分类诊断。王圣杰等[7]将复合特征向量输入至遗传算法优化的SVM中,完成滚动轴承故障状态识别。以上文献所用的诊断网络均属于“浅层学习”的算法结构,要在1~2层的模型结构中完成函数拟合,导致故障诊断精度不高。深度学习通过层次化学习实现数据高效处理,具有强大的数据分析和挖掘能力[8-9]。其中深度置信网络(Deep Belief Network,DBN)已被广泛应用于轴承故障诊断领域中[10-11]。
针对现有矿用通风机滚动轴承故障诊断方法仅提取时频分量特征和采用浅层网络结构,导致故障诊断精度不高的问题,本文提出了一种基于多域特征融合与DBN的矿用通风机滚动轴承故障诊断方法。首先对原始振动信号进行小波包降噪处理,提取降噪信号相关时域、频域特征和本征模态函数(Intrinsic Mode Function,IMF)能量特征;然后采用类内、类间标准差对特征进行筛选,通过KPCA对筛选特征进行降维融合;最后将融合特征输入至DBN中完成滚动轴承无损伤、内圈损伤、滚珠损伤和外圈损伤4种运行状态识别。
小波包将信号频带进行多层次划分,对高频部分进行进一步分解,并能够根据被分析信号的特征自适应地选择相应频带,使之与信号频谱相匹配,从而提高时频分辨率。基于小波包的滚动轴承振动信号降噪步骤如下[12]:
(1) 选择小波基,确定一个小波的分解层次,并对信号进行小波分解。
(2) 确定最佳小波包基,在给定熵标准之后,计算最优树。
(3) 对各个分解尺度下的高频系数选择一个适当的阈值进行阈值量化处理。
(4) 将信号进行小波包重构。
时域、频域指标被广泛应用于滚动轴承故障诊断中。利用时域参数对滚动轴承早期故障进行监测和诊断,初步判断滚动轴承是否出现故障[13]。处于不同运行状态的滚动轴承,其振动信号中的频率成分、不同频率成分的能量大小及主频位置各具特点。时域、频域指标见表1,其中x(i)为样本采样点(i为样本序号,i=1,2,…,N,N为样本采样点个数),xmax(i)为样本中绝对值最大的I个样本点,f为频率,S(f)为单边谱密度函数。
表1 时域、频域指标Table 1 Time domain and frequency domain indexes
集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)可以把非线性不平稳信号分解成为若干个IMF分量和1个余项[14]。滚动轴承振动信号的IMF能量特征提取步骤如下:
(1) 对样本分别进行EEMD分解,得
(1)
式中:cl(i)为IMF分量,l=1,2,…,L,L为IMF分量个数;q(i)为余项。
(2) 计算L个IMF分量与其对应的样本信号的相关系数,淘汰相关系数小于平均相关系数的IMF分量。
通过对滚动轴承降噪数据在时域、频域、IMF能量特征提取,得到8+3+J维特征集F=[TPE],挖掘了信号在不同域的特征,但特征是否有效需进一步验证。由于类内、类间标准差可衡量特征的集中和分散度,因此选用二者的比值作为衡量特征敏感度指标,对特征进行有效筛选[15]。特征敏感度指标计算步骤如下:
(1) 针对同一特征,分别对轴承4种运行状态特征样本求标准差Xb,再对所得4个标准差求均值,即得类内标准差Do。
(2)
(3)
(2) 针对同一特征,分别对轴承4种运行状态特征求均值Yb,再对所得4个特征样本均值求标准差,即得类间标准差Di。
(4)
(5)
(3) 对于某一特征,其类内标准差Do与类间标准差Di的比值为该特征的敏感度指标ξ。
(6)
当ξ<1时,ξ越小,敏感度越高,反之,敏感度越低;当ξ>1时,则该特征对区分故障状态无意义。通过ξ对8+3+J维特征集F进行筛选,得筛选特征集F′=[T′P′E′]。
主成分分析法(Principal Component Analysis,PCA)在尽量减少信息损失的同时实现指标降维融合,达到对数据的全面分析[16]。KPCA在PCA的基础上,采用非线性映射将原本数据空间中的非线性问题转化为映射空间中的线性问题,以完成非线性数据的特征降维融合。采用KPCA对筛选特征集进行降维融合以降低计算复杂度。
假设F′在原始空间R上,通过φ映射将F′映射到空间Γ,得到像φ(sm),sm为特征点,则映射后的特征φ(s)的协方差矩阵为
(7)
对矩阵C作特征矢量分析,设其特征值为λ,特征矢量为V,则λV=CV。
(8)
通过计算映射数据在特征矢量V上的投影可得降维后的融合特征集:
(9)
式中k为特征矢量个数。
DBN是由多层受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)和BPNN构成的深度神经网络。网络训练步骤分为预训练和整体参数优化[13]。
(1) 预训练。DBN通过贪婪学习算法对每层RBM进行逐层训练,上一层RBM训练结束后,将该RBM隐含层的输出作为下一层RBM的输入,依次完成所有RBM参数的初始化。
(2) 整体参数优化。每层RBM经过无监督预训练后,网络权值仅相对该层特征向量达到最优,无法确保整体DBN网络权值达到最优。BPNN作为DBN的最后一层,以RBM网络的输出作为其输入,通过把反向误差自顶向下传播至每层RBM,微调整个DBN网络的权值,从而使得整体DBN网络权值达到最优。反向参数优化各层的权值更新公式为
Δw(t)=m(t)Δw(t-1)+η(t)w(t-1)
(10)
w(t)=w(t-1)-Δw(t-1)
(11)
式中:Δw(t)为权重增量;w(t)为DBN层间的权重,t为更新次数;m(t)为DBN层间的附加动量;η(t)为DBN层间的学习率。
基于多域特征融合与DBN的矿用通风机滚动轴承故障诊断步骤如下:
(1) 通过小波包降噪方法对轴承原始振动信号进行降噪,并划分数据集,从4种不同状态的降噪数据集中分别提取120个样本,总计480个样本,其中测试集包含336个样本,训练集包含144个样本。
(2) 提取480个样本在时域、频域、IMF能量的特征量。
(3) 采用基于类内、类间标准差的特征敏感度指标对步骤(2)所得特征指标进行筛选。
(4) 通过KPCA对步骤(3)筛选后的多维特征集进行降维融合。
(5) 确定诊断网络DBN的相关参数。将训练集的融合特征输入到DBN网络中,以得到训练好的DBN诊断网络。
(6) 通过训练好的DBN诊断网络对测试集进行滚动轴承故障类型识别。
实验数据选用美国 Case Western Reserve University电气工程实验室的原始振动数据。选取通风机轴承在相同转速下无损伤和内圈、滚珠、外圈分别受到17.78 mm损伤的4种工作状态,对其故障类型进行诊断。首先对数据进行降噪,然后提取各域特征及融合特征并分析特征特点,最后将不同特征集T,P,E,F′和F″分别输入至DBN、PSO-SVM(粒子群优化支持向量机)和PSO-BPNN(粒子群优化BP神经网络)分类器完成故障诊断并分析结果。
选用小波包对实验数据进行分解和重构,对原始振动信号进行降噪处理。以外圈故障为例,原始信号和降噪信号如图1所示。与原始振动信号相比,降噪后的信号在某种程度上消除了异常的尖峰信号,噪声得到了降低。
图1 滚动轴承外圈故障的原始信号和降噪信号Fig.1 Original signal and noise reduction signal of rolling bearing outer ring fault
时域、频域特征根据表1获得;通过EEMD获取IMF分量时,设定附加高斯白噪声的均方差为 0.2,总体平均次数为50,根据分解后的IMF分量与原始信号的相关系数选取前4个IMF分量并求取其能量特征。时域特征、频域特征和IMF能量特征分布如图2—图4所示。图中横坐标0—120、120—240、240—360、360—480分别表示轴承无故障、内圈故障、滚珠故障和外圈故障4种状态所对应的特征样本。
(a) 时域特征分布1
(b) 时域特征分布2
(a) 频域特征分布1
(b) 频域特征分布2
从图2可看出,有效值判断故障类型的有效意义最大,均值特征不具有分析意义,因此直接用所有时域特征进行故障诊断会存在一定误差。从图3和图4可看出,4种运行状态下的频域特征和IMF能量特征差异比较明显,可进行初步故障诊断。
图4 IMF能量特征分布效果Fig.4 The IMF energy characteristics classification effect
计算15个特征的特征敏感度指标,结果见表2。根据对特征敏感指标ξ值的界定,时域特征中,样本均值对滚动轴承状态的判别无意义,有效值的值最小,与以上特征分布信息的分析结果一致。因此采用特征敏感度指标不仅可以实现对无用特征的剔除,还能选取分类效果较好的特征。
表2 各特征敏感度指标Table 2 Sensitivity index of each characteristics
采用KPCA对F′降维,得到主元成分贡献率,结果如图5所示,前3个主元的累计贡献率已达95%以上,故选取前3个主元做主成分,得到降维后的3维融合特征集F″,即特征1,特征2,特征3,通过式(6)求得3种特征所对应的ξ值分别为0.010,0.029,0.032,其分布如图6所示。
图5 主元成分贡献率Fig.5 Contribution rate of the principal element components
图6 融合特征分布效果Fig.6 Classification effect of fusion characteristics
为评估基于多域特征融合与DBN的矿用通风机滚动轴承故障诊断方法的分类效果,分别将特征集T、P、E、F′和F″输入至DBN、PSO-SVM及PSO-BPNN分类器中进行结果分析和对比,各网络参数设置如下:
(1) DBN参数设置:输入层节点数为输入所对应的特征维度;输出节点数为4,代表轴承的4种运行状态;设有2层RBM,RBM训练迭代次数取65,学习率为0.01,反向调整时,学习率为0.01,微调次数为10。
(2) PSO-SVM参数设置:PSO惯性因子为1,参数c1=c2=1.5,迭代次数为100,种群规模为20,粒子群速度取值范围为[-1,1],粒子群位置取值范围为[-5,5];SVM选取径向基核函数。
(3) PSO-BPNN参数设置:PSO惯性因子随迭代次数增加从0.9线性递减至0.5,参数c1=c2=2,迭代次数为100,种群规模为50,粒子群速度和粒子群位置取值范围为[-1,1];BPNN选取3层结构,输入节点数为输入所对应的特征维度,输出节点数为4,隐含层神经元节点数分别为6,4,5,6,4,学习速率为0.1,动量因子为0.9,期望误差为0.01。
将5种特征集输入至DBN中进行网络训练,得到的均方误差曲线如图7所示。可看出融合特征与DBN诊断网络的均方误差最早达到预期,且在迭代500次后很稳定,表明融合特征可提高DBN诊断性能。
将测试集输入至训练好的DBN、PSO-SVM及PSO-BPNN分类器中,得到的诊断结果见表3。其中,时间和准确率是指10次实验的平均耗时和平均准确率。
(a) 时域特征-DBN
(c) IMF能量特征-DBN
(e) 融合特征-DBN
表3 不同特征层与不同诊断层结合的诊断结果Table 3 Diagnosis results of different characteristics layers and combination with different diagnostic horizons
由表3可知,对比不同特征层、相同诊断层的诊断结果,特征层为融合特征的耗时最少、准确率最高;基于特征融合与DBN的矿用通风机滚动诊断方法的诊断效率优于PSO-SVM、PSO-BPNN诊断方法。
为验证基于特征融合与DBN轴承故障诊断方法的适应性,将轴承不同位置受到35.56 mm损伤的故障数据经过相同的处理输入至融合特征与DBN诊断网络中,10次实验的平均准确率达99.78%,平均诊断时间为0.491 s,表现出良好的稳定性和泛化能力。
(1) 将时域、频域、IMF能量、筛选、融合特征集输入至DBN中进行网络训练,融合特征与DBN诊断网络的均方误差最早达到预期,且在迭代500次后很稳定,表明融合特征可提高DBN的诊断性能。
(2) 将测试集输入至训练好的DBN、PSO-SVM及PSO-BPNN分类器中,表明基于特征融合与DBN的矿用通风机滚动轴承故障诊断方法的准确率最高、耗时最少。
(3) 对于不同损伤故障数据表现出良好的稳定性和泛化能力。