丁国荣,王文波
(武汉科技大学 理学院,武汉 430065)
自动扶梯是地铁车站内必不可少的大型公共交通设备,已成为了人们生活中广泛使用的特种设备之一。自动扶梯设备常年处于工作状态,当维保人员进行日常巡查时,只能知道当前自动扶梯的状态,对于此前的情况却无法得知,这对于自动扶梯的安全性有很大隐患,一旦发生故障,小则影响运营,大则引发安全事故。自动扶梯故障主要有轴承故障、主机故障、梯级故障、扶手带故障以及链条故障等。近年来,随着数据挖掘技术的快速发展,可以在特定位置通过传感器实时采集海量的数据,基于海量的数据提取故障类型特征,通过提取的故障类型特征进行故障诊断以及分类。
梯级作为自动扶梯的关键部位,其固定螺栓发生松动必然会导致自动扶梯运行故障。当梯级固定螺栓发生松动时,其振动信号会表现出明显的非平稳性。对于非平稳振动信号,需要采用合适的时频分析方法来提取故障特征分量[1-2]。加窗傅里叶变换(short time fourier transform,STFT)和小波变换(wavelet transform,WT)是比较常见的时频分析方法,邢蓉等人采用SFFT对滚动轴承信号进行频谱分析,通过多尺度卷积神经网络中分析可以有效提升故障的诊断精度[3]。但是在实际应用的其他方面,由于STFT和WT的窗函数选取对分析结果影响较大,在整个过程中都不能替换,所以不具备自适应性在应用中有所限制[4]。Huang 等[5-6]提出的经验模态分解(empirical mode decomposition,EMD)是一种自适应分解的方法,兰夏燕等人基于EMD分解对电梯导靴振动信号故障进行特征提取,首先对突变信号进行EMD分解得到若干固有模态函数(intrinsic mode function,IMF),然后计算IMF分量的Hilbert边际谱,最后获得电梯导靴故障的特征频率信息[7]。但是该方法存在端点效应以及模态混叠等问题。针对EMD的模态混叠现象,Wu 等[8]提出的集合经验模态分解(ensemble empirical mode decomposition,EEMD )可在一定程度上改善模态混叠现象,高立龙等人使用改进的EEMD方法对液压系统突然换向引起的冲击振动信号进行分析,通过选取代表信号特征的IMF分量,可以为智能诊断提供依据[9]。由于本身算法递归迭代的局限性,仍然存在一定的分解误差。局部均值分解(local mean decomposition,LMD)是由Jonathan S.Smith 等[10]学者提出的一种新的自适应非平稳信号处理方法,但是该方法存在由解调而引起的信号突变问题[11]。
鉴于EMD、EEMD和LMD方法自身的局限性,很多学者提出了针对性的优化和改进策略。变分模态分解(variational mode decomposition,VMD)是Dragomiretskiy等[12]人提出的一种新的自适应信号分解方法,该方法通过循环迭代求解约束变分方程的最优解来确定IMF分量,实现信号各个频率分量的分离。与上述几种方法相比,VMD不仅具有扎实的理论依据,而且对于噪声也不敏感。
近年来,在故障诊断领域,白堂博等人基于VMD和奇异值分解(singular value decomposition,SVD)提取旋转机械故障的早期微弱信号,该方法可以有效地提取故障信号的周期成分,去除噪声干扰,具有很好的微弱特征提取能力,可大幅度提高故障诊断的准确性[13]。李余兴等人提出一种基于VMD分解、中心频率、复杂度特征和支持向量机(support vector machine,SVM)的舰船辐射噪声特征提取及分类识别方法,通过提取能量最大的IMF中心频率和排列熵作为特征参数,并利用SVM对四类舰船信号样本进行分类识别。与已有方法对比,提高了识别率[14]。罗小燕等人提出一种基于VMD和SVD的联合降噪方法,试验结果表明,该方法能够去除磨机筒体信号中的噪声,提高了信号后续分析处理的可靠性[15]。李亚兰等人提出一种VMD和特征融合相结合的雷达辐射源信号识别方法,对提取的IMF分量提取排列熵和样本熵特征进行特征融合构成6维特征向量,最后用SVM对辐射源信号进行识别[16]。张建财等人提出基于VMD和多尺度排列熵的滚动轴承故障特征提取方法,并采用经粒子群算法优化的概率神经网络故障诊断模型进行故障类型识别[17]。唐贵基等人通过分析VMD分解中的惩罚因子及分量个数的设置对VMD方法滤波特性的影响,能够有效区分轴承早期故障信号中的微弱特征信息,实现故障类型的准确判别[18]。
近年来发展起来的高阶统计量(higher order statistics,HOS)的理论和方法,为非高斯噪声的处理提供了强有力的手段,已经成为现代信号处理的核心内容之一。祁广云等人针对剩余电流保护技术中生物触电支路的触电电流具有复杂性及多样性的问题,应用HOS与STFT相结合的方法,分析了剩余电流及触电电流特征量的变化规律[19]。冯正权等人探讨了高阶统计量在生物医学信号处理中的应用,得出高阶统计量不仅包含原始信号的幅度信息,还包括其相位信息,能解决非高斯、非线性问题,在理论上可以完全抑制高斯有色噪声的影响,是一种分析具有非线性特征信号的理想工具[20]。
鉴于VMD方法在诸多领域所呈现出的优异特性,本文将其引入到自动扶梯故障诊断,用于分解梯级固定螺栓的振动信号。结合高阶统计量(三阶累积量)提取振动信号的特征,作为随机森林(random forest,RF)分类模型的输入特征参数,RF的目标输出参数为固定螺栓的3种不同状态,本文所提出的方法成功地将梯级固定螺栓正常、松动一圈和松动三圈的信号进行分类,提取的三类信号的特征非常明显,从而实现自动扶梯梯级故障诊断。
VMD算法是Dragomiretskiy等人在2014年提出的一种新的自适应信号分解方法,主要目的是将信号f分解成K个IMF分量μk(t),每个IMF分量可以看作是存在不同中心频率的调幅-调频信号:
μk(t)=Ak(t)cos(φk(t))
(1)
式(1)中,Ak(t)为瞬时幅值,φk(t)的一阶导数为瞬时频率。每个IMF分量集中分布在中心频率附近,通过迭代求解变分模态方程的最优解来确定每个IMF分量的频率中心和带宽,实现信号各个IMF分量的有效分离。VMD分解构造受约束的变分模型为:
(2)
(3)
式(2)、(3)中,{μk}={μ1,μ2,…,μK}表示分解得到的K个IMF分量,{ωk}={ω1,ω2,…,ωK}各分量的频率中心,K表示IMF分量的数量,f为原始输入信号。
为了求解该约束变分问题,引入二次惩罚因子α和Lagrange 算子λ(t)以消除其约束条件,进一步求出受约束的变分模型的最优解。构造的Lagrange 方程为:
L({μk},{ωk},λ)=
(4)
VMD的算法流程如下:
2)n←n+1,并根据式( 4) 更新uk和ωk;
3) 更新λ:
(5)
在信号处理过程中,奇异值分解可用来对信号进行降噪滤波、特征提取和弱信号分离。在奇异值理论中,任何一个矩阵A∈Rm×n,必然存在正交矩阵U,V使得:
(6)
式(6)中,U和V是m×m阶和n×n阶正交矩阵,S=[diag[σ1,σ2,…,σq],0],其对角元素为A的奇异值,并按降序排列[18-19]。
一般测量的原始信号x(t)通常由两部分组成:真实信号s(t)和噪声信号n(t),并且真实信号和噪声信号互不相关。将原始信号构造成矩阵M后,再将矩阵M进行奇异值分解,其中较大的奇异值对应于真实信号,较小的奇异值对应于噪声信号的重构[20]。
将噪声信号对应的奇异值置为0后,通过SVD逆重构信号,以获得降噪后的新信号。
高阶统计量是随机过程的新的数字特征,通常指阶数大于二阶的统计量。从统计学的角度,对正态分布的随机变量可以用一阶、二阶统计量来表示其统计特征,对于不服从高斯分布的随机变量,一阶和二阶统计量无法完备表示包含的信息。由于高阶统计量不仅包含原始信号的幅度信息,还包含其相位信息,能解决非高斯、非线性问题[21-23]。因此在实际生活中广泛应用。
给定一组n维随机变量(x1,x2,…,xn),其概率密度函数为f(x1,x2,…,xn),则其第一联合特征函数为:
(7)
第二联合特征函数为第一联合特征函数的对数:
Ψ(ω1,ω2,…,ωn)=ln(Φ(ω1,ω2,…,ωn))
(8)
如果随机变量相互独立,则第一联合特征函数为各变量第一特征函数之积,第二联合特征函数为各变量第二特征函数之和。
设{x(n)}为零均值的k阶平稳随机过程,则该过程的k阶矩mkx(τ1,τ2,…,τk-1)定义为:
mkx(τ1,τ2,…,τk-1)=Mon(x(n),…,x(n+τk-1))
(9)
K阶累积量ckx(τ1,τ2,…,τk-1)定义为:
ckx(τ1,τ2,…,τk-1)=Cum(x(n),…,x(n+τk-1))
(10)
式(9)、(10)中,Mon(·),Cum(·)为k元变量的矩和累积量。
对于绝对可和的高阶累积量ckx(τ1,τ2,…,τk-1),即满足:
(11)
则k阶累积谱为k阶累积量的(k-1)维傅里叶变换:
(12)
高阶统计量不仅包含原始信号的幅度信息,还包含其相位信息,能解决非高斯、非线性问题[24-26]。
随机森林是一种组成式的有监督学习方法,在随机森林的算法中,同时生成多个预测模型,并将模型的结果汇总以提升分类准确率。
随机森林的算法涉及到两部分的随机抽样,分别是对样本单元抽样和对变量因子抽样,以此来生成大量决策树。对每一个样本单元来说,所有决策树依次对该样本单元进行分类,所有决策树预测类别中的众数即为随机森林所预测的这一样本单元的类别。图1为随机森林分类的流程图。
图1 随机森林分类流程图
基于VMD和HOS的梯级振动信号特征提取和分类识别步骤如下:
1)获取三类梯级固定螺栓振动信号,设置VMD分解的参数;
2)对三类振动信号进行VMD分解,得到一组IMF分量,并且选出最优的主IMF分量;
3)对主IMF分量进行SVD降噪,重组得到去噪后的主IMF分量;
4)用高阶统计量对去噪后的主IMF分量进行故障特征提取;
5)采用随机森林算法对三类振动信号的特征参数进行分类识别分析,得出故障诊断分类结果。
图2 本文算法流程图
根据文献[27]中的方法选取主IMF分量来进行特征提取。如果目标信号共分解为M阶模态,第m阶模态共有N个采样点,第n个采样点的瞬时频率为fmn,瞬时振幅为bmn,则第m阶模态的第n个采样点的瞬时强度为:
(13)
原始信号的第m阶固有模态函数的中心频率为:
(14)
原始信号第m阶固有模态函数的平均强度为:
(15)
定义平均强度最大的那一阶IMF分量为主IMF分量,即:
(16)
为验证本文方法的有效性,采用振动传感器(图3所示)采集自动扶梯梯级的振动信号,采样频率为2 000 Hz,通过吸铁石安装在自动扶梯梯级固定螺栓的位置。分别采集梯级固定螺栓正常、松动一圈和松动三圈的信号,截取一部分信号如图4所示。
图3 振动传感器示意图
图4 梯级振动原始信号
根据之前的介绍,首先对3种不同类型的梯级振动信号进行VMD分解,其中:VMD分解层数为5层,二次惩罚因子α=2 000,得到的各阶IMF分量如图5所示。
(a)正常振动信号
通过式(15)来确定平均强度最大的IMF分量,对确定的主IMF分量进行SVD分解重构降噪,得到的信号如图6所示。
图6 三类去噪后的主IMF分量
高阶累积量不仅可以自动抑制高斯噪声的影响,而且也能抑制对称分布噪声的影响,所以在信号检测以及目标分类识别等领域取得了广泛应用。本文采用三阶累积量对去噪后的主IMF分量来进行特征提取。
为了说明本文所提出方法提取特征的有效性,这里选用互补集合经验模态分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)、平稳小波变换(Stationary Wavelet Transform,SWT)以及直接用原始信号来做对比实验。其中CEEMD的分解层数为5层,SWT的分解层数为3层,小波基选用“db8”。4种方法提取的特征如图7所示。
从图7中可以看出,本文方法提取的特征要明显优于前面3种方法,提取的3种类别梯级振动信号的特征很明显,可以诊断出梯级故障,CEEMD和SWT在一定程度上都出现混叠,提取的特征不明显。
为了验证本文所提方法的有效性,基于采集到的信号构造训练集和测试集来验证,然后用随机森林分类器来验证准确率。对于本文的分类预测精度,采用准确率(ACC)、灵敏度(Se)、特异性(Sp)、正例命中率(TPR)和负例命中率(TNR)5个指标来进行评估,各个指标的定义如下:
(17)
(18)
(19)
(20)
(21)
其中:TP为分类正确的正常信号数目,TN为分类正确的有故障的信号数目,FP为分类错误的正常信号数目,FN为分类错误的有故障的信号数目。
(a)原始信号提取的特征
从表1中可以看出本文所提出方法的准确率、灵敏度以及特异性均优于其他几种方法,梯级振动信号的特征提取的比较明显,可以实现自动扶梯梯级振动的故障诊断分类。由于VMD分解求解的原因,本文方法所用的时间较长一点。
表1 4种方法的评价指标对比
本文将VMD算法引入自动扶梯梯级故障诊断分析中,并结合SVD去噪和RF算法提出一种自动扶梯信号特征提取及分类识别方法。首先将3种不同故障类型的信号进行VMD分解得到主IMF分量,然后对主IMF分量进行SVD降噪得到新的重构信号。对新的重构信号用高阶统计量进行特征提取,最后通过实验结果表明,该方法可以有效提取自动扶梯梯级故障,实现故障诊断与分类。