申永军, 段春宇, 王杜娟,杨绍普
(1.石家庄铁道大学机械工程学院 石家庄, 050043)(2.中国中铁工程装备集团有限公司 郑州, 450016)
基于α稳定分布和支持向量机的轴承模式分类*
申永军1, 段春宇1, 王杜娟2,杨绍普1
(1.石家庄铁道大学机械工程学院 石家庄, 050043)(2.中国中铁工程装备集团有限公司 郑州, 450016)
针对滚动轴承发生故障时振动信号表现出来的脉冲特性,提出了一种基于α稳定分布和支持向量机的模式分类方法。介绍了α稳定分布的定义和概率密度函数,并与故障轴承振动信号的概率密度函数曲线进行比较,证明了具有脉冲特性的轴承振动信号符合α稳定分布。用小波包分解技术对不同类型的轴承实测数据进行分解,并提取相应特征参数作为特征向量,建立支持向量机诊断模型,进行特征模式分类。通过与传统的基于峭度和方差的模式分类方法进行比较,表明该方法具有较高的诊断准确性。
α稳定分布; 小波包分解; 支持向量机; 故障诊断
α稳定分布又被称作非高斯稳定分布和重尾分布,是满足广义中心极限定理的一类分布。α稳定分布概念提出后,在信号处理领域得到了广泛的关注。不同领域的人员进行了大量关于α稳定分布噪声下的信号处理研究[1-5],也在故障诊断领域进行了一定研究。李长宁等[6]提出了α稳定分布的拟合方法并初步用于滚动轴承故障诊断。师宁宁等[7]提出了利用α稳定分布对齿轮进行故障识别的新方法。
机械故障诊断用到了很多信号处理和特征提取方法[8-9]。在机械故障诊断领域,关于α稳定分布理论的研究还不深入,实际应用的很少。滚动轴承发生故障时反映到振动信号上最明显的就是脉冲特性,表现出极强的非线性和非平稳特征。这种具有脉冲特性的故障振动信号的概率密度分布需要更高精度的处理技术去拟合,而α稳定分布能够精确地描述具有脉冲特性的信号。基于此,笔者提出了用α稳定分布来拟合具有脉冲特性的滚动轴承振动信号的思路,进一步利用小波包分解技术获得不同频段信号,得到了不同故障轴承振动信号的特征参数并作为特征向量,应用支持向量机进行故障模式分类。
如果随机变量X存在参数0<α≤2,γ≥0,-1≤β≤1和实数a,使其特征函数具有式(1)的形式,则随机变量X服从稳定分布[10]
(1a)
(1b)
其中:α为特征指数,决定该分布的脉冲特性程度;β为对称参数,表征α稳定分布概率密度曲线的偏斜程度;a为位置参数;γ为分散系数,表示α稳定分布围绕位置参数的分散程度。
当α=2时,α稳定分布退化为高斯分布,即高斯分布仅是α稳定分布的一个特例。一般的α稳定分布的概率密度函数没有统一的封闭表达式,但可以得到标准的α稳定分布(a=0,γ=1)的概率密度函数的幂级数展开式。特别是当β=0时,称为对称α稳定分布(symmetricalαstable distribution, 简称SαS分布)。标准SαS分布的概率密度函数为
(2)
图1给出不同α值所产生的标准SαS分布噪声随机序列;图2给出了不同α值所对应的α稳定分布的概率密度函数曲线及其拖尾细节。
图1 不同α值产生的随机序列
从图1可以看出,服从α稳定分布的样本具有明显的脉冲特性,非常适合描述滚动轴承等机械部件中的冲击型故障信号。从图2可以看出,α稳定分布的PDF曲线比高斯分布的PDF曲线有更显著的尖峰,却比高斯分布有更厚重的拖尾,且α值越小,拖尾越厚。因此,α稳定分布相比于高斯分布更适合描述脉冲冲击型的随机变量。
2.1 仿真信号处理
由于滚动轴承的故障信号具有明显的脉冲特性,在统计信号处理方法的研究中,将其假设为高斯分布则会带来较大误差。以一组滚动轴承故障仿真信号为例,画出它的概率密度曲线图,分析其与高斯分布曲线的差异。
图2 不同α值的概率密度函数曲线及拖尾细节
用两个谐波频率调制一个指数衰减的脉冲来仿真滚动轴承的脉冲信号,仿真表达式为
x(k)=e-qt'(sin2πf1kT+1.2sin2πf2kT)
(3)
其中:t'=mod(kT,1/fm);q=550;fm=100 Hz;f1=3 000 Hz;f2=8 000 Hz;采样间隔T=1/25 ks;q,fm,f1,f2分别表示指数频率、调制频率和两个载波频率。
仿真信号时域波形如图3所示。
图3 未加噪声仿真信号时域波形
利用对数法估计得到α=0.22;γ=0.001 8。图4给出了仿真信号、高斯分布和α稳定分布的PDF曲线。从图中可以看出,α稳定分布能够更准确地反映滚动轴承振动信号的概率密度分布。
图4 仿真信号概率密度分布与高斯分布及α稳定分布的拟合曲线
2.2 实验数据处理
笔者采用QPZZ-Ⅱ机械故障模拟及实验平台进行实验。选取滚动轴承的型号为NU205EM,在无故障的滚动轴承上进行加工,制造出内圈故障、外圈故障和滚子故障来模拟实验。对内外圈故障分别在250~1 100 r/min转速过程中采集到28组实验数据,然后从中随机抽取1组进行分析,得到处理结果如图5和图6所示(选取的信号转速为912 r/min)。
图5 内圈故障信号概率密度分布与高斯分布及α稳定分布的拟合曲线
图6 外圈故障信号概率密度分布与高斯分布及α稳定分布的拟合曲线
由图4~图6可知,无论是仿真信号还是实际采集到的滚动轴承故障信号,都可以很明显地观察到滚动轴承故障信号的脉冲特性。在相同转速下,外圈故障的脉冲性要强于内圈故障的脉冲性,其信号分布更集中(信号分布区间更小),概率密度的尖峰更大。对于实验数据概率密度曲线的拟合,α稳定分布的拟合精度要比高斯分布高得多,即脉冲冲击下的滚动轴承振动信号更符合α稳定分布。
3.1 支持向量机
支持向量机(support vector machine,简称SVM)是从线性可分情况下最优分类平面发展而来,其核心思想是建立一个超平面作为决策曲面,使正反例之间的隔离边缘最大化[11]。
(4)
该优化问题的约束条件为
yi[ωTΦ(xi)]-1+ζi≥0
(5)
其中:ζi为松弛因子(ζi≥0);C为惩罚因子;b为分类阈值;Φ为非线性变换函数。
松弛变量的值实际上反映了对应的点到底离群有多远,值越大,点就越远。C用来衡量最大间隔和最小分类误差,太小起不到惩罚作用,太大则由于误差的影响会导致错误。Φ将样本从原空间映射到高维特征空间,并在高维特征空间中求最优分类面。
按照泛函理论,如果一核函数K(xi,yi)满足Mercer条件,它就对应某一变换空间的内积K(xi,yi)=Φ(xi)Φ(yi),因此在高维特征空间只需进行内积运算,而不必知道Φ的具体形式。
SVM中不同的内积核函数可构造实现输入空间中不同类型的非线性决策面的学习机,从而形成不同的算法。常用的核函数有线性核函数、多项式核函数、径向基核函数和sigmoid核函数等,笔者采用的是径向基核函数(radial basis function,简称RBF)。
3.2 特征提取
分析α稳定分布中的4个参数,其中对称系数对于滚动轴承信号来说,一般情况下等于0或近似等于0,而对于位置参数也可以通过去均值法使其为0。因此,有效的特征参数只剩下特征指数α和分散系数γ,用对数法估计出α和γ,将α和γ作为特征进行提取。
3.3 实验分析
将上述特征提取方法应用于轴承的故障诊断实验中,分别对正常、内圈故障、外圈故障、滚子(深)故障和滚子(浅)故障在转速为640~650 r/min进行数据采集,采样频率为4 kHz,采样点数为65 536,得到5类样本数据,其振动信号的波形如图7所示。
图7 滚动轴承振动信号
分别对每类信号估计特征指数和分散系数,可以得到2个条件属性。考虑到每个信号是平稳的并且足够长,因此可以将数据分段。笔者将每个信号分成30段,每段数据长度为2 000,这样每种类型的故障就拥有了30个信号,从而产生30组2维向量。每组数据对应的状态类型分别表示如下:1为正常状态;2为内圈故障;3为外圈故障;4为滚子故障(浅);5为滚子故障(深)。从每个类型的30组特征向量中任意选取20组,作为训练样本,剩下的10组用于检测,数据集的详细描述如表1所示。
首先,按照LIBSVM工具箱所要求的格式准备数据集;然后,选用RBF作为核函数,获得支持向量机模型;最后,利用获取的模型进行测试。根据惩罚因子C的不同得到如表2所示结果。
表1 滚动轴承数据集
表2 不同参数下各种状态类型的故障诊断结果
Tab.2 The fault diagnosis results of various types with different parameters
Cg准确率/%12345 10.7 6070100100400.076070100100400.0076070100100400.0007607010010040100.7 9070100100400.077070100100400.0076070100100400.00076070100100401000.7 10070100100400.079070100100400.0079070100100400.000790701001004010000.7 10070100100500.0710070100100400.0079070100100400.0007907010010040100000.7 10070100100500.0710070100100500.00710070100100400.0007907010010040
实验结果表明:直接应用特征指数和分散系数进行分类,对于外圈故障和滚子故障(浅)的故障分离效果相当明显;惩罚因子对实验结果具有一定的影响,通过改变惩罚因子可以提高故障诊断的准确率;g对结果的影响不是很大。为了对比基于特征指数和分散系数的分类方法与基于峭度和方差的分类方法的效果,笔者做了基于峭度和方差的支持向量机故障诊断实验,结果如表3所示。
相比于基于峭度和方差的支持向量机故障诊断实验效果,基于α稳定分布的支持向量机故障诊断方法的效果相当明显。然而对于内圈故障和滚子(深)故障并不能通过选择最优惩罚因子得到很好的分离效果。究其原因,是仅此两个特征参数所构成的向量维数过少,无法满足分类要求。
表3 基于峭度和方差的故障诊断结果
Tab.3 The fault diagnosis results of various types based on kurtosis and variance
Cg准确率/%1234510.7 50508040300.0750508060400.00740508060400.00073040808040100.7 50507040400.0750508060400.00730508050400.0007504080100401000.7 60606040300.0750506060400.00750408060400.0007304070904010000.7 60705040400.0750508060300.00750507060400.00073060706040100000.7 70805020400.0740506060300.00750508050400.00073050807040
3.4 改进方法
为了提高分类效果,引入小波包变换,即通过小波包分解的方式进行预处理。应用小波包分解技术[12]将原始信号频带进行多层次划分,进一步对多分辨分析中未做细分的高频部分进行分解,使信号更为精细,同时扩充了向量维数。该方法的流程如下。
1) 小波包分解。利用小波包对原始信号进行双层分解,选择db2作为小波基函数,这样可以得到4个反映原信号不同频段特征的信号,此处给出内圈故障的小波包分解信号,如图8所示。
图8 滚动轴承内圈故障小波包分解信号
2) 特征参数提取。将小波包分解得到的4个信号分别用对数法估计其特征指数α和分散系数γ,组成一个8维的特征向量。不同工况全部特征指数α和分散系数γ的均值和标准差如表4所示。
表4 训练数据集不同工况下特征指数α和分散系数γ的比较
从表4可以看出,5种工况的特征指数α和分散系数γ的标准差都很小,说明比较稳定,而且在不同频段α和γ并不相同,因此α和γ可以作为滚动轴承故障诊断的特征。进行上述实验步骤,利用支持向量机进行分类,得到改进后的实验结果如表5所示。
利用改进后方法能够很精确地提取故障类型,尤其是正常状态、外圈故障和滚子故障(浅),几乎不受惩罚因子的影响,正确率都能达到100%;而通过改变惩罚因子,内圈故障和滚子故障(深)的正确率也能达到100%。
为了说明α稳定分布在滚动轴承故障诊断中的优越性,笔者也在小波包分解的基础上进行了基于峭度和方差的支持向量机故障诊断实验,结果如表6所示。
表5 改进后不同惩罚因子下各种状态类型的故障诊断结果
Tab.5 Improved results of fault diagnosis of various types with different penalty factors
Cg准确率/%12345 10.7 10040100100800.0710040100100800.00710030100100800.00071003010010080100.7 100701001001000.07100701001001000.007100601001001000.0007100601001001001000.7 100801001001000.07100801001001000.007100801001001000.00071008010010010010000.7 1001001001001000.071001001001001000.0071001001001001000.0007100100100100100100000.7 1001001001001000.071001001001001000.0071001001001001000.0007100100100100100
表6 基于峭度和方差的不同惩罚因子下各种类型故障诊断结果
Tab.6 The fault diagnosis results of various types with different penalty factors based on kurtosis and variance
Cg准确率/%12345 10.7 10100101000.0740010501000.00750040501000.00076070805040100.7 1000101000.0750020501000.00760040501000.000770605050501000.7 10100101000.0750020501000.00760040501000.0007806040505010000.7 10100101000.0750020501000.00760040501000.00078060405050100000.7 10100101000.0750020501000.00760040501000.00077060405050
通过表6能够发现,基于峭度和方差的分类方法总是有两类(或几类)故障特征较为接近,不能很好地反映两者(或多者)之间的差异,即便再增大惩罚因子,也不能获得更为准确的判断,分类效果不甚理想。表2中,内圈故障和滚子故障(深)诊断准确率远低于其他状态类型,也恰恰说明了两类故障特征相近,不易区分;但α稳定分布的特征指数α和分散系数γ还是比传统的峭度和方差更准确地表达了故障特征。表5充分展示了经过改进后方法的优越性,不仅能对特征较鲜明的正常信号、外圈故障和滚子故障(浅)进行准确分类,还精确地分离出了较难区分的内圈故障和滚子故障(深)。
笔者通过对轴承故障信号的概率密度函数拟合,证明了轴承故障信号更符合α稳定分布,并在此基础上提取出了能够反映特征信息的相关特征参数,通过小波包分解理论和特征参数构成特征向量,进而利用支持向量机对故障进行了分类。该方法计算简单,故障分类准确率高,在故障诊断和状态监测中应用前景广阔。
[1] Rajan A, Epedelenlioglu C T.Diversity combining over rayleigh fading channels with symmetric alpha-stable noise[J]. IEEE Transactions on Wireless Communications, 2010, 9(9): 2968-2976.
[2] Li Sen, Qiu Tianshuang, Zha Daifeng. Adaptive blind equalization for MIMO systems under α-stable noise environment[J]. IEEE Communications Letters, 2009, 13(8): 609-611.
[3] Ma Shuang, Zhao Chunhui, Wang Ying. Fractional low order cyclostationary spectrum sensing based on eigenvalue matrix in alpha-stable distribution noise[C]∥The First International Conference on Pervasive Computing Signal Processing and Applications. Harbin, China:IEEE Computer Society,2010:500-503.
[4] 顾陈, 何劲, 朱晓华. 冲击噪声背景下基于最小归一化均方误差的波束形成算法[J]. 电子学报, 2010, 38(6): 1430-1433.
Gu Chen, He Jin, Zhu Xiaohua. Minimum mean square normalized-error beamforming amid heavy-tailed impulsive noise of unknown statistics[J]. Chinese Journal of Electronics, 2010, 38(6): 1430-1433.(in Chinese)
[5] Xia Weijuan, Zhu Lidong, Xiong Xingzhong. Fractional lower order statistics based generalized constant modulus algorithm for blind multi-user detection in DS/CDMA systems[C]∥International Conference on Wireless Communications and Signal Processing. Suzhou, China:IEEE Communication Society,2010: 1-6.
[6] Li Changning, Yu Gang. A new statistical model for rolling element bearing fault signals based on alpha-stable distribution[C]∥ 2010 Second International Conference on Computer Modeling and Simulation.Sanya,China:IEEE Computer Society,2010: 384-390.
[7] Yu Gang. Shi Ningning. Gear fault signal modeling and detection based on alpha stable distribution[C]∥International Symposium on Instrumentation & Measurement, Sensor Network and Automation. Sanya,China:IEEE Communication Society,2012: 471-474.
[8] 申永军, 张光明, 杨绍普, 等.基于Gabor变换的欠定盲信号分离新方法[J].振动、测试与诊断, 2011, 31(3): 309-313.
Shen Yongjun, Zhang Guangming, Yang Shaopu, et al.New method for blind source separation in under-determined mixtures based on Gabor transform[J].Journal of Vibration, Measurement & Diagnosis, 2011, 31(3): 309-313.(in Chinese)
[9] 胡爱军, 孙敬敬, 向玲.经验模态分解中的模态混叠问题[J].振动、测试与诊断, 2011, 31(4): 429-434.
Hu Aijun, Sun Jingjing, Xiang Ling.Mode mixing in empirical mode decomposition[J].Journal of Vibration, Measurement & Diagnosis, 2011, 31(4): 429-434.(in Chinese)
[10]邱天爽, 张旭秀, 李小兵,等. 统计信号处理-非高斯信号处理及其应用[M].北京:电子工业出版社, 2004:139-172.
[11]袁胜发, 褚福磊. 支持向量机及其在机械故障诊断中的应用[J]. 振动与冲击, 2007,26(11): 36-40.
Yuan Shengfa, Chu Fulei. Support vector machines and its applications in machine fault diagnosis[J]. Journal of Vibration and Shock, 2007,26(11): 36-40.(in Chinese)
[12]曾芸, 武和雷. 基于小波包的频带能量特征提取及智能诊断[J]. 计算技术与自动化, 2008, 27(4) : 115-117.
Zeng Yun, Wu Helei. The energy characteristics on the frequency bands extracted eased on the wavelet packet and intelligent diagnosis[J]. Computing Technology and Automation, 2008, 27(4): 115-117.(in Chinese)
10.16450/j.cnki.issn.1004-6801.2015.06.011
*国家自然科学基金资助项目(11072158, 11372198);教育部新世纪优秀人才支持计划资助项目(NCET-11-0936);河北省高等学校创新团队领军人才计划资助项目(LJRC018);河北省高等学校高层次人才科学研究资助项目(GCC2014053);河北省高层次人才资助项目(A201401001)
2014-09-15;
2015-01-07
TH17; TN911
申永军,男,1973年12月生,博士、教授、博士生导师。主要研究方向为机械系统的非线性动力学、振动控制与故障诊断。曾发表《基于分数Fourier变换的自适应信号降噪方法》(《振动工程学报》2009年第22卷第3期)等论文。 E-mail:shenyongjun@126.com