陆超,陈捷,洪荣晶
(南京工业大学机械与动力工程学院, 211800, 南京)
采用概率主成分分析的回转支承寿命状态识别
陆超,陈捷,洪荣晶
(南京工业大学机械与动力工程学院, 211800, 南京)
针对回转支承故障特征微弱以及难以提取的特点,提出一种基于概率主成分分析(probabilistic principal component analysis, PPCA)的多领域特征提取方法。该方法从振动信号的时域和时频域中提取出多个能够表征回转支承运行状态的特征向量,并将其组成高维特征集。采用PPCA从高维特征集中提取出最能够反映回转支承寿命状态信息的特征量,将其输入粒子群算法优化的支持向量机中进行寿命状态的识别。通过回转支承全寿命实验证明,基于PPCA的特征提取方法优于传统的主成分分析(principal component analysis, PCA),其相应的寿命状态识别精度提高了约8%,并且多领域、多变量的特征更能全面反映回转支承的性能退化趋势。与传统的特征提取方法相比,所提方法能够更全面有效地反映复杂恶劣环境下回转支承的故障信息,因此可以用于回转支承的健康监测领域。
回转支承;性能退化;概率主成分分析;支持向量机;状态识别
回转支承已在风力发电和工程机械中得到广泛应用,其性能的好坏直接影响设备的正常运行,因此对其进行健康监测就显得尤为重要。大量文献表明,振动信号分析是回转支承健康监测最有效的方法之一。文献[1]从振动信号中提取时域的均方根(root mean square, RMS)、偏度和峭度指标作为研究回转支承退化趋势预测时的特征向量;文献[2-4]在时频域方面分析轴承的振动信号,将经验模态分解得到的固有模态能量作为特征向量;文献[5-6]通过时频域领域的小波分解提取出特征向量研究轴承的状态评估。进一步研究发现,虽然以上特征向量可以在不同程度上反映回转支承运行时的状态信息,但是单个的或者某个领域的特征向量难以全面、准确地描述出复杂恶劣环境下回转支承的状态信息。文献[7]提出一种混合时域和时频域的多特征融合提取方法;文献[8]提取信号的功率谱熵、小波熵、峭度等作为故障特征分析轴承的退化程度;文献[9]提出一种基于圆域、时域和时频域的特征向量提取方法。以上研究表明,基于多领域和多变量的特征提取方法能够更全面地反映回转支承的运行状态信息。
如何有效利用这些多领域和多变量组合而成的高维特征集,成为寿命状态识别领域一个急需解决的问题。为了尽可能地利用有限的状态信息,大量的特征向量被提取出来,这势必会带来“维数灾难”问题。因此,该问题的关键是怎样从高维特征集中提取出最能反映轴承故障信息的特征,剔除那些不敏感的冗余的特征量。文献[10]提出了一种基于PCA特征降维方法;文献[11]针对PCA在处理非线性复杂问题时的固有缺点,提出一种改进的特征降维方法——核主成分分析(KPCA)方法,有效提高了模型的精度。但是深入研究发现,以上降维方法在剔除冗余特征向量时,只是简单地舍弃非主成分的因子,因此容易丢失有用的信息。
本文通过提取振动信号时域和时频域的多个特征向量,以构建高维特征向量集,采用概率主成分分析(PPCA)提取出最能够反映回转支承运行状态的特征量并输入支持向量机(support vector machine,SVM)中进行寿命状态识别。最后,以回转支承全寿命实验验证了所提方法的有效性与优越性。
1.1 时域特征提取
1.2 时频域特征提取
小波变换是信号时频域分析领域的一个有效工具,它能有效地提取出信号中的信息。小波能量熵(wavelet energy entropy,WEE)是小波变换和信息熵的结合,它可以从整体上反映原信号在不同尺度空间能量分布的无序程度,并能够很好地检测出故障的突变点,因此经常被用于故障特征的识别分类[12]。
经验模态分解(empirical mode decomposition,EMD)是另一种处理非线性信号的时频分析方法。信号经过EMD分解后可得到各本征模函数分量(intrinsic mode function,IMF),该分量包含了原信号不同时间尺度的局部特征信息,且本征模函数能够内在地描述原信号的特征,因此可以对信号起到识别作用。
2.1 采用概率主成分分析进行高维特征降维
PCA是一种线性降维技术,它可以在尽可能保证不丢失原始变量所包含信息的基础上有效实现多维数据降维的目的,现已广泛应用在模式识别及特征提取等领域,其算法可参考文献[7,10,14]。PPCA是传统PCA的延伸,其目的是为PCA定义一个恰当的概率模型,从而克服传统PCA简单丢弃其他非主成分因子的局限性。在PPCA中,这些丢弃的信息将作为高斯噪声进行估计,因此PPCA可以最大程度地保留原始信号的有用信息[15]。
给定一个d维向量x,概率主成分分析首先假设向量x满足如下模型关系
(1)
(2)
为了得到模型的W和σ2,采用EM算法进行估计,推导出其迭代公式
(3)
(4)
图1 寿命状态识别流程图
式中:S是样本数据的协方差矩阵;C=WWT+σ2Id;未知参数W和σ2可通过无数次迭代直至收敛求得。求得未知参数之后便可得到降维后的数据
(5)
为了全面反映回转支承的运行状态信息,大量的时域和时频域特征被提取出来,然而这势必会带来“维数灾难”问题,从而影响预测的精度和效率。本文采用PPCA剔除那些隐藏在高维特征集中的不敏感的冗余特征量,该方法既保证了有限信息的充分挖掘和利用,又能很好地避免“维数灾难”问题。
2.2 回转支承寿命状态识别流程
回转支承寿命状态智能识别模型的流程图如图1所示,具体实现步骤如下。
步骤1 使用状态寿命来评估回转支承的健康状况,定义回转支承状态寿命类型集L={正常使用,初始损失,故障加剧,严重破损},定义其相应的寿命状态函数值f={1,2,3,4}。采集回转支承全寿命实验的振动信号,为特征提取提供有效数据。
步骤2 从振动信号中提取出时域、IMF能量和小波能量熵等多个特征向量,并将其组成多领域的高维特征集。
步骤3 利用PPCA降维技术从高维特征集中提取出最能够反映回转支承寿命状态的特征量。
步骤4 将步骤3得到的特征量和相应的寿命状态函数值f组成训练样本,输入支持向量机中进行训练。
(a)实验台主视结构图
步骤5 将测试样本的特征量输入训练完毕的模型,此时的输出即为相应的寿命状态函数值,以此检验模型的精度。
(b)实验台实物图图2 实验台结构
回转支承实验台如图2所示,该回转支承实验台主要由机械部分、液压部分和测控部分等组成。液压部分由液压马达、液压缸等组成,通过倾覆力加载油缸施加倾覆力,轴向力油缸施加轴向力,并通过液压马达驱动小齿轮旋转,从而带动与小齿轮啮合的回转支承转动。
以某一型号风电回转支承为研究对象,其滚道中心直径D为730mm,滚珠数目Z为91,转速n=4r/min,接触角α为45°,回转支承材料为42CrMo。通过加大载荷的方式对其进行加速寿命实验。针对回转支承不同部位受力各不相同的情况,将加速度传感器沿周向间隔90°均匀布置,这样共布置了4个
加速度传感器,分别称为1、2、3、4号传感器,设置采样频率为2 048Hz。
整个风电回转支承实验台由回转支承装配系统、加载系统、驱动系统和测控系统等组成,图3是其主要的组成结构及信息流。测试系统的下位机采用美国国家仪器公司(NI)的CDAQ数据采集卡与各传感器相连,上位机采用NI公司配套的Labview软件编程实现,控制系统采用西门子公司的S7-200与工控机通信完成,并通过OPC协议与Labview软件连接,从而实现了在Labview软件环境下的测控一体化的功能。
图3 回转支承实验台的主要组成及信息流
最终完成了一次完整的回转支承全寿命加速实验。通过观察比较4个加速度传感器信号,发现4号加速度信号变化最为明显,因此本文选用4号加速度信号进行分析。该回转支承从开始运转直至滚珠滚道破损报废经历了正常使用、初始损伤、故障加剧和严重破损4个寿命阶段,如图4所示(由于数据庞大,图中只显示部分数据)。
实验数据来源于上节介绍的回转支承全寿命实验。从4个寿命阶段中提取出时域和时频域的多个特征向量,时域方面的8个特征向量如1.1节所述。
图4 振动信号
经过大量研究之后决定采用db4小波对振动信号进行小波分解,最后选出4层小波计算其小波能量熵作为特征向量。对原始振动数据采用EMD分解得到各层IMF,并选出其中4层计算其IMF能量作为特征向量。将以上8个时域和8个时频域特征向量组成高维特征集,虽然这16个特征向量在不同程度上反映了回转支承不同寿命阶段的运行状况,但是不同特征向量之间必定存在着信息的重叠与交汇,如图5a所示。该图是没有经过特征降维的,图中f1、f2、f3分别代表偏度、峭度和均方根指标。
(a)原始特征向量未经过特征降维 (b)经过PCA特征降维 (c)经过PPCA特征降维图5 各降维方法的区分度
由图5a可见,其分类效果非常不好,不同寿命阶段存在明显的交叉,区分度很低。事实上,16个特征向量中的任意3个特征分别作为x、y、z轴数据绘图的区分度都很低,由于篇幅有限文中并未给出。如果将以上16个特征向量作为特征量输入模型训练,必定会影响模型的精度,而且还会大大影响计算速度。因此,有必要对高维特征集进行降维操作,在不丢失原始信号包含信息的基础上消除冗余信息以达到简化复杂问题的目的。
采用PCA对高维特征集进行特征降维,以提取出最能反映回转支承寿命状态信息的特征量,结果如图5b所示。图中f1、f2、f3分别代表PCA之后的前3个主元,其分类效果优于图5a的分类效果,因此可以在一定程度上提高模型的识别精度。采用本文的PPCA方法对同样的数据进行特征降维,结果如图5c所示,可见采用PPCA方法能够很好地将不同的寿命阶段区分开来,有助于提高模型的识别精度。
将经过PPCA处理过后的特征量分成训练样本和测试样本,训练样本的输入为全寿命阶段某个时刻的特征量,训练样本的输出为该时刻对应的寿命状态函数值f,测试样本的输入为某时刻对应的特征量,这样一共形成了225个训练样本点和113个测试样本点。大量研究表明,RBF核函数在分类识别和数据外推方面均具有很好的效果,因此将它作为SVM的核函数。为了提高模型的预测精度,本文采用粒子群算法来获得支持向量机的最优参数δ和γ,其中粒子种群数量N=30,最大迭代次数G=300,最终获得的最优参数δ=2,γ=22,利用这些参数构建支持向量机模型进行训练和预测。最后,利用测试样本检验模型的预测精度,其结果如图6所示。
图6中每幅图的横坐标代表113个预测点,纵坐标为相应的寿命状态值f(无量纲)。其中:图6a为没有经过降维操作的多变量寿命状态识别结果;图6b是经过PCA降维的状态识别结果;图6c是经过PPCA方法降维的状态识别结果。经过PPCA降维后的识别效果最好,仅有一个测试点预测错误,精度达到了99.11%,其次是PCA降维后的识别效果,其精度是91.15%,效果最差的是没有经过降维操作的多变量模型,其精度仅有82.30%。
表1给出了不同模型之间的精度差异,其中:单变量(RMS)表示仅以RMS一个特征作为模型的输入进行分析建模;多变量是指将16个特征向量不经过降维操作便输入模型进行分析建模;多变量→PCA表示将16个特征向量经过PCA之后提取主元进行分析建模;多变量→PPCA表示将16个特征向量经过PPCA之后提取主元进行分析建模,其中RBF神经网络的学习因子为0.8。由表1可以得出结论:支持向量机在寿命状态识别中的精度整体优于RBF神经网络模型;多变量模型的识别精度整体优于单变量模型,且经过PPCA特征降维的状态识别模型精度最高。
表1 各模型预测精度比较
(a)多变量未经过特征降维
(b)经过PCA特征降维
(c)经过PPCA特征降维图6 各模型的识别结果
实验结果说明,多领域多变量的特征提取方法能够充分完整地反映回转支承的运行状态信息,可以达到充分利用有限状态信息的目的,其寿命状态识别精度普遍高于单变量模型。PPCA特征降维方法能够有效地从高维特征集中提取出最能够反映回转支承运行状态的特征量,消除冗余数据带来的干扰,从而提高模型的精度,其识别精度比采用PCA方法的识别精度高8%。
本文以回转支承健康监测为背景,针对回转支承故障特征微弱以及难以提取的问题,提出了采用PPCA的多领域特征提取方法,并在此理论基础上提出了一套新的寿命状态识别方法。经全寿命实验证明,文中方法的预测精度高于传统方法,因此可以应用于工程实际问题之中。本文提出了基于时域和时频域的多领域多变量特征提取方法,能够完整地反映回转支承运行状态信息,有利于提高模型的识别精度。本文提出了基于PPCA的特征降维方法,能够有效地从高维特征集中提取出最能够反映回转支承寿命状态的特征量,且其效果优于传统的PCA降维。
[1] KOSASIH B Y, CAESARENDRA W, TIEU K, et al. Degradation trend estimation and prognosis of large low speed slewing bearing lifetime [J]. Applied Mechanics and Materials, 2014, 493: 343-348.
[2] YANG Yu, YU Dejie, CHENG Junsheng. A roller bearing fault diagnosis method based on EMD energy entropy and ANN [J]. Journal of Sound and Vibration, 2006, 294(1/2): 269-277.
[3] 张梅军, 韩思晨, 石文磊, 等. IMF分量的倒频谱分析在滚动轴承故障诊断中的应用 [J]. 液压气动与密封, 2012, 32(3): 33-35. ZHANG Meijun, HAN Sichen, SHI Wenlei, et al. Cepstrum analysis of the IMF components in ball bearing fault diagnosis [J]. Hydraulics Pneumatics and Seals, 2012, 32(3): 33-35.
[4] DYBALA J, ZIMROZ R. Rolling bearing diagnosing method based on empirical mode decomposition of machine vibration signal [J]. Applied Acoustics, 2014, 77(3): 195-203.
[5] KUMAR H S, SRINIVASA P P, SRIRAM N S, et al. ANN based evaluation of performance of wavelet transform for condition monitoring of rolling element bearing [J]. Procedia Engineering, 2013, 20(2013): 805-814.
[6] HONG Sheng, ZHOU Zheng, ZIO E, et al. Condition assessment for the performance degradation of bearing based on a combinatorial feature extraction method [J]. Digital Signal Processing, 2014, 27(2): 159-166.
[7] DONG Shaojiang, LUO Tianhong. Bearing degradation process prediction based on the PCA and optimized LS-SVM model [J]. Measurement, 2013, 46(9): 3143-3152.
[8] 刘永前, 徐强, 田德, 等. 基于萤火虫神经网络的轴承性能退化程度评估 [J]. 机械传动, 2014, 38(5): 107-109. LIU Yongqian, XU Qiang, TIAN De, et al. Bearing performance degradation assessment using optimized BP neural network based on glowworm swarm optimization algorithm [J]. Journal of Mechanical Transmission, 2014, 38(5): 107-109.
[9] CAESARENDRA W, KOSASIH B, TIEU A K, et al. Circular domain features based condition monitoring for low speed slewing bearing [J]. Mechanical Systems and Signal Processing, 2014, 45(1): 114-138.
[10]ZVOKELJ M, ZUPAN S, PREBIL I. Multivariate and multiscale monitoring of large-size low-speed bearings using ensemble empirical mode decomposition method combined with principal component analysis [J]. Mechanical Systems and Signal Processing, 2010, 24(4): 1049-1067.
[11]ZVOKELJ M, ZUPAN S, PREBIL I. Non-linear multivariate and multiscale monitoring and signal denoising strategy using kernel principal component analysis combined with ensemble empirical mode decomposition method [J]. Mechanical Systems and Signal Processing, 2011, 25(7): 2631-2653.
[12]ZHONG Guosheng, LI Jiang, ZHAO Kui. Structural safety criteria for blasting vibration based on wavelet packet energy spectra [J]. Mining Science and Technology, 2011, 21(1): 35-40.
[13]张梅军, 王闯, 陈灏. IMF能量和RBF神经网络相结合在滚动轴承故障诊断中的应用研究 [J]. 机械, 2012, 39(6): 63-70. ZHANG Meijun, WANG Chuang, CHEN Hao. The application research on the combination of IMF energy and RBF neural network in rolling bearing [J]. Machinery, 2012, 39(6): 63-70.
[14]DE MOURA E P, SOUTO C R, SILVA A A, et al. Evaluation of principal component analysis and neural network performance for bearing fault diagnosis from vibration signal processed by RS and DF analyses [J]. Mechanical Systems and Signal Processing, 2011, 25(5): 1765-1772.
[15]YU Lingbo, SNAPP R R, RUIZ T, et al. Probabilistic principal component analysis with expectation maximization(PPCA-EM) facilitates volume classification and estimates the missing data [J]. Journal of Structural Biology, 2010, 171(1): 18-30.
[本刊相关文献链接]
罗楠,王泉,刘红霞.一种快速3D打印分层方向确定算法.2015,49(5):140-146.[doi:10.7652/xjtuxb201505 022]
王成,缑锦,白俊卿,等.利用主成分分析的模态参数识别.2013,47(11):97-104.[doi:10.7652/xjtuxb201311018]
白俊卿,闫桂荣,王成.利用局部线性嵌入的模态识别.2013,47(1):85-89.[doi:10.7652/xjtuxb201301017]
吾守尔·斯拉木,曹巨明.一种新的散乱点云尖锐特征提取方法.2012,46(12):1-5.[doi:10.7652/xjtuxb2012120001]
(编辑 武红江)
Recognition of Life State for Slewing Bearings Using Probabilistic Principal Component Analysis
LU Chao,CHEN Jie,HONG Rongjing
(College of Mechanical and Power Engineering, Nanjing Technology University, Nanjing 211800, China)
A novel multi-domain feature extraction approach based on probabilistic principal component analysis (PPCA) is proposed to deal with the weak fault feature of slewing bearings. Several feature vectors are extracted to form a feature set with high dimension. Then the vectors that best reflect the slewing bearing life status are extracted from the feature set by applying PPCA. These vectors are then used as inputs of a support vector machine with particle swarm optimization to perform the life state recognition. It follows from the whole life experiment of slewing bearing that PPCA is better than the traditional PCA in reducing feature dimension, and its recognition accuracy of lifetime state increases by about 8%. A comparison with a single feature or single domain features shows that the multi-domain and multi-feature set reflects the degradation of slewing bearings more comprehensively and accurately. And a comparison with the traditional feature-extraction method shows that the proposed method reflects the fault of the slewing bearing that is running in a complex and harsh environment more effectively, thus, it can be applied in the area of slewing bearing health monitoring.
slewing bearing; degradation; probabilistic principal component analysis; support vector machine; state recognition
2015-03-03。
陆超(1990—),男,硕士生;洪荣晶(通信作者),男,教授,博士生导师。
国家自然科学基金资助项目(51375222)。
时间:2015-08-27
10.7652/xjtuxb201510015
TP277;TH17
A
0253-987X(2015)10-0090-07
网络出版地址:http://www.cnki.net/kcms/detail/61.1069.T.20150827.1609.002.html