李巍华, 林 龙, 单外平
(华南理工大学机械与汽车工程学院 广州,510640)
基于广义S变换与双向2DPCA的轴承故障诊断*
李巍华, 林 龙, 单外平
(华南理工大学机械与汽车工程学院 广州,510640)
将轴承故障诊断问题转化为故障信号时频图像的识别问题,提出一种采用双向二维主成分分析(two-directional,two-dimensional,principal component analysis,简称 TD-2DPCA)的时频图像矩阵特征提取方法。首先,利用广义S变换将轴承故障信号变换为时频域图像,采用一种双向压缩的二维PCA方法对图像信息进行特征提取;然后,进行了轴承故障试验,分别采集了轴承在正常、内圈故障及外圈故障状态下的振动信号,采用所述方法对轴承3种状态下的时频分布图像进行特征提取,并根据集成矩阵距离(assembled matrix distance,简称AMD)实现图像的分类识别。试验结果表明,结合广义S变换的双向2DPCA特征提取算法可有效提高计算效率,同时具有良好的诊断性能。
广义S变换; 二维主成分分析; 图像识别; 特征提取; 故障诊断
在以振动信号为参量的旋转机械状态监测和故障诊断中,由于转速不稳定、负荷变化以及因故障产生大量的冲击、摩擦等状况,故障信号往往表现出较强的非线性和非平稳性。小波分析、短时傅里叶变换、维格纳分布等时频分析技术已广泛应用于机械设备故障诊断领域[1-2]。S变换作为一种较新的时频分析方法,结合了短时傅里叶变换和小波分析的特点,采用调谐的高斯窗函数,在低频处有较高的频率分辨率,在高频处有较好的时间分辨率[3],是一种多尺度的时频分析方法。采用时频变换的实质就是将获得的时域振动信号转化为时频图像,由于时频图像包含了丰富的设备状态信息,可以通过分析图像实现故障的特征提取和智能诊断。同时为了克服图像维数巨大导致的运算时间长、识别准确率低等问题,需要对图像进行进一步的特征提取。
特征提取的本质是一个降维的过程。图像以矩阵的形式存储和表示,可通过矩阵理论实现图像的压缩。常用的方法有主成分分析(principal component analysis,简称PCA)、线性判据分析(linear discriminant analysis,简称LDA)、非负矩阵分解(non negative matrix factorization,简称NMF)等。PCA和LDA方法的共同缺点是降维前需将二维的图像矩阵向量化,不能直接处理图像矩阵[4]。Yang等[5]提出二维主成分分析(two-dimensional PCA, 简称2DPCA),并将其应用于人脸图像的压缩和重构,取得了良好的效果。Li等[6]在LDA算法的基础上提出二维线性判别分析(two dimensional linear discriminant analysis,简称2DLDA),并将其与2DPCA方法的特征提取性能进行对比。这两种方法直接使用原始图像矩阵计算其协方差矩阵,不需将图像矩阵向量化,优点是特征提取效率高,占用存储空间少,已广泛应用于人脸识别、图像处理等领域[7]。其在故障诊断领域的应用还较少,目前有学者提出将2DLDA用于齿轮故障诊断当中[8]。此外,文献[9-10]提出将NMF方法应用于齿轮和轴承时频图像矩阵的特征提取。同时,为克服矩阵向量化的缺陷,有学者提出采用2DNMF方法,提高了故障诊断的计算效率[11]。
2DPCA虽然能有效地降低图像维数,但其数据压缩是单向的,降维后的图像特征可能依然较大。如一幅大小为m×n的图像,经特征提取后变为m×d,列数减少,但行数不变,即图像只在横向进行压缩。若m较大,对图像进行向量化后的维数可能依然很高。因此,可用2DPCA方法对图像先作一次横向压缩,对抽取出的特征矩阵再用一次2DPCA方法进行纵向压缩,这样就能大大地降低图像维数。笔者采用一种结合广义S变换和2DPCA的时频图像双向压缩提取特征方法用于轴承故障诊断。通过广义S变换获取时频图像,并对图像矩阵利用双向2DPCA(two-directional 2DPCA,TD-2DPCA)方法进行特征提取,最后采用集成矩阵距离(AMD)进行分类,对比2DPCA算法、2DNMF算法及2DLDA算法,分析其计算效率及分类性能。
1.1 广义S变换
信号x(t)的一维连续标准S变换(简称S变换)定义如下
(1)
高斯窗既是时间也是频率的函数,这就使窗函数在低频处提供了较好的频率分辨率,在高频处可获得较好的时间分辨率。文献[3]指出,S变换是对连续小波的一种相位修正,这是常规小波变换所不具备的特性。因此,S变换是一种结合了短时傅里叶变换和小波分析优点的多尺度分析方法。
(2)
其中:参数p被限定为0
当p=1时,即为标准S变化;当p取负值时,窗宽随着频率的增加而增大,从而削弱对高频信号的描述能力;当p>1时,又会使窗口在时域过窄,同样不利于低频信号的表达。通过寻找一个合适的p值,就能获得较好的时频分析效果。
为实现参数p的选择,定义聚焦性度量值M(p)[13]为
(3)
M(p)越小说明广义S变换的时频聚焦特性越好,可选择最小M(p)对应的p值作为最优参数。文献[14]以某典型非平稳合成信号进行仿真分析,仿真信号包含两个线性调频信号、两个高频冲击信号和一个指数调频信号,确定较优的p值为0.76。由于该信号体现了故障轴承信号的特点,如瞬时性(高频冲击成分)、分布频率范围宽(固有频率成分)、存在调制现象等,笔者在后续轴承故障信号分析中,取广义S变换p值为0.76。
1.2 双向2DPCA算法
2DPCA本质是对图像进行横向压缩,基本思想是以图像的总体分散程度为目标,通过寻找一组最优的单位正交投影向量作为最优投影向量组,从而实现图像的特征提取[15]。
假设有C类模式:w1,w2,…,wc,总共M个训练样本图像:A1,A2,…,AM,每个大小为m×n。模式的总体散布矩阵Gt为
(4)
通过线性变换Y=AiX(i=1,2,...,k)将图像矩阵Ai投影至X上,从而获得特征向量Y。其中:X为n维单位化的列向量;Y为投影后的特征向量。投影方向X的选取准则是使得投影后的特征向量具有更好的可分性。定义准则函数
J(X)=tr(Gt)=XTGtX
(5)
为了实现准则函数J(X)的最大化,需要寻找最优投影向量X。事实上,最优投影向量即为Gt的最大特征值所对应的单位特征向量。因Gt为非负定矩阵,则有n个标准正交的特征向量,假定
(6)
(7)
(8)
特征矩阵U向量化后的维数为h×d,而第1次提取出的特征维数为m×d,这样h远小于m,从而减少提取的特征维数,进一步提高分类效率。
1.3 AMD距离度量方法
特征提取后,不同的分类方法对识别率有一定的影响。可通过距离来度量不同类别,常用的距离度量方法有欧式距离、马氏距离、相关系数距离等。文献[16]给出了14种距离用于人脸图像特征的分类。Zuo等[17]对适合2DPCA的矩阵距离度量进行了研究,给出了一种AMD矩阵距离。AMD距离定义如下
(9)
其中:A=(aij)m×d和B=(bij)m×d为2DPCA提取的特征矩阵。
当q=2时,AMD距离即为Frobenius距离,当q=1时,为Yang距离。
2.1 试验设置
试验模拟了齿轮箱轴承在不同状态下的运行状况,试验台由交流电机、齿轮减速机、转速扭矩传感器、联轴器、二级齿轮箱及电磁加载装置组成,如图1(a)所示。加速度传感器分别布置在齿轮箱输入轴的前后端轴承盖上,位置如图1(b)所示。齿轮减速机速比为3.15∶1,故障轴承型号为Nu204,位于齿轮箱输入轴末端,尺寸参数见表1。设置内环、外环两种故障类型,采用线切割分别在外环加工宽1 mm、深2 mm 的细槽,在内环加工宽0.5 mm,深0.5 mm的细槽。试验时,电机转速恒定为1 502 r/min,设置载荷为60 Nm,采样频率为12 kHz,分别采集轴承在正常、内环故障、外环故障3类状态下运行的振动信号,每类状态40段信号样本。根据表1轴承几何尺寸,可计算内环故障特征频率fi= 52.5 Hz,外环故障的特征频率fo=35.5 Hz。
图1 试验系统组成Fig.1 Configuration of test system
表1 滚动轴承Nu204基本参数
Tab.1 Parameters of rolling bearing Nu204
节径Dm/mm滚珠数/个滚子直径d/mm接触角/(°)33.5116.50
2.2 轴承不同运行状态分析
图2 时域信号Fig.2 Time domain waveform of bearing vibration signal
以测点1采集的信号为例,图2所示为轴承分别在正常、内环故障、外环故障下的信号波形。由图可知:正常信号幅值较小,几乎无冲击成分;内环故障信号信噪比差,由于受背景噪声的影响,冲击较不明显,整个幅值范围大于正常信号;外环故障情况相对正常信号幅值增大,冲击更为明显。通过时域信号幅值变化可以初步判断信号正常与否,但无法确认故障类型。传统的轴承故障诊断方法一般对信号进行解调分析,根据轴承零部件特征频率分辨故障类型。对信号进行Hilbert包络解调(500~1 500 Hz),结果如图3所示。
图3 解调谱Fig.3 Demodulation spectrum
由图3可见,轴承信号在3类状态下均出现输入轴的转频fn,这可能是由于轴的制造误差或者联轴器存在轻微松动等因素造成,但转频成分幅值较小。后两类信号中均出现故障成分对应的通过频率fo,fi及其倍频,据此可对故障所属的类型进行判断。但这种分析方法依赖于人的经验,需选择合适的频段进行解调分析,诊断效率较低。
采用所提方法对每类振动信号进行时频分析,分别作p=1,p=0.76的广义S变换,获得40幅时频图像,并与短时傅里叶分析进行对比。图4为短时傅里叶变换结果(窗长为256),图5和图6为经标准S变换、广义S变换(p=0.76)的时频分布彩图。由图4可知,由于滑动的窗口大小固定,导致3类的时频分辨性能固定,整体分辨性能低,特别是低频信号成分无法得到良好的表达,内环故障、外环故障状态高频成分不明显,使得内环故障状态与正常状态较难区分。由图5可知,正常状态信号在低频处的聚焦性良好,故障状态的频率成分较为杂乱,在高频成分的频率分辨性过低,难以进行清晰的辨识和定位。整体来看,经标准S变换的轴承信号在低频处的时频分辨性较短时傅里叶分析结果有所提高。由图6可知,正常状态信号能量小,主要频率分量集中在1 kHz附近,内环故障和外环故障情况在高频处存在明显的瞬时分量,且外环故障特征成分的整体能量大,其瞬时频率表现出一定的规律性。对比图4、图5,广义S变换能够以较高时频分辨率表示轴承振动中的非平稳特征,获得的图像具有良好的时频聚焦特性,同时不同状态的信号表现出一定的差异。
由于彩色数字图像是由3个R,G,B矩阵分量组成,信息量大,给图像的传输和存储等带来很大负担。为了提高图像传输和存储效率,笔者利用加权平均法[18]将彩图灰度化,得到轴承3种状态下总共120幅灰度图像,每幅图像大小为900×1 200,含256个灰度等级。
2.3 特征提取的计算效率对比
由于生成的时频图像矩阵的维数巨大,当样本数量大时特征提取效率将大大降低,因此,笔者将图像划分成90×120块,每块由10×10的矩阵组成,通过计算每块所有元素之和来代表该块的总能量值,这样在保留时频图像矩阵能量分布的前提下大大降低了特征维数。为实现智能诊断,对每种状态下取20组时频图像矩阵作为训练样本集,分别采用单向及双向2DPCA算法、TD-2DLDA算法、2DNMF算法对时频分布矩阵进行特征提取。后3种算法2次提取的特征维数分别为d和h,设置d=h取值为[2,3,…,10]。为进行对比分析,相应的单向2DPCA提取的特征维数设置为[4,9,16,…,100],这样保证了不同方法特征提取维数的一致性。
表2给出了4种算法对经广义S变换获得的时频图像进行特征提取的计算效率,均不包含图像载入时间。试验环境为Matlab R2010b,Intel(R)1.73GHz,2.5 GB内存。由表2可得:随着特征维数的增加,4种算法的计算时间相应增加;2DNMF的计算效率远远低于其余3种算法,这是因为二维非负矩阵在分解过程中需将所有训练图像矩阵按行或列进行拼合,拼合后的初始分解矩阵维数较大,而2DPCA及其双向压缩算法在计算过程中的总体散度矩阵始终保持原始图像的维数;同时2DPCA特征提取的计算效率接近TD-2DLDA,略高于双向2DPCA。
图4 短时傅里叶变换Fig.4 Short time Fourier transfer result
图5 标准S变换的时频分布Fig.5 Time-frequency distribution based on standard S transform
图6 广义S变换(p=0.76)的时频分布Fig.6 Time-frequency distribution based on generalized S transform
采用TD-2DPCA进行特征提取时,训练结束后可得到最优投影矩阵P1 200×d和Q900×h,将原始样本图像矩阵向P和Q投影即可得到描述该样本的特征参数。图7为时频图像矩阵训练集投影后对应的特征编码矩阵,维数为10×10,图中每行代表轴承的一类运行状态,每种状态只显示前5个样本。由特征图可得,同类样本各维度上特征编码值的大小和分布相似,且反映该图像的特征编码值主要集中在左上角,其余编码值均相对较小。这是因为每个图像先进行一次横向压缩,提取的第一主成分位于第1列,再进行一次纵向压缩,二次提取的前两个主成分分别位于压缩后的前两行,集中体现了图像的差异化信息。据此对比不同类样本的特征图可得,正常状态的前两个元素的编码值均高于故障状态,同时内环故障状态特征图第1列第2个元素与外环故障状态所对应的元素编码值差异较大。因此,TD-2DPCA算法能在压缩图像后保留图像的差异信息,可以作为图像特征提取的有效工具。
表2 不同算法提取特征的计算效率对比
Tab.2 Time cost of different algorithms s
特征维数特征提取算法2DNMFTD⁃2DPCATD⁃2DLDA2DPCA4(2×2)2.0000.2340.2340.2189(3×3)2.2770.2490.2370.22016(4×4)3.1530.2650.2490.23425(5×5)3.8300.2960.2500.25036(6×6)4.4600.3120.2650.25549(7×7)6.2200.3280.2660.26164(8×8)7.3300.3300.2730.26581(9×9)8.0200.3350.2810.266100(10×10)10.5410.3430.2910.286
2.4 轴承运行状态分类
为对比4种方法提取的特征参数集的故障诊断性能,采用AMD距离分类器对轴承3类状态进行区分。通过训练获取横向与纵向的最优投影向量组,以此计算训练样本和测试样本的特征编码矩阵。对于某个测试样本C,计算其至每个训练样本特征编码矩阵的AMD距离,若与第i个训练样本的距离最小,则样本C与第i个训练样本所属的类别相同。诊断时,每种状态40个样本,随机选择20个样本作为训练集,剩余20个作为测试集。重复该过程10次,取测试结果的平均准确率作为分类性能评价指标。当提取的特征矩阵维数为10×10时,分析不同AMD距离参数q对诊断性能的影响,如图8所示。对于标准S变换获取的时频图像,随着q的增大,分类准确率不断增加。当q=1.2时达到最大,随后趋于稳定。对于广义S变换获取的时频图像,参数q的取值对分类性能影响较小,准确率均保持在100%。
图7 轴承时频图像特征编码图Fig.7 Feature code extracted from time-frequency image
图8 AMD参数q对诊断性能的影响Fig.8 Impact of q on diagnosis performance
当AMD距离定义为Frobenius距离(即q=2)时,分析在不同特征维数下,2DPCA及其双向压缩算法、TD-2DLDA及2DNMF算法分别提取的特征子集的分类性能,如图9所示。其中:图9(a)的样本图像集来自广义S变换(p=0.76);图9(b)来自标准S变换。
图9 不同特征提取方法分类性能对比Fig.9 Performance of the classifier based on different feature extraction schemes
由图9(a)可知:在不同特征维数下,TD-2DLDA分类准确率相对较差,均低于80%;2DNMF算法的分类性能整体较优,但在提取特征维数为2×2,3×3时低于双向2DPCA算法,其特征提取的计算效率也远低于双向2DPCA算法;2DPCA及其双向压缩方法所提取特征子集的分类准确率差别不大,均保持在95%以上,且当提取特征维数较少时,双向2DPCA算法的分类性能优于其余3种方法。由图9(b)可知:经广义S变换后,TD-2DLDA算法的分类准确率较标准S变换有了明显的提高,但仍低于其余3类算法;2DNMF算法具有较高的分类准确性,但当提取的特征维数较高时反而略有下降;除了2DNMF算法外,其余特征提取方法的诊断性能较标准S变换均有所提升,这是由于分类的图像集具有良好的时频聚焦特性,各类状态差异性相对更为明显;对于2DPCA及其双向压缩算法,特征维数的选择对诊断性能的影响并不明显。对轴承3类状态的诊断结果表明,双向2DPCA算法在提取特征维数较低时仍具有良好的识别准确率,基于广义S变换时频图像的诊断性能较标准S变换高。
1) 广义S变换较标准S变换有更好的时频聚焦特性,能够反映故障状态下轴承信号的时频分布特点,因此广义S变换可用于轴承故障状态的区分,同时将其与2DPCA算法结合,能有效地提取轴承运行状态的差异特征。
2) 传统的故障诊断方法基于一维信号,诊断效率较低,将双向2DPCA算法成功应用于轴承故障信息的特征提取。试验表明,双向2DPCA算法在保证分类性能的前提下,计算效率远远高于2DNMF。在采用双向2DPCA算法对时频图像进行特征提取时,应当选择合适的特征维数来兼顾计算效率和分类准确率。
[1] 杨宇,何怡刚, 程军圣,等.用最大重叠离散小波包变换的Hilbert谱时频分析[J].振动、测试与诊断,2009,29(1):10-13.
Yang Yu, He Yigang, Cheng Junsheng, et al. Time-frequency analysis of hilbert spectrum based on maximal overlap discrete wavelet packet transform[J]. Journal of Vibration, Measurement & Diagnosis, 2009,29(1):10-13.(in Chinese)
[2] 赵凤展,杨仁刚.基于短时傅里叶变换的电压暂降扰动检测[J].中国电机工程学报,2007,27(10):28-34,109.
Zhao Fengzhan,Yang Rengang.Voltage sag disturbance detection based on short time fourier transform[J]. Proceedings of the Chinese Society for Electrical Engineering, 2007,27(10):28-34,109.(in Chinese)
[3] Stockwell R G, Mansinha L ,Lowe R P. Localization of the complex spectrum:the S-transform[J]. IEEE Transactions on Signal Processing,1996,17:998-1001.
[4] 翟俊海,赵文秀,王熙照,等.图像特征提取研究[J].河北大学学报,2009,29(1):106-112.
Zhai Junhai, Zhao Wenxiu, Wang Xizhao, et al. Research on the image feature extraction[J]. Journal of Hebei University,2009,29(1):106-112.(in Chinese)
[5] Yang Jian, Zhang D, Yang Jingyu. Two-dimensional PCA: a new approach to appearance-based face representation and recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2004, 26(1):131-137.
[6] Li Ming, Yuan Baozong. 2D-LDA: a statistical linear discriminant analysis for image matrix[J].Pattern Recognition Letters,2005,26(5):527-532.
[7] 陈伏兵,陈秀宏,高秀梅,等.二维主成分分析方法的推广及其在人脸识别中的应用[J].计算机应用,2005,25(8):1767-1770.
Chen Fubing, Chen Xiuhong, Gao Xiumei, et al. Generalization of 2DPCA and its application in face recognition[J]. Journal of Computer Applications, 2005,25(8):1767-1770.(in Chinese)
[8] Li Bing, Zhang Peilin, Liu Dongsheng, et al. Classification of time-frequency representations based on two-direction 2DLDA for gear fault diagnosis[J]. Applied Soft Computing, 2011,11(8): 5299-5305.
[9] 李宏坤,陈禹臻,张志新,等.基于非负矩阵分解与主元分析的时频图像识别方法研究[J].振动与冲击,2012(18):169-172.
LI Hongkun, Chen Yuzhen, Zhang Zhixin, et al. Time-frequency image identification using non-negative matrix factorization and principal component analysis[J]. Journal of Vibration and Shock,2012(18):169-172.(in Chinese)
[10]Li Bing, Zhang Peilin, Tian Hao, et al. A new feature extraction and selection scheme for hybrid fault diagnosis of gearbox[J]. Expert Systems with Applications, 2011,38(8): 10000-10009.
[11]李兵,米双山,刘鹏远,等.二维非负矩阵分解在齿轮故障诊断中的应用[J].振动、测试与诊断,2012,32(5):836-840.
Li Bing, Mi Shuangshan, Liu Pengyuan,et al. Application of two-dimensional non-negative factorization for gear fault diagnosis[J]. Journal of Vibration, Measurement & Diagnosis, 2012,32(5): 836-840.(in Chinese)
[13]Stankovi L. A measure of some time-frequency distributions concentration[J]. Signal Processing, 2001, 81(3): 621-631.
[14]Li Bing, Zhang Peilin, Liu Dongsheng, et al. Feature extraction for rolling element bearing fault diagnosis utilizing generalized S-transform and two-dimensional non-negative matrix factorization[J].Journal of Sound and Vibration, 2011, 330(10): 2388-2399.
[15]Jian Yang, Zhang D, Frangi A F, et al. Two-dimensional PCA: a new approach to appearance- based face representation and recognition[J].Pattern Analysis and Machine Intelligence,2004,26(1):131-137.
[16]Vytautas P. Distance measures for PCA-based face recognition[J]. Pattern Recognition Letters,2004,25(6): 711-724.
[17]Zuo Wangmeng, Zhang D, Wang Kuanquan. An assembled matrix distance metric for 2DPCA-based image recognition[J]. Pattern Recognition Letters, 2006,27(3): 210-216.
[18] 夏良正.数字图像处理[M].南京:东南大学出版社,1999:20-22.
10.16450/j.cnki.issn.1004-6801.2015.03.016
*国家自然科学基金资助项目(51075150,51475170)
2013-12-19;
2014-02-24
TP751; TH113
李巍华,男,1973年11月生,博士、教授。主要研究方向为车辆性能测试、NVH振动信号分析、模式识别。曾发表《基于改进证据理论及多神经网络融合的故障分类》(《机械工程学报》2010年第46卷第9期)等论文。 E-mail:whlee@scut.edu.cn