王维刚, 刘占生
(1.哈尔滨工业大学 能源科学与工程学院,哈尔滨 150001;2.东北石油大学 机械科学与工程学院,黑龙江 大庆 163318)
基于改进判别字典学习的故障诊断方法
王维刚1, 2, 刘占生1
(1.哈尔滨工业大学 能源科学与工程学院,哈尔滨150001;2.东北石油大学 机械科学与工程学院,黑龙江 大庆163318)
摘要:近年来,基于稀疏表示的分类技术在模式识别中取得一定的成功。该框架中,字典的学习和分类器的训练通常是两个独立的模块,降低了方法的识别精度。针对以上问题,提出了一种特征提取和模式识别相融合的改进判别字典学习模型,将重构误差项、稀疏编码判别项及分类误差项进行了整合,并用K奇异值分解算法对目标函数进行优化,实现了字典和分类器的同步学习。该方法先对原始信号进行经验模态分解,并从分解的本征模态函数中提取时、频特征,形成故障样本;然后将训练样本输入改进模型用K奇异值分解优化;最后用习得字典及分类器权重对测试样本进行识别。实验结果表明:该算法不但适用于小样本故障问题,而且鲁棒性和分类性能都明显高于其它算法。
关键词:稀疏编码;字典学习;经验模态分解;故障诊断
对于机械设备而言,不同的故障呈现不同的特征频率。频谱分析比时域分析更能清晰地揭示信号的本质。有经验的维修工人仅凭工作声音就能确定机器是否正常,其原因是机器有故障时频谱不同于正常时频谱,而且人能靠耳朵感觉其不同。声学模型被认为是稀疏表示模型[1],证明频谱的稀疏表示对于故障诊断具有理论支撑。
基于稀疏表示的分类技术已经成功用于故障诊断[2-3]、人脸识别[4-5]及图像分类[6]等领域。该技术主要由字典的学习、稀疏编码及分类三个环节组成。其中,字典的质量对稀疏编码的性能有非常大的影响。目前字典的学习算法包含无监督和有监督两类:前者仅考虑重构项,没有利用训练集的类别信息;而后者既包含重构项又包括类别信息,其分类性能优于前者。有监督字典学习方法大致分成三类:第一类是学习多个子字典或特定类的字典,以提高类间判别性。Liu等[2]先从每类轴承数据中学习得到子字典,然后将所有子字典组合成完备字典。尽管分类准确率有了一定的提高,但移不变稀疏编码的训练时间非常长,而且模式识别还需要另外的分类器,均增加了实际应用的难度。第二类是从初始大字典中合并或选择基函数以形成紧凑的字典。为了平衡类内紧致性和类间分离性,Winn等[7]将字典中的基函数进行了合并。为了保证习得紧凑字典的判别性,该类方法起初要求具有较大尺寸的字典。最后一类方法为训练过程中直接将判别项引入到目标函数中。常用的判别准则包括线性预测分类误差[5]、Fisher判别准则[8]、Hinge损失函数[9]等。Zhang等[5]将分类误差项引入目标函数,但在小规模字典时不能保证稀疏编码的判别性。Yang等[8]引入Fisher判别准则,用类别标签学习结构字典。
针对上述方法存在的不足,本文提出一种基于有监督判别字典学习的故障诊断方法,该方法将判别稀疏编码误差和分类性能准则同时引入目标函数,并且用K-SVD[10]算法进行优化,实现了字典和分类器的同步学习。习得字典不仅能适应训练故障样本的潜在结构,又能使稀疏编码具有较强的判别力,因此该方法能获得较好的分类性能。该方法首先对原始信号进行经验模态分解,并从分解的本征模态函数中提取故障特征,然后从故障样本中利用提出算法学习字典,最后用习得字典和分类器权重进行故障识别。
1基本理论
1.1字典学习模型
根据输入特征的稀疏编码判断其隶属于哪一类故障,要求字典具有以下性质:① 重构性:利用字典能较好地表示和重构各个故障信号;② 判别性:基于习得字典的稀疏编码可分性较好;③ 可解释性:字典中的原子与某类故障有明确的对应关系。
尽管利用K-SVD学习得到的字典重构性较好,但习得字典不具备判别性和可解释性,不能满足故障识别的要求。为此本文采用改进算法学习字典,该算法将重构误差项、稀疏编码判别项和简单线性分类误差项一起整合至目标函数中。因此习得字典不但能反映训练样本的数据流形,而且由习得字典得到的稀疏表示也具有较强的判别能力。本文字典学习的目标函数定义如下:
s.t. ∀i,‖si‖0≤T
(1)
1.2模型求解
根据矩阵范数性质,将式(1)转换为下式:
s.t.∀i,‖si‖0≤T
(2)
图1 测试样本稀疏表示在各个子字典上的响应Fig.1 Response of sparse representations about testing samples in all sub-dictionary
1.3分类方法
(3)
对于某一个测试样本yi,首先利用正交匹配追踪(OMP)[11]算法通过求解以下优化问题计算其稀疏表示xi:
s.t. ‖xi‖0≤T
(4)
(5)
式中:l∈Rm为类别标签向量。
2基于判别字典学习的故障诊断框架
先从机械振动信号中提取特征并产生高维故障样本,要求提取的特征能很好地表示机械运行状况。故障诊断信号通常是非静态且非线性的,而且包含组分非常复杂。而经验模态分解[12]是一种基于信号局部特征时间尺度的时-频域信号分析方法,能将振动信号分解为一系列的本征模态函数,是分析非线性信号常用工具。本文应用经验模特分解对原始信号进行预处理,相比从原始信号提取的故障特征,从本征模态函数提取故障特征更加显著。经验模态分解将原始信号o(n)分解为:
(6)
式中,ci(n)为分解的一个本征模态函数,c1(n),…,cP(n)包含从高频到低频不同频段;rP(n)为分解后的残差信号,表示信号集中趋势。
基于改进判别字典学习的故障诊断方法应用过程如图2所示。该方法主要包括以下几个步骤:
(1) 先用经验模态分解技术分解原始信号o(n),得到若干本征模态函数c1(n),...,cP(n)及余项rP(n)。
(2) 求取本征模态函数与原始信号的互相关系数。将某阶本征模态函数ci(n)看作行向量,原始信号o(n)看作列向量,则这两组数据的互相关系数[13]为:
式中,m为原始信号的长度。
(3) 依据互相关系数大小与相关程度关系原则,选择互相关系数排在前4位的本征模态函数作为特征提取的对象。
(4) 从选择的每个本征模态函数中提取24个故障特征,包括11个时域特征和13个频域特征,具体公式参考文献[14]。于是,从每个原始信号获得4×24=96个特征,生成高维故障样本。
(5) 将高维故障样本降维,再把降维后的低维训练故障样本输入到判别字典学习模型中,输出习得字典及分类器权重。
(6) 对测试样本,经稀疏编码后得到对应稀疏表示,再采用线性分类器即可识别其类别标签。
图2 基于改进判别字典学习的故障诊断流程Fig.2 Fault diagnosis process based on improved discriminative dictionary learning
3实例分析
在Bently RK 4转子试验台模拟旋转机械的7种运行状态,即不平衡、地脚松动、预载荷、电机扰动、径向碰磨-不平衡、径向碰磨-地脚松动、径向碰磨-油膜涡动,其中后三种为复合故障状态。转子试验台如图3所示,包括一套基本转子试验台和电机调速器、用于油膜涡动/油膜振荡试验的装置、用于扰动试验的装置、电涡流位移传感器及东方所的采集系统。实验过程中,采样频率为2 048 Hz。每种状态采集了100个样本,每个样本的长度为2 048。图4显示了七种工作状态的时域波形图及频谱图,通过肉眼很难区分不同工作状态。
图3 Bently转子试验台Fig.3 Bently rotor experimental rig
图4 七种工作状态的时域波形图及频谱图Fig.4 Time domain waveforms and frequency domain spectrums of 7 working states
为防止过度拟合的产生,本算法所有系数的选取均采用交叉验证法自动完成。另外,为了保证结果的客观性及对比的公正性,所有实验结果均为运行20次后的平均值。本文算法参数设置如下:α和β的值分别为4.0和2.0;稀疏度阈值T为5;字典的规模,即K值为25。
利用EMD将径向碰磨-油膜涡动复合故障振动信号分解成本征模态函数(IMFs),结果如图5所示。经计算,12个本征模态函数与原始信号的互相关系数分别为0.27、0.03、0.09、0.30、0.004、0.001 4、0.01、0.001 5、0.009 5、0.011、0.002、0.004 5。按互相关系值数大小,依次选择第1、4、3、2个IMFs作为特征提取的对象。从图也可以看出,这4个IMFs包含了绝大多数故障信息。接着从选择的4个IMF中分别提取24个时域和频域特征,这样对于每个故障样本得到24×4=96个特征,即高维输入空间的维数为96。并用LDA将所有样本的进行降维。最后将低维故障数据输入改进字典学习模型。
图5 径向碰磨-油膜涡动复合故障的EMD分解结果Fig.5 Decomposition results by EMD forsignal with compound fault of radial rub and oil whirl
图6展示了本文算法与RSC[15]及SVM(Gauss核)选取不同训练样本数时分类性能的比较。本文算法的最高识别率可达到99.86%,而SVM的最高识别率为98.8%,RSC的最高识别率仅为93.3%。本文算法为有监督字典学习算法,而RSC为无监督算法。可以看出,本文算法的性能优于上述其它算法,不但识别率高于其它算法,而且鲁棒性较高,即便在较少训练样本时亦能获得较高识别率。尽管SVM的识别率也较高,但其属于非线性分类器,不但计算时间稍高于本文算法,而且对惩罚参数和高斯参数的设置敏感,鲁棒性能低于本文算法。RSC在小样本时识别率明显低于本文算法和SVM。
图6 本文算法与SVM及RSC在不同训练样本下的识别率对比Fig.6 Recognition rate comparisonamong our algorithm, SVM and RSC under different testing samples
4结论
本文提出一种基于改进判别字典学习的故障诊断方法,通过字典学习和分类器训练的同步进行,实现了特征提取和模式识别方法的整合。该方法首先提取原始信号的EMD时域及频域特征,再利用综合重构误差、稀疏编码判别能力及分类误差字典学习模型对故障进行识别。该算法的优点:
(1) 算法训练过程简单、快速;
(2) 算法的鲁棒性较好,仅利用少量的训练样本就可以得到较高的识别率;
(3) 模型的分类性能较高,相比其它优秀的算法,本算法的识别率都有明显的提高。
参 考 文 献
[ 1 ] Smith E C, Lewicki MS. Efficient auditory coding[J]. Nature, 2006, 439(7079): 978-982.
[ 2 ] Liu H, Liu C, Huang Y. Adaptive feature extraction using sparse coding for machinery fault diagnosis[J]. Mechanical Systems and Signal Processing, 2011, 25(2): 558-574.
[ 3 ] Chakraborty S, Chatterjee A, Goswami S K. A sparse representation based approach for recognition of power system transients[J]. Engineering Applications of Artificial Intelligence, 2014,30:137-144.
[ 4 ] Wright J, Yang A Y, Ganesh A, et al. Robust face recognition via sparse representation[J]. Pattern Analysis and Machine Intelligence, 2009, 31(2): 210-227.
[ 5 ] Zhang Q, Li B X. Discriminant K-SVD for dictionary learning in face recognition[C]//Proc CVPR, 2010: 2691-2698.
[ 6 ] Yang J C, Yu K, Gong Y, et al. Linear spatial pyramid matching using sparse coding for image classification[C]//Proc CVPR, 2009:1794-1801.
[ 7 ] Winn J, Criminisi A, Minka T. Object categorization by learned universal visual dictionary[C]//Proc IEEE Int’l Conf Computer Vision, 2005.
[ 8 ] Yang M, Zhang L, Feng X, et al. Fisher discrimination dictionary learning for sparse representation[C]//Proc IEEE Int’l Conf Computer Vision, 2011.
[ 9 ] Yang J, Yu K, Huang T. Supervised translation-invariant sparse coding[C]//IEEE Conference on Computer Vision and Pattern Recognition, 2010.
[10] Aharon M, Elad M, Bruckstein A. K-svd: an algorithm for designing overcomplete dictionaries for sparse representation[J]. Signal Processing, 2006, 54(11): 4311-4322.
[11] Tropp J A, Gilbert A C. Signal recovery random measurements via orthogonal matching pursuit[J]. Information Theory, 2007, 53(12): 4655-4666.
[12] Huang N E, Shen Z, Long S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[C]//Proc Roy Soc Lond Ser, 1998:903-995.
[13] 赵协广. 基于小波变换和经验模态分解的滚动轴承故障诊断方法研究[D]. 青岛:山东科技大学, 2009.
[14] Lei Y G, He Z J, Zi Y Y, A new approach to intelligent fault diagnosis of rotating machinery[J]. Exp Syst Appl, 2008, 35: 1593-1600.
[15] Yang M, Zhang L, Yang J, et al. Robust sparse coding for face recognition[C]//IEEE Conference on Computer Vision and Pattern Recognition, 2011: 625-632.
Fault diagnosis method based on improved discriminative dictionary learning
WANGWei-gang1,2,LIUZhan-sheng1
(1. School of Energy Science and Engineering, Harbin Institute of Technology, Harbin 150001, China;2. College of Mechanical Science and Engineering, Northeast Petroleum University, Daqing 163318, China)
Abstract:In recent years, the sparse representation-based classification method is successfully employed in pattern recognition. The learning of dictionary and the training of classifier in this method are usually two independent modules to reduce the methods identification accuracy. Here, a novel fault diagnosis method based on improved dictionary learning model was proposed, to integrate sparse coding discriminative error, classification error and reconstruction error. And this model was solved with the K-singular value decomposition (K-SVD) algorithm to realize the synchronization learning of dictionary and classifier. With this method, the original signal was decomposed firstly using the empirical mode decomposition, the features of time domain and frequency domain were extracted from the decomposed intrinsic mode functions to form faulty samples. Then, the training samples were input into the improved model optimized with K-SVD. Finally, the testing samples were identified by using the learned dictionary and classification weights. Experimental results showed that the proposed algorithm can not only be applied in small sample fault diagnosis problems, but also its robustness and classification performance are significantly higher than those of other algorithms.
Key words:spare coding; dictionary learning; empirical mode decomposition; fault diagnosis
中图分类号:TH165.3;TH133.3
文献标志码:A
DOI:10.13465/j.cnki.jvs.2016.04.018
通信作者刘占生 男,博士,教授,1962年生
收稿日期:2014-09-24修改稿收到日期:2014-12-03
基金项目:国家自然科学基金资助项目(50875056);黑龙江省教育厅科学技术研究项目(12521058)
第一作者 王维刚 男,硕士,副教授,1976年生