汪 亮,王红军,b
(北京信息科技大学 a.机电工程学院;b.现代测控技术教育部重点实验室,北京 100192)
基于多域熵与FCM聚类的故障诊断模型*
汪亮a,王红军a,b
(北京信息科技大学 a.机电工程学院;b.现代测控技术教育部重点实验室,北京 100192)
针对传统故障诊断中,特征的有效提取依赖于降噪的效果,提出一种基于多域熵与模糊C均值聚类的故障诊断模型。采集设备运行过程中的振动信号,分别计算其小波包能量熵、功率谱熵和近似熵,其反映了振动信息在小波域、频域以及时域内的复杂程度。将其作为设备运行特征向量,通过模糊C均值聚类对设备状态进行识别。利用轴承故障实验和转子故障实验验证基于多域熵与FCM聚类的故障诊断模型,结果表明该方法地对故障类别以及故障程度的识别分类具有良好的效果。
多域熵;FCM聚类;故障诊断
故障诊断是保障机械设备正常运行的关键技术之一[1]。传统故障诊断技术依赖于对振动信号在时频域的特征提取,常采用的特征包括:峰峰值、有效值、峭度等。但是由于机械振动信号通常是非线性、非平稳的且受到大量噪声干扰,因此传统信号特征提取方法具有一定的局限性。
信息熵是描述系统状态不确定性的一种方法,近年来逐渐应用在故障诊断当中[2]。艾延延等[3]将功率谱熵距应用在设备状态评估当中,有效地识别了转子的各种状态。王书涛等[4]将EEMD与样本熵集合,提取设备故障特征,有效地对轴承故障进行识别。张淑清等[5]利用近似熵提取样本的特征,对机械设备状态识别具有良好的效果。孙洁娣等[6]利用包络谱熵识别管道泄漏孔径,其识别效果明显。信息熵还应用在电力、医学等其他领域,取得了较好的应用效果[7-8]。可以看出,利用各种信息熵提取设备运行状态特征是一种可行的办法,其不易受到噪声干扰且适用于非平稳信号。模糊C均值聚类(FCM)是一种典型的自动分类方法,通过求取每个模糊组到其聚类中心距离最短实现样本的分类,广泛的应用在模式识别当中[9]。
本文提出一种基于多域熵与FCM聚类的故障诊断模型,提取设备振动信息的小波包能量熵、功率谱熵和近似熵作为特征向量,利用FCM聚类对机械设备不同故障进行分类识别。通过轴承故障实验和转子故障实验验证该方法,结果表明该方法的有效性。
1.1小波包能量熵
振动信息进行小波包分解是一种常用的信号分解方法,相比于小波变换,其能够更精细地对信号进行分解并提高信号的时频分辨率,其主要原理是利用尺度函数和小波基函数将原始信号重构,在子空间上表示为[10]:
(1)
(2)
利用信息熵理论,则信号小波包能量熵可以表示为:
(3)
小波包能量熵能够反映信号在各尺度空间内的分布情况,值越大则表明信号所含成分越复杂。
1.2功率谱熵
功率谱熵能够从频域上反映信号的复杂程度,其值越大则反映信号在频域上包含的信息越多,信号越复杂。
1.3近似熵
(5)
其中i=1-N-m+1。
(2)分别计算两两矢量之间的距离:
(6)
其中k=0~m-1,i,j=1~N-m+1
(7)
(4)计算X(i)的自相关程度:
(8)
ApEn(m,r,N)=φm(r)-φm+1(r)
(9)
1.4模糊C均值聚类
dij=(xi-vj)T(xi-vj)
(10)
则其加权距离和为:
(11)
式中:m为加权指数,通常为2。当加权距离最小时,即为样本的最佳分类。
2.1轴承不同故障类别诊断
利用凯斯西储大学滚动轴承实验验证该方法。实验中,轴承各类故障是由电火花加工模拟。实验采集振动信号来源于驱动端,主轴转速为1797rmp,采样频率为12kHz,每种故障状态的损伤程度都为0.18mm,共采集轴承正常状态、内圈故障、滚动体故障以及外圈故障四种转态下的振动数据。每种状态采集10组,采样长度为2000。图1是在四种状态下采集的一组数据的时域波形图。
利用公式(3)、(4)、(9)分别计算采集得到的每组数据的近似熵,功率谱熵,小波包能量熵。在近似熵计算过程中,m取值为2,r=0.2×std(x),其中std(x(t))为信号x(t)的标准差。采用最大熵法求取信号x(t)的功率谱以得到功率谱熵。采用“db3”小波对信号进行3层分解,得到8个小波包系数,进而得到信号的小波包能量熵。其中一组计算结果如表1所示。
图1 四种状态下轴承振动信号时域波形图
轴承状态近似熵功率谱熵小波包能量熵正常状态0.96522.02930.4666内圈故障1.52032.59960.6831滚动体故障1.56612.32500.5102外圈故障0.79852.26450.4282
分别计算每种状态的10组数据的近似熵、功率谱熵和小波能量熵,得到40×3的特征矩阵。将其作为输入,选择分类种类C=4进行模糊C均值聚类。经过12次迭代之后,加权距离和的最小值为0.047,得到聚类结果如图2所示。
图2 轴承不同故障类别FCM聚类结果
从图2中可以看出,FCM模糊聚类将所有样本点分为4类,各类样本点紧密分布在其聚类中心周围,其代表一类故障。各类故障样本点之间无混叠,分类结果十分准确。因此可以看出:基于多域熵与FCM聚类的故障诊断模型对设备不同类别故障具有十分有效的分类效果,可以准确的判断设备故障发生类型。
2.2转子不同故障程度诊断
实验数据采用本特利转子实验台数据,共采集3中不同状态的振动信号,分别为:正常,轻微故障(1个螺钉不对中),严重故障(3个螺钉不对中)。转子转速为960rmp,采样频率为10kHz,对每种故障采集6组数据,每组数据长度为1024。图3为采集3种状态的一组数据的时域波形图。
图3 三种状态振动时域波形图
在求取近似熵时,维数m取值为2,相似性阈值r对近似熵的计算影响很大。为区分不同状态下的近似熵值,r取较大值为:r=0.25×std(x)。每组状态各取6组数据,分别计算得到每种状态下的近似熵、功率谱熵和小波包能量熵。一共得到18组数据,建立18×3特征向量矩阵。把其作为输入,选择聚类中心个数为3,进行FCM聚类分析,经过15次迭代后,加权距离和的最小值为0.024,得到聚类结果如图4所示。
图4 转子不同故障程度FCM聚类结果
从图4中可以看出:18个样本点紧密分布在其聚类中心周围,每个聚类中心附近的样本点具有高度相似的特征值。每个聚类中心周围有6个样本点,且不同状态的数据点无混叠,各种状态清晰可分,分类结果准确。因此由实验分析可得:基于多域熵与FCM聚类的故障诊断模型可以准确地对各种故障程度的故障进行分类,且其准确率较高。
综合2.1和2.2的分析结果可以得出,基于多域熵与FCM聚类的故障诊断模型对于设备的不同类别故障以及不同程度故障都具有良好的判别效果,为机械设备故障诊断提供了一种有效的方法。
针对传统故障诊断特征提取的不足,提出了利用多域熵作为设备状态的特征。近似熵、功率谱熵和小波包能量熵能够在时域、频域和小波域上全面反应振动信号所包含信息量多少,能够作为设备状态特征进行故障诊断。
将基于多域熵与FCM聚类的故障诊断模型应用到轴承不同故障类别和转子不同故障程度的识别中,实验结果表明该方法能够准确地判别设备所发生故障的类别和程度,为设备故障诊断提供了一种有效的方法。
[1] 王国彪,何正嘉,陈雪峰,等. 机械故障诊断基础研究“何去何从”[J]. 机械工程学报,2013,49(1):63-72.
[2] 任学平,辛向志,庞震,等. 基于IMF熵的多传感器网络融合滚动轴承故障诊断方法研究[J]. 组合机床与自动化加工技术,2015(6):78-82.
[3] 艾延廷,陈潮龙,田晶,等. 基于信息熵距和FSVM隶属度的转子振动状态评估方法[J]. 推进技术,2013,34(11):1543-1548.
[4] 王书涛,李亮,张淑清,等. 基于EEMD样本熵和GK模糊聚类的机械故障识别[J]. 中国机械工程,2013,24(22):3036-3040,3044.
[5] 张淑清,孙国秀,李亮,等. 基于LMD近似熵和FCM聚类的机械故障诊断研究[J]. 仪器仪表学报,2013,34(3):714-720.
[6] 孙洁娣,肖启阳,温江涛,等. 基于LMD包络谱熵及SVM的天然气管道微小泄漏孔径识别[J]. 机械工程学报,2014,50(20):18-25.
[7] 符玲,何正友,麦瑞坤,等. 近似熵算法在电力系统故障信号分析中的应用[J]. 中国电机工程学报,2008,28(28):68-73.
[8] 黄献,宋治,郑文. 功率谱熵对大鼠痫性发作预报的评估意义[J]. 中南大学学报(医学版),2009,34(8):776-780.
[9] 苏铁明,叶三排,孙伟. 基于FCM聚类和RBF神经网络的机床热误差补偿建模[J]. 组合机床与自动化加工技术,2011(10):1-4,9.
[10] 李宏坤,汪寅虎,杨树华,等. 基于声发射信号的铣刀运行可靠性评估[J]. 大连理工大学学报,2014,54(4): 418-423.
[11] 黄俊,潘宏侠,都衡. 基于EMD近似熵和LSSVM的齿轮箱故障诊断研究[J]. 组合机床与自动化加工技术,2014(3):111-113.
(编辑李秀敏)
Fault Diagnosis Model Based on Multi-domain Entropy and Fuzzy C-means Clustering
WANG Lianga, WANG Hong-juna,b
(a.School of Mechanic and Electric Engineering;b. Key Laboratory of Modern Measurement & Control Technology, Beijing Information S&T University, Beijing 100192,China)
The effective extraction of features depends on the effect of noise reduction in traditional fault diagnosis. A fault diagnosis model based on multi-domain entropy and fuzzy C-means clustering (FCM) is proposed. The vibration signals of working equipments are calculated respectively, and then their wavelet packet energy entropy, power spectrum entropy and approximate entropy are calculated respectively. Therefore the wavelet domain, frequency domain and time domain’s complexity of vibration information are reflected and regarded as a feature vector of equipment operation. The device status is identified by fuzzy C-means clustering of the feature vector. Fault diagnosis model based on multi-domain entropy and FCM clustering is validated by the bearing fault and rotor fault experiments. The results show that the method has good classification effect on the fault type and degree of fault.
multi-domain entropy; fuzzy C-means clustering (FCM); fault diagnosis
1001-2265(2016)08-0064-03
10.13462/j.cnki.mmtamt.2016.08.018
2015-09-10
国家自然科学基金资助项目(51575055);国家科技重大专项(2015ZX04001002)
汪亮(1989—),男,湖北黄冈人,北京信息科技大学硕士研究生,研究方向为故障诊断与可靠性工程,(E-mail)wanglpyh@163.com。
TH17;TG506
A