舒思材, 韩 东
(军械工程学院,石家庄 050003)
基于多尺度最优模糊熵的液压泵特征提取方法研究
舒思材, 韩东
(军械工程学院,石家庄050003)
摘要:为了更有效地提取液压泵振动信号的特征,在多尺度模糊熵(Multiscale Fuzzy Entropy,MFE)的基础上,结合层次熵(Hierarchical Entropy,HE)提出了基于多尺度最优模糊熵(Multiscale Optimal Fuzzy Entropy,MOFE)的特征提取方法。基于多尺度模糊熵的特征提取方法是不够全面的,它仅仅分析了时间序列在各尺度上的均值成分,而非均值成分也应当被考虑在内。多尺度最优模糊熵通过引入层次熵的理论,首先,分析时间序列在不同尺度下的所有节点;其次,比较同尺度各节点的模式区分能力;然后,选取最能区分液压泵振动信号不同状态的节点为该尺度最优节点;最后,不同尺度下的最优节点模糊熵构成了对原时间序列的多尺度最优模糊熵分析。实验数据分析和比较结果验证了该方法的有效性。
关键词:多尺度最优模糊熵;液压泵;特征提取
液压泵是液压系统的关键部件,其性能好坏对液压系统的可靠性有重要影响。液压泵一旦发生故障,轻则振动、噪声增加,工作效率降低;重则不能工作,甚至造成灾难性事故[1]。因此,有必要对液压泵进行故障诊断方法方面的研究,而特征提取是故障诊断中至关重要的一个步骤。
液压泵特征信号的选取非常关键,从合适的信号中可以充分提取特征,使故障诊断更准确。目前对液压系统进行故障诊断研究可选的信号主要有:压力信号、流量信号、振动信号、温度信号和油液污染度。其中,振动信号与液压泵结构动态之间有着紧密的联系,最能反映液压泵状态,故本文选取振动信号为特征信号。
故障液压泵运行时,由于一些非线性因素,振动信号会表现出非线性特征[2]。这就导致,传统的以线性系统为前提的时域和频域信号处理技术,甚至小波变换等时频域信号处理技术,都无法对液压泵的工作状态做出一个精确的评估。而非线性非平稳参数估计的发展为识别和预测复杂非线性非平稳问题提供了解决思路。例如,基于熵的参量已经被验证可以在时域上描述振动信号的非线性非平稳特征,并应用于故障诊断领域。Pincus[3]在研究婴儿猝死的心率变化时,提出了近似熵的概念。近似熵自出现以来被广泛应用于各领域,但它对微小复杂性变化不灵敏。针对近似熵的不足,Richman等[4]提出了样本熵的概念。它具有对微小复杂性变化比较敏感和所需数据量少等优点,并应用于婴儿心率变化分析。但样本熵的定义必须包含一个模版匹配,否则无意义,且无法解释白噪声熵值过大的问题。陈伟婷[5]对样本熵进行改进,提出了模糊熵的概念,它具有样本熵的优点,并比之更优越,且成功应用于体表肌电信号的特征提取与分类。郑近德等[6]提出了多尺度模糊熵的概念,在多个时间尺度上分析信号,并应用于滚动轴承的故障诊断。
近几年,Jiang等[7]提出一种层次熵的概念,认为多尺度熵在各时间尺度上只考虑了信号的均值成分,而非均值成分也应当被考虑在内,并应用于心脏间隔信号对不同的心脏疾病进行识别。
本文通过结合多尺度模糊熵与层次熵的思想,提出一种多尺度最优模糊熵的概念。与多尺度模糊熵相比,多尺度最优模糊熵全面分析了时间序列在多尺度上的均值成分和非均值成分,并确定最优节点,使每个尺度上液压泵振动信号不同状态的区别最大化。考虑到多尺度最优模糊熵的优点,本文将其应用于液压泵振动信号的特征提取。
1多尺度模糊熵
1.1模糊熵
对于近似熵和样本熵,两个向量相似性的度量都是通过阶跃函数定义的。模糊熵的定义则引入了模糊函数的概念,并选择指数函数e-(d/r)n作为模糊函数来衡量两个向量的相似性。指数函数具有以下特征:① 连续性保证其值不会突变;② 凸性质保证向量自身的自相似性值最大。事实上,其他函数只要满足条件①,②也可以作为模糊函数。
模糊熵的定义如下[5]:
(1) 对N点时间序列{u(i):1≤i≤N}按顺序支起m维向量
i=1,2,…,N-M+1
(1)
(2)
j=1,2,…,N-m,i≠j
(3)
(4)
(4)定义函数
(5)
(5) 类似地,再对维数m+1,重复上述(1)~(4),得
(6)
(6) 定义模糊熵为
(7)
当N为有限数时,式(7)表示成
FuzzyEn(m,n,r,N)=lnφm(n,r)-lnφm+1(n,r) (8)
模糊熵和样本熵的物理意义相近,都是时间序列复杂性的度量,熵值越大,复杂度越大。模糊熵具有样本熵的优点:所需数据量小,并保持一致性;同时,比样本熵更优越:首先,模糊熵采用的是指数函数模糊化相似性度量公式,指数函数的连续性保证了模糊熵值随参数连续平滑变化;其次,模糊熵通过均值运算,去除了基线漂移的影响,且向量的相似性不再由绝对幅值差确定,从而使相似性度量模糊化。
1.2多尺度模糊熵
给定一个时间序列X={x1,x2,…,xN},其多尺度模糊熵定义如下[6]:
(1) 首先对时间序列X进行处理,构造新的粗粒向量
(9)
式中,τ为尺度因子,对于任意非零τ,原始时间序列可以被构造成长度为n/τ的粗粒序列。当τ=1时,粗粒序列为原始时间序列。时间序列的粗点变化如图1所示。
图1 时间序列的粗点变化Fig.1 Coarse-grained transformation of time series
(2) 对每个粗粒序列求模糊熵,并把它画成尺度因子的函数。
以上就称为多尺度模糊熵分析。对每个粗粒序列求模糊熵时,相似容限r不变,一般r取0.1~0.25SD(SD是原始时间序列标准差)。多尺度模糊熵定义为时间序列在不同时间尺度因子下的模糊熵,因此,与多尺度熵类似,多尺度模糊熵反映的是时间序列在不同尺度下的复杂性。如果一个时间序列的模糊熵值在大部分尺度上均比另一个时间序列的模糊熵值大,那么就认为前者比后者复杂性高。
1.3参数选取
根据模糊熵的定义,模糊熵值的计算与嵌入维数m、相似容限r、模糊函数的梯度n和数据长度N均有关系。①m越大,在序列的联合概率进行动态重构时,会有越多的详细信息,但m越大计算所需数据长度也越大,综合考虑本文取m=2。②r过大会丢失很多统计信息,过小估计出的统计特性效果不理想,而且会增加对结果噪声的敏感性。一般r取0.1~0.25SD(SD是原始时间序列标准差),本文取r=0.15SD。③n决定了相似容限边界的梯度,n越大则梯度越大,n在模糊熵向量间相似性的计算过程中起着权重的作用。n>1时,更多地计入较远的向量的相似度贡献,而更少地计入较远的向量的相似度贡献。n过大将导致细节信息丧失,为捕获更多的细节信息,文献[5]建议计算时取较小的整数值。综合考虑,本文选取n=2。
2多尺度最优模糊熵
2.1层次熵
给定一个时间序列X={x1,x2,…,xN},其中N=2n,其层次熵定义如下[7]:
(1) 定义一个均值算子Q0
j=1,2,…,2n-1
(10)
式中,长度为2n-1的时间序列Q0(X)表示原时间序列X经过一次层次分解后的均值成分。
(2) 定义一个差值算子Q1
j=1,2,…,2n-1
(11)
式中,长度为2n-1的时间序列Q1(X)表示原时间序列X经过一次层次分解后的差值成分。原时间序列X也可由Q0(X)和Q1(X)表示
x2j-1=(Q0(X))j+(Q1(X))j,
x2j=(Q0(X))j-(Q1(X))j
j=1,2,…,2n-1
(12)
由此可知,时间序列Q0(X)和Q1(X)构成了对时间序列X进行多层次分析的第二层。算子Qj(j等于0或1)可表示为一个矩阵
(13)
算子Qj的矩阵形状取决于它们所作用的时间序列长度。为了描述X的多层次分析,这些算子将会被反复使用。
(3) 令e为整数,且0≤e≤2n-1。令Li(i=1,2,…,n)等于0或1。对给定的e,有唯一一组向量[L1,L2,…,Ln],使得
(14)
(4) 序列X第n+1层的第e+1个节点定义为
Xn,e=QLn∘QLn-1∘…∘QL1(X)
(15)
式中,QLi代表X0,0到Xn,e的第i次层次分解。若第i次层次分解为均值运算,则QLi=Q0,即Li=0;若第i次层次分解为差值运算,则QLi=Q1,即Li=1。
最后,计算节点Xn,e的样本熵,这个过程叫做层次熵分析。
在层次熵中,第1层只有一个节点X0,0,代表原时间序列X,Xn,0代表原时间序列X在第n+1层的均值成分,其他节点代表非均值成分。对于不同的n和e,Xn,e构成了X在不同层次上的分解信号,图2展示了X在n=2时的层次分解图。
图2 n=2时的层次分解Fig.2 Hierarchical decomposition when n=2
2.2多尺度最优模糊熵
事实上,所有Xn,0构成了对原时间序列X尺度为2n的多尺度分析。但是,这种多尺度分析仅分析了各时间尺度上的Xn,0,它仅能代表均值成分,而除Xn,0外的剩余节点也应被考虑在内。
因此,可以认为多尺度模糊熵是不够全面的,这将导致提取的特征不够精确,进而导致下一步模式识别的准确率不够高。为使多尺度分析的模式识别准确率提高,应先使各尺度上的模式区分度最大。因而有必要设定一个指标,用以选取最优节点。最优节点应是同尺度众多节点中最具代表性,最能区分被研究对象不同状态的,并作为原时间序列在该尺度下的变换。
以第n+1层为例,选取最优节点的计算方法如下:
首先,取三组样本,每组样本包含n种不同状态的被测对象信号,设被测对象n种状态的模糊熵值从大到小依次为FE1、FE2、…、FEn;
其次,计算每组样本不同节点相邻状态的模糊熵值差(FE1-FE2、FE2-FE3、…、FEn-1-FEn),并求三组样本的熵差均值;
最后,以相邻状态的模糊熵差均值为最优节点选择指标,若某节点相邻状态的模糊熵差均值都大于零,且相加后和最大,则确定此节点为第n+1层最优节点。
给定一个时间序列X={x1,x2,…,xN},其中N=2n,其多尺度最优模糊熵定义如下:
(1) 对X进行多层次分析,得到众多节点。其中,第n+1层共有2n个节点,第n+1层的第e+1个节点为Xn,e;
(2) 根据最优节点选取法则,确定每一层的最优节点;
(3) 将每一层的最优节点模糊熵画成尺度因子的函数。
这个过程叫做多尺度最优模糊熵分析。模糊熵差均值直观地展现了同尺度不同节点的差异性,在相邻状态的模糊熵差均值都大于零的前提下,均值和越大,区分效果越明显。
3液压泵振动信号特征提取实验
3.1实验准备
本实验采用的液压泵类型为斜盘式轴向柱塞泵,型号为:L10VS028DR/31R-PPA12N00;液压泵柱塞数为9,理论排量28 ml/r,额定转速2 200 r/min。驱动电机型号为:YE2-225M-4;电机额定转速为1 480 r/min。将CA-YD-139型压电式加速度传感器安装在液压泵的端盖处,如图3所示。
图3 传感器安装位置Fig.3 Installation position of sensor
设置液压泵的工作压力为20 MPa,采样频率为20 kHz,采样时间为60 s,采用DH-5920动态信号测试分析系统采集并存储数据。首先用正常状态的液压泵进行实验,采集端盖处的振动加速度信号。然后将正常部件替换成故障部件,人为模拟液压泵配流盘磨损、滑靴磨损和松靴故障三种故障模式。
从采集的振动加速度信号中随机取一组样本,样本包含4种不同状态的振动加速度信号,如图4所示。
图4 不同状态的时域状态图Fig.4 Time waveform of different condition
根据图4,发现仅从时域上很难判断液压泵为何种状态,因此,需要对振动加速度信号做进一步处理。
设正常状态的模糊熵值为FE1,配流盘磨损的模糊熵值为FE2,滑靴磨损的模糊熵值为FE3,松靴故障的模糊熵值为FE4。一般来说,液压泵不同状态的模糊熵值不同,同种状态的模糊熵值相差不大,理论上,四种状态的模糊熵关系为:
FE1>FE2>FE3>FE4
(16)
这是因为,液压泵正常状态的振动是随机振动,信号无规则程度较高,因而模糊熵值最大。对于存在故障的液压泵,在特定的频段有固有的冲击,因而无规则程度较低,模糊熵值较低。另外,配流盘接触部件多,接触面积大,而滑靴仅与斜盘接触,接触面积小,因此配流盘磨损的振动信号应比滑靴磨损复杂,模糊熵值较大。松靴故障下,不仅存在柱塞泵固有的振动(f=nz/60,n为电机的转速,z为柱塞数),还存在柱塞球头对滑靴、滑靴对斜盘的附加冲击振动(f=n/60),因此无规则程度应最低,模糊熵值也最小。
3.2基于多尺度模糊熵的特征提取
运用多尺度模糊熵对图4的四种信号进行处理,结果如图5。
从图5可以看出,当尺度为1时,四种状态模糊熵值大小关系与式(16)相符。随着尺度的增加,四种状态模糊熵值的趋势均是逐渐减小,但大小关系出现了变化,这使得各状态之间难以直观区分。
图5 不同状态的多尺度模糊熵Fig.5 MFE of different condition
以多尺度模糊熵为特征向量,取10组样本共40组数据作为训练样本,10组样本共40组数据作为测试样本,输入支持向量机。
经支持向量机运算分类后,多尺度模糊熵测试样本识别准确率为95%。
3.3基于多尺度最优模糊熵的特征提取
在图4的基础上另取两组共三组样本,计算每组样本全部节点的相邻状态模糊熵差及三组样本的均值,表1列出了不同节点的比较及结果,根据最优节点选取法则,得到各尺度下的最优节点依次为X0,0、X1,1、X2,2、X3,5、X4,10。
运用多尺度最优模糊熵对图4的四种信号进行处理,结果如图6。
图6 不同状态的多尺度最优模糊熵Fig.6 MOFE of different condition
从图6可以看出,随着尺度的增加,四种状态模糊熵的大小关系基本保持不变,这使得各状态之间可以直观区分开来。
以多尺度最优模糊熵为特征向量,取10组样本共40组数据作为训练样本,10组样本共40组数据作为测试样本,输入支持向量机。
经支持向量机运算分类后,多尺度最优模糊熵测试样本识别准确率达100%。
4结论
提出了基于多尺度最优模糊熵的液压泵特征提取方法,实验数据分析与比较结果表明:
(1)以模糊熵差均值为指标选取的最优节点模糊熵,使得各尺度下液压泵相邻状态的区分度更好,为特征提取打下了良好的基础。
(2)基于多尺度最优模糊熵的液压泵特征提取方法准确地提取了振动信号的特征,并具有较高的模式识别准确率。
参 考 文 献
[1] 唐宏宾,吴运新,滑广军,等. 基于EMD包络谱分析的液压泵故障诊断方法[J]. 振动与冲击,2012,31(9):44-48.
TANG Hong-bin,WU Yun-xin,HUA Guang-jun,et al. Fault diagnosis of pump using EMD and envelope spectrum analysis[J]. Journal of Vibration and Shock,2012,31(9):44-48.
[2] Yang Y,Yu D J,Cheng J S. A roller bearing fault diagnosis method based on EMD energy entropy and ANN[J]. Journal of Sound and Vibration,2006,294(1/2):269-277.
[3] Pincus S M. Approximate entropy as a measure of system complexity[J]. Proceedings of the National Academy of Sciences,1991,88(6):2297-2301.
[4] Richman J S,Moorman J R. Physiological time series analysis using approximate entropy and sample entropy[J]. American Journal of Physiology-Heart and Circulatory Physiology,2000,278:2039-2049.
[5] 陈伟婷. 基于熵的表面肌电信号特征提取研究[D]. 上海:上海交通大学,2008.
[6] 郑近德,陈敏均,程军圣,等. 多尺度模糊熵极其在滚动轴承故障诊断中的应用[J]. 振动工程学报,2014,27(1):145-151.
ZHENG Jin-de,CHEN Min-jun,CHENG Jun-sheng,et al.Multiscale fuzzy entropy and its application in rolling bearing fault diagnosis[J]. Journal of Vibration Engineering,2014,27(1):145-151.
[7] Jiang Y,Peng C K,Xu Y S. Hierarchical entropy analysis for biological signals[J]. Journal of Computational and Applied Mathematics,2011,236:728-742.
表1 不同节点的比较及结果
Approach for a hydraulic pump’s feature extraction based on multiscale optimal fuzzy entropy
SHU Si-cai, HAN Dong
(Mechanical Engineering College, Shijiazhuang 050003, China)
Abstract:In order to extract features of a hydraulic pump more effectively, a new approach based on MOFE combined with hierarchical entropy (HE) was proposed based on MFE. Since there were inherent disadvantages of MFE, only the mean component in each scale was analyzed, other neglected components had to be considered. By introducing HE, MOFE could analyze all nodes of time series in various scales. Furthermore, the mode recognition abilites of all nodes in the same scale were compared and the node with the best mode recognition ability was selected as the optimal node for that scale. Finally, the fuzzy entropies of the optimal nodes for all scales constituted a MOFE analysis for the original time series.The proposed algorithm was verified with the analysis and comparison results of test data.
Key words:multiscale optimal fuzzy entropy (MOFE); hydraulic pump; feature extraction
基金项目:国家自然科学基金(51275524)
收稿日期:2015-03-26修改稿收到日期:2015-05-14
通信作者韩东 男,副教授,硕士生导师,1972年生
中图分类号:TH137.5;TP206+.3
文献标志码:A
DOI:10.13465/j.cnki.jvs.2016.09.030
第一作者 舒思材 男,硕士生,1990年生