郑近德 ,姚殷柔 ,潘海洋 ,童靳于 ,刘庆运
(安徽工业大学 机械工程学院, 安徽 马鞍山 243032)
装备制造业是我国国民经济发展的支柱,航空发动机、飞行器、大型风力机、高速列车、大型旋转机械等在装备制造业中扮演着举足轻重的角色。一旦这些设备发生故障或失效,将会带来严重的经济损失甚至人员伤亡。因此,对装备进行健康状态监测与早期故障预警,可为装备的安全可靠运行提供重要技术保障,具有重要的现实意义。
“十四五”时期,我国机械工业在面对诸多挑战的同时需牢牢抓住发展机遇,立足装备制造业本质,推进新型工业化。根据《“十四五”智能制造发展规划》中智能制造技术攻关战略,在进行机械装备状态检测和智能故障诊断时,需重点关注故障特征的表征与提取这一关键技术的革新与突破,让科技创新更好地助力智能制造水平提升。在实际机械系统中,故障振动信号中含大量噪声干扰,其动力学规律一般具有很强的非线性,传统的非线性系统分析指标如均值、方差、峭度、偏斜度、峰值、波形因子等难以有效提取故障特征信息,因此需采取新的指标对信号的系统性质或动力学规律进行分析。熵是热力学的概念,最初用于刻画系统所处状态的无序性和混乱程度。后来,相关学者将熵的概念进行推广和泛化,相继发展了信息熵[1]、KS 熵[2]、近似熵[3]、样本熵[4]、排列熵[5]、模糊熵[6]、散布熵[7]、符号熵[8]、动力学熵[9]等。
单一尺度的熵值无法准确表征时间序列的复杂性特征,甚至会得到似是而非的结论。基于此,提出了多尺度熵的概念,并将单一尺度熵推广到多尺度框架,提出用多尺度熵[10]、多尺度模糊熵[11]、多尺度排列熵[12]、多尺度散布熵[13]、复合多尺度熵[14]、广义复合多尺度熵[15]、广义复合多尺度模糊熵[16]、广义复合多尺度排列熵[17]等来表征时间序列在不同尺度下的复杂性程度。为了利用多源多测点振动信号信息,通过多源信息融合技术实现故障复杂性特征的提取,进一步将多尺度熵扩展到多变量多尺度框架,相继发展了多变量多尺度熵[18]、多变量多尺度模糊熵[19]、多变量多尺度散布熵[20]等多通道信号复杂性量度方法。基于多尺度熵及相关方法建立的非线性动力学指标能够提取蕴藏在振动信号中的非线性故障特征信息,相关学者将其引入到机械状态监测与故障诊断中,并针对滚动轴承、齿轮箱、液压系统、转子系统等,提出了一系列健康状态监测与早期故障诊断方法。鉴于此,对单尺度熵、多尺度熵和多变量多尺度熵等相关方法在机械故障诊断中的应用进行综述,分析多尺度熵相关理论在机械故障诊断中面临的问题挑战,并对其发展方向进行展望,以期对开发并实用化多尺度熵结合其他技术的故障诊断模型具有一定的指导意义。
受工况及工作环境影响,设备故障振动信号往往表现出非线性和非平稳特征。因此,如何从这类非线性振动数据中提取出能够反映设备状态的特征信息是设备运行状态监测与评估的关键。熵作为一种时间序列复杂度的度量手段,常用于量化信号中信息的不确定性和混乱程度。为探讨滚动轴承性能评估、寿命预测、齿轮可靠性设计和故障识别等问题,需建立敏感、稳定的状态特征和性能评估指标。相关学者[11-13]将熵理论引入到设备故障诊断领域,定量表征时间序列统计意义下的复杂性程度(图1),并取得了良好的应用效果。
图1 正常与损伤轴承振动信号的熵值变化对比Fig.1 Entropy change comparison of the normal and damage bearings
香农熵(shannon entropy,ShanEn) 又称信息熵,由信息论之父香农提出,用来测量随机系统中的不确定性[1]。信号ShanEn 值的大小可用来判断信号的有序性程度。一般地,信号的随机性越小,Shan-En 越小,信号的时频分布越集中;信号的随机性越大,ShanEn 越大,信号的时频分布越分散[21]。文献[22]基于小波包分解与ShanEn,提取出能够反映故障特征的频带能量,选择ShanEn 值较小的子频带信号进行分析,成功诊断出发动机活塞销的不同故障类型。方桂花等[23]基于变分模态分解与ShanEn,从分解的分量中提取出故障特征信息,成功识别出轴承故障位置。杨晓雨等[24]提出了基于集合经验模态分解、ShanEn 和Choi–Williams 分布的齿轮箱故障诊断方法,根据ShanEn 筛选得到的固有模态分量能有效表征故障信息,采用Choi–Williams 分布放大故障特征,实现了齿轮箱局部故障的有效识别。受ShanEn的启发,在此基础上,先后提出了近似熵、样本熵、模糊熵、排列熵等概念,用来衡量系统或时间序列的复杂性程度。
近似熵(approximate entropy,ApEn) 是用来衡量系统复杂性的非线性动力学参数,ApEn 的计算可理解为求取一个时间序列在模式上的自相似程度。ApEn 采用1 个非负数来表示时间序列的复杂性,熵值越大,规律性越小;反之,熵值越小,时间序列越有序。对于随机过程,系统的复杂性会随控制参数的变化而变化。ApEn 的优势在于能够从少量数据中辨别不断变化的复杂性[25],且抗干扰力较强。Wang等[26]指出,ApEn 已被证明是机器系统健康状态的有效度量;Yan 等[27]首次将ApEn 方法引入到机器健康检测应用中,结果表明ApEn 能有效表征机器系统的退化程度;刘义亚等[28]将ApEn 与局部特征尺度分解结合,将分解得到的多个模态函数的ApEn 作为特征值,实现了对旋转机械的故障诊断。
2000 年,针对ApEn 包含自匹配、受时间序列长度影响较大等不足,Richman 等[4]在近似熵的基础上提出了一种新的时间序列复杂度度量方法——样本熵(sample Entropy,SampEn)。从SampEn 的定义可看出,SampEn 的计算与嵌入维数m、相似容限r和数据长度N有关。如果信号中的噪声幅值小于相似容限r,那么噪声将被抑制。当原时间序列中存在较大的瞬态干扰时,干扰产生的数据(即所谓的“野点”)将在阈值检波中被去除。因此,SampEn的计算具有较强的抗噪和抗干扰能力,同时计算不依赖于时间序列数据长度,对非线性非平稳信号的处理表现出相对一致的优势[29]。张韦等[30]利用集合经验模态分解和小波分析对滚动轴承的振动信号进行分解降噪,将筛选出的主要固有模态分量的SampEn 作为特征向量,输入至SVM 模型进行识别,故障识别率达97.5%,实现了对风机轴承故障特征信息的提取。唐登平等[31]针对电磁式电流互感器故障诊断效率低、准确率不高的问题,将变分模态分解和SampEn 结合提出的特征指标可用于电磁式电流互感器故障诊断。
SampEn 和ApEn 因采用阶跃函数定义时间序列模板的相似度,导致熵值缺乏连续性且易发生突变[11],这是由于单位阶跃函数具备二态分类器的性质所致。现实世界中,各类之间的边缘往往较模糊,很难确定输入样本是否完全属于其中一类。对此,陈伟婷等[6]引用模糊函数定义相似度公式,将相似度模糊化处理,提出模糊熵(fuzzy entropy,FE)的概念,模糊函数的指数形式使得FE 表现为随参数的变化而连续平滑变化。杜福嘉等[32]将FE作为特征提取指标,用来描述设备故障状态信号的相似性,结果表明基于FE 的故障特征提取方法能够准确和稳定地识别故障特征;肖永茂等[33]采用INV 数据采集系统采集三相异步电动机故障状态振动信号,将FE 与支持向量机相结合用于进行故障诊断,能够精确地识别异步电机的不同故障类型;张燕珂等[34]提出一种基于变分模态分解、FE和支持向量机的故障诊断方法,有效识别出高压断路器的故障状态。
排列熵(permutation entropy,PE)是一种用于描述一维非线性时间序列动态变化的熵算法,充分考虑了时间序列本身所具有的空间特性,对机械系统响应信号的微小变化具有较强的敏感性[5]。PE 计算过程考虑状态向量中元素的排序模式,熵值反映时间序列的复杂性。因PE 兼具算法简单、计算过程高效等优点,被广泛用于设备动力学信号的复杂度分析中。钟勇等[35]将PE 用于滚动轴承退化程度评估与识别,与SampEn 相比,PE 的鲁棒性能更优;丁闯等[36]将PE 用于行星齿轮箱故障振动信号的特征提取,PE 对突变信号敏感,能识别行星齿轮箱不同故障类型信号特征;胡爱军等[37]提出一种基于固有时间尺度分解和PE 的特征提取方法,并用于行星齿轮箱故障实验数据分析,结果表明所提方法能有效诊断和识别齿轮箱不同故障状态和程度。
条件熵(conditional entropy,CE)是在给定一组观测变量的条件下,量度另一组新的随机变量的不确定性方法[38]。对于多元组系统,CE 考虑条件属性和决策属性之间的特征关系[39]。CE 包括一般信息熵特性,也反映事件发生之间的内在相关性。考虑到现实中设备状态之间也存在一定的相关性,相关学者将CE 引入异常检测。皮安云等[40]在弹载数传电台设备故障诊断中引入CE,实现了不同故障模块的有效识别;陈幼芬[41]将CE 用于航空无线电设备故障诊断中;张光轶等[42]以某型机载电台设备为诊断对象,通过计算差别矩阵中除相对核以外元素与相对核中元素的CE 得出属性重要度,求出相对约简的过程;包红燕等[43]提出了基于屏蔽经验模式分解(masking empirical mode decomposition,MEMD)和CE 相空间重构的轴承故障诊断方法,CE 方法用于重构参数的求取时不但降低了计算量,且可准确得到最佳嵌入维数和延迟时间,能有效提升滚动轴承故障的识别效果。
相比于排列熵,散布熵(dispersion entropy,DispEn)在计算过程中考虑 信号的幅值大小关系,同时兼具计算速度快、不易受突变信号影响的优点,是衡量时间序列不确定性和复杂度的一种新指标。Rostaghi 等[7]将DispEn 引入设备振动信号的检测,分别用于检测不同齿轮故障、滚动轴承故障诊断和轴承退化状态特征的表征。鉴于DispEn 在旋转机械特征提取及故障诊断应用中的良好效果,周怡娜等[44]将变分模态分解(variational modal decomposition,VMD) 与DispEn 相结合用于对管道声波信号特征的提取,且验证了DispEn 特征提取相较于其他方法的优越性;赵海峰等[45]将DispEn 作为一种非线性特征提取方法用于往复压缩机故障诊断中,提取到正常、阀片断裂与弹簧失效3 种不同状态的实测振动信号,从鲁棒性和稳定性方面验证了散布熵在往复压缩机气阀故障特征提取的适用性;Chen 等[46]、李从志等[47]结合层次分析法和散布熵,提出了层次散布熵,并基于层次散布熵和最邻近算法(K-nearest neighbor,KNN) 分类器进行滚动轴承故障诊断,实现了滚动轴承故障位置和程度的精确识别。
谱熵(spectral entropy,SpectEn) 从结构复杂度分析出发,基于短时傅里叶变换对时间序列进行时频转换,从而转换分析变换域内的能量特征[48],相比行为复杂度分析更具有全局意义。SpectEn 计算速度快,常用于设备中突变信号的检测[49]。SpectEn 越小,时间序列的频谱结构越简单,则信号的规律性越强,否则信号的随机性越强。孙德建等[50]通过数学形态梯度运算,结合SpectEn 理论,提出一种基于数学形态梯度谱熵的结构复杂度分析方法,应用于滚动轴承早期故障诊断,可将原始信号不易被检测的微弱信息进行放大,能有效表征滚动轴承性能退化趋势的能力;崔科杰等[51]结合小波包分解技术和谱熵原理,计算出机电故障信号各频带的SE,并作为特征向量输入支持向量机模型进行诊断识别,试验结果表明,所提方法能准确识别机电设备不同故障类型;别锋锋等[52]结合Hilbert 包络解调,谱熵原理和支持向量机,提取出曲轴轴系的故障能量分布特征,实现了曲轴故障模式的识别。
小波熵(wavelet entropy,WE) 是基于小波分析理论[53],根据信号时频域包含的能量衡量信号的复杂性而定义时间序列复杂性特征的表征指标。刘倩等[54]研究表明,WE 可自适应地确定信号变换域上各尺度的阈值,能够实现机械设备状态信号的有效提取;欧阳乾等[55]采用WE 诊断出电机的故障类型;赵肇信等[56]提出一种基于WE 和支持向量机分类器的故障诊断方法;隋文涛等[57]通过将WE 引入到旋转机械故障特征提取与故障诊断中,并采用自适应神经模糊推理系统进行分类诊断,得到了更加精确的诊断结果。
符号动态熵(symbolic dynamic entropy,SDE)是由Li 等[58]提出的一种新的动力学特性评估方法,SDE 对时间序列进行符号动态滤波,能有效去除信号的不相关噪声,具有良好的抗噪性。SDE 不但克服了SE 和PE 的缺点,且继承了他们的优点,在分析具有幅度和频率信息的振动信号具有更好的性能[59]。张华等[60]采用基于SDE 和支持向量机相结合的方法,精确提取出液压泵不同振动信号的故障特征。现有的SDE 方法仅考虑状态模式向量对故障特性的影响,没有考虑状态模式向量之间的相关性。为此,Xue 等[61]结合安全模糊评价体系,改进SDE,即双符号动态熵方法(double symbolic dynamic entropy,DSDE),研究特定状态模式向量前后双符号变化对熵值的影响;Li 等[62]通过引入层次分析提出层次符号动态熵,将其用于提取高频分量中的故障信息,并与多尺度样本熵、层次样本熵、多尺度排列熵、层次排列熵等方法进行对比,结果表明其对滚动轴承早期故障类型的识别效果最好。
在上述方法的基础上,相关学者相继提出其他熵参数,如时频熵[63](time frequency entropy,TFE),能量熵[64](energy entropy,EE),交叉熵[65](cross entropy,CroEn),分布熵[66](distribution entropy,DistEn),增量熵[67](increment entropy,IE),斜率熵[68](slope entropy,SlopEn),注意力熵[69](attention entropy,AttnEn)等,相关方法汇总如表1。
表1 熵方法研究论文及其相关特点Tab.1 Research papers and related features of entropy theories
传统的熵方法均可作为时间序列复杂度的度量手段,单一尺度熵方法在进行特征提取时只能分析单个时间尺度的信号,忽略时间序列其他时间尺度上的有用信息。为此,相关学者结合粗粒化过程提出多尺度熵的概念,并在此基础上提出一系列改进方法。相关方法已成功用于设备故障诊断,如滚动轴承振动信号分析、齿轮信号的特征提取、不同等级的滚子轴承故障识别、生成断路器的声纹特征、预测待测设备的剩余使用寿命、构建旋转类机械设备预警模型等,这些结果有力支持了工程实际案例下的一般复杂性损失理论。对于轴承故障研究,目前常作为试验使用的数据集有帕德博恩大学开放试验轴承数据集、航空发动机双旋翼试验台数据、凯斯西储大学电机轴承故障数据等;对于齿轮箱故障研究,涉猎领域如采煤机摇臂齿轮箱、定轴传动齿轮箱、多排行星齿轮箱体等。
2002 年,Costa 等[10]提出了多尺度样本熵(multiscale sample entropy,MSE),MSE 通过粗粒化过程(也称移动平均滤波器)实现时间序列多尺度化;再分别计算每个尺度因子上的样本熵值,从不同尺度全面量度时间序列的复杂度。尺度因子为1 时,多尺度熵方法即计算原始时间序列的熵值。在多尺度上,熵值计算将对原始时间序列(长度为N)进行分割处理。粗粒化过程中用长度等于尺度因子τ 的非重叠小窗口划分时间序列,对每个小窗口取均值,得到新的长度为N/τ 的时间序列。对于尺度因子τ(τ≥2),重复操作上述粗粒化过程τ 次,共得到τ 组新的时间序列,每组均包含原始时间序列的动态特征信息。给定长度为N的随机信号 {Xi}={x1,x2,···,xN},建立粗粒化时间序列yi。
τ=1 时,粗粒化时间序列即为原始时间序列。相比于单一尺度熵方法,多尺度熵分析量化熵与尺度因子之间的相互依存关系,评估系统的动态复杂性。靳震震等[70]将MSE 引入到列车轨道转向架轴承的振动信号特征提取中,并与单一尺度的SE 方法进行对比,结果表明MSE 能有效提取滚动轴承故障特征,且优于SE 方法。但SE 存在突变问题,熵值缺乏连续性,这种问题在多尺度方面依然存在。因此相继提出了多尺度散布熵[13](multiscale dispersion entropy,MDE)、多尺度模糊熵[11](multiscale fuzzy entropy,MFE)、多尺度排列熵[12](multiscale permutation entropy,MPE)、多尺度增量熵[71](multiscale increment entropy,MIE)等多尺度熵方法,并将他们引入到设备故障诊断,新提出的多尺度熵方法继承了MSE 关于时间尺度的理论基础,同时增加了其他传统熵方法的优势。武哲等[12]利用MPE 对不同状态下的行星齿轮箱进行分析,试验表明MPE 可有效诊断多排行星齿轮系统的故障类型;鄢小安等[72]在DispEn 的基础上,结合层次分析法和多尺度理论提出层次多尺度散布熵,且在轴承故障模式与故障程度识别中进行验证,结果表明识别精度得到了较大的提升;郑近德等[11]将MFE 引入滚动轴承故障诊断,结合多故障支持向量机分类器,能有效识别滚动轴承的故障类型。
在上述粗粒化过程中,原始时间序列随着粗粒化尺度因子的增大而减小,时间序列的长度变化会引起熵值的突变情况,且会导致熵值计算出现较大偏差[73–74]。因此需改进MSE,特别是关于时间尺度的定义,这归功于其理论基础,如复合多尺度熵(composite multiscale sample entropy,CMSE) 即在MSE 的粗粒化过程基础上结合时移操作克服传统MSE 中存在的短时间序列分析问题;精细复合多尺度熵(refined composite multiscale sample entropy,RCMCSE)与CMSE,MSE 的计算区别在于生成粗粒化序列后,先计算各尺度下的向量平均概率,再得出熵值,因此相比传统的MSE 方法,其得到的概率值补充了特征信息,进一步减小了误差、增加了熵值的可靠性。此外,与MSE 方法相比,CMSE 和RCMSE 方法在分析短时序列时表现均更优,但当时间序列较长时,RCMSE 计算成本将大幅增加。因此在进行仿真试验或实际工程案例分析时应根据具体情况选择合适的特征提取方法。
为反映振动信号在不同尺度下的复杂程度、克服传统多尺度粗粒化导致信息丢失的缺陷,Wu等[14]提出了复合多尺度过程,将粗粒化过程与时移过程结合,从而减小粗粒化过程中估计熵值的方差。其中,时移过程就是给定时间间隔,在时间序列上进行时移,构建多个时移序列,在确保特征信息不丢失的条件下,克服多尺度过程中存在的短时间序列分析问题。郑近德等[75-77]提出了复合多尺度模糊熵(composite multiscale fuzzy entropy,CMFE)、复合多尺度排列熵(composite multiscale permutation entropy,CMPE)、复合多尺度散布熵(composite multiscale dispersion entropy,CMDE)等方法,将他们用于滚动轴承振动信号的复杂性分析,不仅能解决单一尺度熵提取信号复杂性特征不完全的问题,且与传统粗粒化多尺度熵方法相比,其稳定性更好。鉴于Azami 等[78]提出的波动散布熵的优越性,Gan 等[79]提出了基于复合多尺度波动散布熵,最小冗余度最大相关性(minimum redundancy maximum relevancy,mRMR)方法和KNN 算法的滚动轴承故障诊断模型,对比其他多尺度熵方法,所提方法不仅可合成多个粗粒度序列的信息,还能降低熵估计的标准差,且具有最高的平均识别精度。
针对CMSE 和MSE 不能解决未定义的熵的问题,Wu 等[80]提出RCMSE 的概念,并采用仿真试验验证RCMSE 的优势。此外,RCMSE 在熵估计精度、数据长度独立性和计算效率方面也具有一定的优越性。王金东等[81]针对往复压缩机故障信号呈非线性和非平稳等特点,提出基于精细复合多尺度模糊熵(refined composite multiscale fuzzy entropy,RCMCFE)的往复压缩机轴承间隙故障特征提取方法,将提取的特征输入支持向量机分类器进行训练和预测,结果表明所提方法的故障识别准确率最高。郑近德等[82]将RCMSE 方法用于滚动轴承故障特征的提取,采用遗传优化算法–支持向量机分类器进行故障识别,所有测试样本均得到正确分类,所提方法在故障特征提取方面具有明显的优势。陈佳豪等[83]将精细复合多尺度散布熵(refined composite multiscale dispersion entropy,RCMCDE)用于高压断路器机械振动信号的特征向量提取,并通过粒子群算法优化后的极限学习机实现故障智能诊断,试验结果表明所提方法在抗数据丢失、抗噪声干扰及故障识别精度方面均有较好的性能。
传统信号的样本熵、模糊熵和排列熵等熵特征都是在单一时间尺度上分析的,无法衡量时间序列复杂度与长距离时间相关性之间的关系。基于粗粒化过程构建的多尺度方法(MSE,MDE,MPE) 本质上是一个线下滤波器,尺度分析不具有自适应性。相比之下,自适应多尺度熵特征提取方法是一种基于自适应比例因子法和熵特征提取法的方法,可较好地确定信号的时间尺度信息。相关学者[84]通过结合信号滤波分解与多尺度熵提出自适应多尺度熵方法,且将其用于机械设备状态的健康监测中,将原始信号分解为包含特征信息的信号分量,再引入熵方法提取振动信号的特征向量。已提出很多自适应信号分解方法,如经验模态分解[85](empirical mode decomposition,EMD)、集成经验模态分解(ensemble empirical mode decomposition,EEMD)[86]、变分模态分 解[87](variational empirical mode decomposition,VMD)、奇异值分解[88–89](singular value decomposition,SVD)等。Du 等[90]采用EMD 方法分析滚动轴承的振动信号,与离散小波分析等传统信号处理相比,EMD 方法具有自适应、正交和完整的特性。鉴于以上优势,李从志等[47]提出一种基于EMD 和DE的自适应多尺度散布熵(adaptive multiscale dispersion entropy,AMDE) 方法,利用EMD 将滚动轴承振动信号分解为多个不同尺度的固有模式函数(intrinsic mode function,IMF)分量,将每个IMF 分量的DE 作为特征向量,输入支持向量机模型训练后得到的轴承故障诊断率为100%。张文哲等[91]提出一种自适应多尺度样本熵(adaptive multiscale sample entropy,AMSE)方法,采用EMD 对原始振动信号进行分解,将前5 个IMF 分量的MSE 作为特征向量输入,训练后的SVM 模型能准确诊断轴承的故障类型。刘新发[92]提出一种基于EEMD 的自适应多尺度模糊熵(adaptive multiscale fuzzy entropy,AMFE)方法,将其用于S700K 转辙机的非线性动力学特征提取,并采用灰色关联分析诊断器进行故障识别,诊断效果得到显著提升。王泽等[93]提出一种基于EEMD,MPE 与邻域粗糙集的故障诊断方法,将其用于轴承系统的故障特征提取,在保证故障诊断精确度的同时能够减小计算量。郑近德等[94]提出一种基于VMD的自适应复合多尺度模糊熵(adaptive composite multiscale fuzzy entropy,ACMFE)方法,并结合粒子群优化–支持向量机进行滚动轴承的故障诊断。苟先太等[95]针对高速列车横向减振器故障识别问题,将VMD 和MSE 结合,用于西南交通大学车辆系统仿真模型,能有效诊断出不同工况下车辆减振器的故障状态。
旋转机械通常结构复杂,发生故障时,振动信号的传输往往在多个方向。对于大型机械设备,故障部件产生的脉冲在长距离传播后会不可避免地受到损害,导致故障信息的丢失[96]。随着多传感器技术的发展,多元数据可克服数据易丢失、识别度低、稳定性差等不足,故利用单个或多个传感器收集多通道振动信号信息。传统的熵和多尺度熵方法只考虑单通道数据,为衡量多元数据的复杂性,相关学者提出了多元多尺度熵方法。表2 为多尺度熵及其在多元框架下的扩展方法。这些方法被广泛用于设备状态监测领域,如滚动轴承、齿轮箱等是机械、土木和航空航天工程中的关键部件。滚动轴承、齿轮箱实际工况的检测复杂而艰苦,一旦轴承或齿轮出现局部故障,振动信号的动态特性就会发生变化,且在运行过程中设备振动信号具有复杂的传递路径,会造成信号数据的丢失。与单传感器采集系统相比,多传感器采集系统采集的信息更多,能全面描述机械动态系统。为捕获大量动态特征信息,需采用多传感器采集系统采集多变量信号。因此,多元多尺度熵方法被用于旋转机械的健康退化监测,其在测量多变量信号的复杂性和规律性方面具有鲁棒性,对旋转机械的故障诊断非常有效。
表2 MSE 及其相关改进方法Tab.2 MSE and its related improved algorithms
Ahmed 等[97]将单变量MSE 推广到多元框架,提出多元样本熵(multivariate sample entropy,MvSE),并基于多元嵌入重构理论,提出多元多尺度熵(multivariate multiscale sample entropy,MMSE)。MMSE 能够度量多变量数据的动态复杂性,也考虑各数据通道的相互关系。与单独分析每个数据通道相比,多变量方法能够针对合成随机过程和真实世界的步态和信号数据进行全面分析,能从多个传感器捕获更多的识别信息,具有优异的计算效率,已被用于金融学和神经科学等领域。
根据Takens 嵌入定理[98],构建含p个通道原始时间序列的多元嵌入向量Xm(i),定义Xm(i) 中任意2 个向量间的切比雪夫距离,给定相似容限r,计算m嵌入维数下dij≤r,j≠i时 总的发生频率 φm(r)。将p个通道的嵌入向量从m维扩展到m+1 维,在相空间中得到一个新的多元嵌入向量Xm+1(i)。重复上述操作,可得到嵌入维数为m+1 时的发生概率 φm+1(r)。则多元样本熵表示为 MSEn(m,d,r,N)=lnφm(r)-lnφm+1(r)。多元模糊熵(multivariate fuzzy entropy,MvFE) 的计算过程与MvSE 类似。多元散布熵(multivariate dispersion entropy,MvDE)即利用正态分布函数和线性变换对多变量时间序列进行映射,结合多元嵌入理论对时间序列进行重构,计算p个通道中所有数据的散布模式出现的概率,结合香农熵即得到MvDE。由于PE 具有更快的计算速度和更准确的复杂性估计,将其引入多元排列熵(multivariate permutation entropy,MvPE) 算法。MvPE 具有更强的抗噪性,结果不受采样间隔和归一化方法的影响,能更好地衡量机械设备多变量系统的复杂度。在实际工程中,监测多个传感器多个通道的机械设备振动信息时,因多元熵分析时间尺度具有单一性,常与其他多尺度熵方法结合作为信号特征提取的手段。
Mosabber 等[97]将单变量多尺度熵算法推广至多变量多尺度熵,提出多元多尺度熵。对p通道的时间序列 {xk,i}Ni=1,k=1,2,...,p,数据长度为N,通过粗粒化处理,尺度因子为τ 的多元粗粒化的时间序列定义如下:
最初的单变量MSE 算法考虑单个数据通道内的长期相关性,由于其单变量性质,不能对多变量记录中存在的跨通道信息进行建模。多元多尺度熵是针对多元数据设计的,具有在多变量数据中模拟通道内和跨通道属性的能力。多元多尺度熵从复杂性、互预测性和长时相关性角度评价多通道时间序列的动态相互关系。目前已发展出MMSE[99]、多元多尺度模糊熵[100]( multivariate multiscale fuzzy entropy,MMFE)、多元多尺度散布熵[101](multivariate multiscale dispersion entropy,MMDE)、多元多尺度排列熵[102](multivariate multiscale permutation entropy,MMPE)等方法,其中不少方法已被用于机械设备故障诊断领域。郑近德等[19]将MMFE 引入行星齿轮箱故障诊断,利用多通道振动信号信息提高故障诊断的效率,相比单变量的MSE 和MMSE,其故障识率更高。韩美东等[102]利用自适应迭代滤波方法对轴承振动信号进行降噪预处理,并结合MMPE 构建滚动轴承的故障特征样本集,对4 种工况进行分类识别,其分类精度和稳定性均较高。受MMSE 和多尺度模糊分布熵的启发,Ma 等[103]提出一种新的多元多尺度模糊分布熵方法,可有效提取旋转电机多元振动信号的故障特征。
此外,针对传统多尺度粗粒化方式存在的明显缺陷,即随着尺度因子增加,粗粒化时间序列逐渐变短,易产生熵值不稳定现象,提出基于滑动平均方法的改进多元多尺度散布熵[104](improved multivariate multiscale dispersion entropy,IMMDE),基于精细化处理方式的精细复合多元多尺度模糊熵[15](refined composite multivariate multiscale fuzzy entropy,RCMMFE)、精细复合多元多尺度散布熵[20](refined composite multivariate multiscale dispersion entropy,RCMMDE)等,基于多变量信号处理的自适应多元多尺度散布熵[105](adaptive multivariate multiscale dispersion entropy,AMMDE)。周付明等[106]结合滑动平均粗粒化过程和MvDE 提出改进的多元多尺度散布熵,并提出基于EEMD,IMMDE 与遗传算法优化支持向量机相结合的故障诊断方法,所提方法在研究齿轮箱多通道信号分析与诊断方面具有重要价值。Yang 等[107]提出一种新的精细复合多元多尺度符号动态熵(refined composite multivariate multiscale symbolic dynamic entropy,RCMMSDE) 方法,分别用于不同速度条件下的设备数据集,均能有效提高设备多元信号的故障分类精度。Xi 等[108]提出一种基于精细复合多元多尺度波动散布熵(refined composite multivariate multiscale fluctuation dispersion entropy,RCMMFDE)的多变量非线性时间序列复杂度评估方法,联合互信息最大化和支持向量机方法,可有效对齿轮和轴承进行故障诊断。
从基于熵的复杂性理论方法、性能特点对多尺度熵在机械设备故障诊断中的应用研究进行综述,总结不同方法的优劣势;针对单一尺度熵未考虑其他时间尺度信息、多尺度熵无法自适应确定比例因子、单变量熵无法处理多元时间序列等问题,归纳总结目前相关改进方法。近年,越来越多的基于多尺度熵的复杂性量度指标被相继提出,并引入到机械设备健康监测与故障诊断中,基于多尺度熵方法的智能故障诊断技术是当下较为热门且具有广阔发展前景的研究方向。然而,随着全面监测健康状况技术要求和精度的提升,未来基于多尺度熵的故障诊断方法还需从以下方面进行深入研究。
1) 设备在运行过程中会产生大规模的机器数据集,随着自动化技术、信息技术以及工业设备建设规模的提升与融合,如何精密、严格地分析工业大数据,逐渐成为企业生产制造过程待解决的重要问题。对于目前发展的面向工业大数据的智能故障诊断方法,研究主要集中在相关概念的挖掘、决策模型的搭建、主要特征的选择等,其中工业大数据的高维度和大体量给数据分析造成较大困难。因此,可考虑利用多尺度熵相关算法提取重要特征和减少计算成本。
2) 目前的机械设备故障诊断领域研究多关注故障表面特征而忽视故障机理。故障机理研究可为设备状态监测与评估提供基础理论支撑,根据熵的物理意义,相关学者发展了很多基于熵的高效故障特征提取方法。为促进设备状态监测技术的进一步发展,如何将故障机理研究与基于熵的特征提取方法相结合,在综合熵的定义和故障特征信息的基础上发展具有物理意义的特征指标,是未来有价值的探索方向之一。
3) 面向工业大数据的故障诊断,传统的机器学习方法因数据拟合能力有限,处理大数据时将不再适用。基于数据驱动的深度学习模型能自动提取并进一步学习大规模数据集中的有效特征,从而实现海量数据的自动挖掘与模式识别,该模型已广泛用于设备状态监测与故障诊断领域。但深度学习因其“黑箱”特性,导致可解释性较差。多尺度熵具有明确物理意义,可考虑利用多尺度熵的特征提取优势,构建可解释的深度学习模型,为工业数据的智能诊断提供思路。