郝俊杰,高虹霓,王崴,邱盎,王庆力,宋新成
(空军工程大学防空反导学院,陕西西安 710038)
液压系统是由机、电、液耦合的复杂系统,具有工作平稳、响应快、可实现无级调速和自动化等优点,在工业、农林和国防等领域广泛应用。液压系统具有故障隐蔽性强、非线性时变信号强、振动传递机制复杂等特点,导致故障诊断困难。目前液压故障诊断技术大致可分为主观诊断法、数学模型与信息处理诊断法和智能技术诊断法3种,具体如表1所示。由于受理论和仪器设备的限制,液压系统的故障诊断大多还是以经验诊断和分析诊断等传统方法为主,主观因素大,诊断效率低,且对一些新故障很难及时提出维修建议。
表1 故障诊断方法
面对液压装备快速累积的大量故障数据,传统的数据处理方式已经不能高效应对。而大数据技术可以突破传统限制,解决当前存在的大部分数据处理难题,为克服传统方法不足,及时高效地诊断、排除故障提供了可能。
随着人工智能技术的发展,智能诊断技术成为当前液压故障诊断的研究热点,研究如何实现智能化诊断成为摆在学者面前的紧迫任务。本文作者对基于大数据分析的液压故障诊断原理、关键技术及下一步的研究思路进行综述,以期能勾画一个相对清晰的智能化诊断轮廓,为相关研究提供参考。
基于大数据分析的液压故障诊断技术主要是将人工智能领域的一些研究成果结合大数据分析应用到液压系统的故障诊断中。具体可表述为收集大量类型多样的液压故障数据,以此作为研究对象,以数据库、机器学习等算法为分析工具,从中找出与故障相关的有用诊断信息,最后将诊断结果利用可视化等技术展现出来,从而实现故障诊断的一个过程,其核心是数据分析算法。诊断流程如图1所示。
图1 诊断流程
基于大数据分析的液压系统故障诊断主要包括故障数据处理、分析及诊断结果展示3个部分。涉及到的关键技术有故障数据特征选择、机器学习和结果可视化等。
故障数据特征选择是故障数据处理的关键技术,与故障诊断的准确性、快速性密切相关。采集到的故障样本信息通常具有数量多、故障特征维数高的特点。为提高数据实时性,降低冗余信息的影响,需要对这些信息进行选择、转换,通过有效的特征提取得到最优的样本特征。故障特征选择流程如图2所示。
图2 故障特征选择流程
在液压系统故障诊断的研究中,最具代表性的特征提取方法有小波包分解、经验模态分析、主元分析等。
2.1.1 基于小波包分解的特征选择
在故障诊断中,可以通过故障信号中变化的能量来识别故障。小波包分解是一种通过多次迭代的小波变换对输入信号的细节部分逐步展开分析的方法,可以根据高频调制特性,对信号进行小波包变换和包络解调,从而提取故障特征。
小波包特征提取步骤如图3所示。
图3 小波包分解特征提取步骤
田海雷等针对液压泵压力信号呈现的非线性、非平稳的特性,利用小波包对采集到的压力信号进行分解,将得到的分量重构后,通过模型进行故障预测。孙健等人在此基础上对小波分解进行改进,提出一种基于加权形态的非抽样小波分解方法,该方法利用特征能量因子表征各分解层近似信号对故障特征的贡献量,对信号进行加权融合,提高了有用信息比重,更便于特征的提取。
小波包分解因时频局部化能力、多分辨率的特点,适合处理非线性、非平稳信号,但小波包分解得到的结果只与信号的采样频率有关,而与信号本身无关,所以自适应性较差。
2.1.2 基于经验模态分析的特征选择
相比于小波包分解,经验模态分解(Empirical Mode Decomposition,EMD)是一种自适应的信号分解方法,具有很高的信噪比。EMD将复杂信号分解成简单的固有模态函数(IMF),因分解出的IMF所包含的频率成分不仅与采样频率有关,而且随着信号的变化而变化,所以对它进行分析可以更准确有效地把握原数据的特征信息。EMD特征提取步骤如图4所示。
图4 EMD特征提取步骤
刘志强等针对液压泵早期故障诊断时信号微弱的问题,采用改进EMD的集总经验模态分解来分解故障原始信号,再提取故障特征,提高了故障诊断的准确性。杜振东等从另一个角度出发,将EMD方法与敏感度分析(SA)相结合,通过敏感度分析找出敏感度较高的特征参数,对原始故障信号进行经验模态分解,构造新的故障信号,以此来提取特征,进一步提高泵的故障诊断准确性。
经验模态分解已经在时频域信号分析广泛应用,但因缺乏完备的理论推导基础,且具有模态混叠、受噪声影响较大等缺陷,在故障数据不完备的情况下,会使故障诊断结果的可信度受到影响。
2.1.3 基于主元分析的特征选择
主元分析(Principal Component Analysis,PCA)基于原始特征参数,通过线性变换构造一组新的不相关的广义变量,再从新变量中提取主分量,以降低数据维数。PCA的实质是对数据样本矩阵的协方差矩阵进行奇异值分解的过程。
构造采集样本的矩阵× ,其中:为变量数,为样本数;再通过求解的均值和标准差,对进行标准化;最后,求的协方差矩阵:
=/(-1)
(2)
以前个主元的累计方差贡献率()确定主元个数,通常前个主元的贡献率在85%以上,保证在降维的同时尽可能保证信息完整。()的表达式为
(3)
最后,将降维后得到的前个主元组成的向量作为后续的输入样本。
柴凯等人为解决液压故障中特征提取难的问题,利用PCA将高维初始特征向量转化为低维独立的主特征向量,提高了诊断速度及准确率。在矿井提升机液压系统故障诊断中,CHANG等应用PCA对特征参数进行降维去躁;郝用兴等则通过引入权值向量来改进传统主元分析法,建立了变量加权主元分析模型,进一步提高诊断的快速性和准确性。
研究表明,将PCA用于高维初始特征向量的特征提取,效果较好。PCA通过降维、二次提取特征,将特征数据进行降维去噪,在保持原始故障信息特征的同时,减小了变量间的过相关,使诊断模型结构得以简化,提高了诊断效率。
机器学习是故障数据分析的关键技术,将机器学习用于故障诊断,主要是通过机器学习算法自动学习故障样本的数据结构和内在规律,求得诊断模型,以对新的故障进行识别、诊断。机器学习因具有高效的数据分析能力、自学习能力,在液压系统故障诊断领域得到了广泛重视,研究较多,但同时也由于其瓶颈问题的制约,对于不确定的、随机性强以及知识信息不完备的诊断对象,其智能性仍然较低。
机器学习的故障诊断流程如图5所示。
图5 机器学习的故障诊断流程
在液压故障数据分析中,机器学习用到的算法主要有神经网络、支持向量机、深度学习等。为克服一些固有的不足,将算法与其他的数据处理算法、技术相结合进行改进,产生了形式多样的数据分析方法。
2.2.1 神经网络
在基于神经网络的液压故障诊断中,多应用BP神经网络、概率神经网络、径向基神经网络。
(1)BP神经网络
BP神经网络能够以任意精度实现输入参数到目标输出参数的非线性映射,它使用最速下降法,通过反向传播不断调整网络的权值和阈值,使网络的误差最小。
其网络结构如图6所示。
图6 BP神经网络结构
郝用兴等针对盾构机推进液压系统结构复杂与高度非线性难以建立准确数学模型的问题,提出一种基于差分进化算法和BP神经网络融合的模型。为克服BP 神经网络收敛速度慢、易于陷入局部极小点的问题,宋涛等人以液压柱塞泵为例,提出一种蚁群算法改进 BP 神经网络的故障诊断方法,通过蚁群算法优化神经网络的权值和阈值,使网络具有全局兼局部寻优能力。当网络足够大、分类足够多时,BP神经网络算法的收敛速度变慢、精度变低。刘小平等提出了一种基于BP神经网络算法的故障诊断模型,采用分块思想,对不同的液压执行系统采用不同模块建立独立的BP网络模型。该方法在提高神经网络训练收敛速度的同时兼顾了故障诊断的准确度,有较大的实用价值和工程意义。
(2)概率神经网络
概率神经网络(Probabilistic Neural Network,PNN)有速度快、结构简单、不会陷入局部最优等优点。与BP神经网络不同,PNN的网络结构增加了求和层,如图7所示。
图7 PNN结构
程越和左桂兰将PNN网络用于CVT液压系统的故障诊断,构建了诊断系统,对故障模式进行了识别。考虑到不同故障模式下的不同故障程度,杜振东等在液压泵的故障诊断中,提出了将敏感度分析与PNN相结合的方法。对各种状态下的振动信号提取特征参数后进行敏感度分析,将敏感度高的参数以向量的形式输入PNN进行训练和测试,以提高诊断的正确率。
(3)径向基神经网络
径向基(Radical Basis Function,RBF)神经网络是一种基于核函数的前馈式神经网络,利用隐藏层空间对低维的输入矢量进行投影,将数据变换到高维空间中,以使原来线性不可分的问题能够变得线性可分。该网络收敛速度快、非线性映射能力好,在液压故障诊断中有很大优势。
王武在液压系统泄漏故障诊断时,通过小波包分解进行特征提取,之后将获取的能量信号作为RBF神经网络的输入,通过网络训练,进行故障识别。为改善诊断结果,沈美杰等通过小波包分解对信号进行降噪处理后,再采用粒子群算法对RBF神经网络的数据中心、宽度和阈值进行优化,使诊断精度得以进一步提高。
神经网络在故障诊断、故障模式的识别中使用非常多,但因存在学习速度较慢、要求完备的训练集以及可解释差等缺点,使它在故障训练样本不完备时不能很好地发挥优势。此外,在面对一个新的领域或者新增模式故障较多时需要重新设计其网络结构甚至无法使用,这些都导致神经网络在液压故障诊断的应用深度上受到一定限制。
2.2.2 支持向量机
支持向量机(Support Vector Machine,SVM)是液压故障诊断中应用较多的一种机器学习算法。SVM主要是在寻找一个满足分类要求的最优分类超平面,该平面不仅能将两类故障训练样本正确分开,而且使分类间隔最大。
在诊断应用中,针对液压故障特征信号微弱、特征向量提取困难的问题,张华等人通过计算不同状态下特征信号的信息熵,确定相应的信息熵特征向量,建立不同状态下的液压特征向量训练参数,以对特征参数降维,解除特征间相关性,采用SVM对故障模式进行诊断与识别。ZHANG等改进传统SVM,形成一种基于EEMD和SVM的方法,有效解决了低维训练样本少的液压冲击信号诊断问题,提高了SVM的学习效率。上述文献中的SVM 对样本处理时采用的都是单核映射方法,用这种方法训练后的参数敏感性对样本的影响仍然较大,导致SVM鲁棒性较差。对此,刘志强等提出一种多核学习支持向量机的液压故障识别方法,将多个核函数进行凸组合,更有利于样本数据特征的表达,有效地提高了分类的准确率。此外,RAPUR和TIWARI在SVM基础上提出一种基于多类支持向量机(MSVM)的故障识别方法,在用连续小波变换分析法提取特征后,使用MSVM对复杂的组合故障进行诊断识别。
在故障诊断中,支持向量机较适用于样本小、非线性和高维数据,较好地解决了“维数灾难”和“过学习”的不足。但是,当故障数据规模较大时,会出现训练速度慢、算法复杂、效率低下等问题。
2.2.3 深度学习
深度学习是机器学习方面的一个热点。近年来,基于深度学习理论的人工智能方法得到了广泛的关注,也已经有研究者将这些方法应用于液压系统的故障诊断。深度学习通过其特有的层次结构和能够从低等级特征中提取高等级特征的优势,很好地解决了机器浅层学习对特征表达能力不足和特征维度过多导致的维数灾难等问题,给人工智能带来了新的希望。
在液压故障诊断方面用到的深度学习模型主要有卷积神经网络和堆栈自编码器模型,相关研究较少。
卷积神经网络(Convolutional Neural Networks,CNN)是一种特殊的深度前馈神经网络,可以通过深层网络处理更复杂的故障分类问题。吉珊珊等提出一种基于卷积神经网络的方法来检测液压缸是否内泄漏,解决了内泄漏不可见、难发现的问题,而且不需要建模,克服了泄漏模型难以精确建立的缺陷。
堆栈稀疏自编码网络(Stacked Auto-Encoder,SAE)是由多层自编码器堆叠构成的深度神经网络,能够通过神经网络的隐含层来提取高维特征,降低特征维度。姜保军等为提高液压蓄能装置故障诊断率,提出了一种基于堆栈稀疏自编码器的深度学习算法。
深度神经网络通过层数的增加,使诊断模型的学习能力、诊断准确率得以提高。但是,其不足也很明显,因缺乏理论基础导致可解释性差、参数确定比较困难,层数过多也使得计算量变大、运算变慢。
此外,如决策树、极限学习机等算法在液压系统故障诊断中也有应用,但相对较少,文中不作赘述。
机器学习方面,液压故障诊断中神经网络和支持向量机用得较多,主要是这两种方法在对数据样本数量的要求及故障诊断的精确度上有一定优势,相对比较成熟,但因存在样本量小或者参数确定难等问题,使这两种方法在研究中有一定的局限性。而基于深度学习的方法虽然能够通过高维感数据的学习来解决复杂的故障问题,但是模型的复杂度和参数选择的不确定性问题,导致故障诊断模型不易建立。针对这些算法的不足,在改善算法本身的同时,可以考虑从数据处理的角度进行改善,如针对不同系统的故障数据特点,使用一些合适的算法,提高数据对特征的表达能力,优化相应的特征参数等,以期能简化诊断模型的结构,进而减少数据量,降低运算量,从数据方面出发,间接地提高诊断的效率。
数据可视化是数据分析及数据解释的关键技术。它利用图像学基本算法和可视化算法把海量的数据转换为图像或图形展示出来,使数据中隐含的不可见数据成为可见,以使人们更好地分析、理解数据。故障诊断可视化流程如图8所示。
图8 故障诊断可视化流程
何庆飞等根据工程机械液压系统故障特点,将故障定位流程图作为专家系统诊断知识的表示方式,通过研究图形化的知识库生成构建了诊断知识数据库,开发了基于流程图知识表示的故障诊断专家系统,提高了故障查找的效率。JAMES等通过建立系统有向图模型来构造系统结构,再生成故障树图以进行故障诊断,避免了传统树图中系统结构隐含的不足。FANG等将计算机辅助诊断技术用于解决液压系统的故障诊断问题,通过分析现有故障,提出了可视化动态诊断技术。以上研究都不同程度地拓宽了可视化在液压故障诊断方面的应用。
在数据可视化方面,液压故障诊断的研究潜力较大,原因是国内外对这方面的研究不足,但其应用需求较大。在未来的研究中,可以考虑将一些比较成熟的技术应用于此,如基于模型的定义(MBD)以及混合现实(MR)等。这些技术在制造、装配等领域应用较多,但应用于液压故障诊断的研究较少。国内已经有研究团队对MR在故障诊断的应用进行了探索,如虚拟维修等。
分析近年来一些具有代表性和创新性的文献发现,基于大数据分析的液压故障诊断研究比较多,很多研究成果都已转化为实际应用,其中在工程机械、武器装备和农林等领域中应用最广泛,尤其是工程机械。在具体研究上,大多学者是从液压系统的某个机件、系统的密封、磨损等故障问题着手,通过对特征选择方法的合理应用和创新提高故障数据质量,利用智能算法建立故障诊断模型和故障诊断系统,通过对算法的改进和技术融合提高故障识别率及故障诊断精确度,并与其他方法进行对比来验证其可行性。
虽然基于大数据分析的液压故障诊断研究及应用成果较多,但是仍然存在一些问题值得进一步深入探讨、展望。
(1)基于“技术协同”思路的数据获取方法
现代液压系统由于隐蔽性强、耦合度高等特点,导致部分信息采集困难,采集到的数据存在多源异构、维度和冗余度高的问题,给数据处理造成一定困难,严重制约故障诊断模型的数据分析能力。针对采集难的问题,可以考虑引入智能传感器结合智能液压元件进行解决。对于多源异构的问题,得益于互联网技术的发展,可以考虑采用技术协同的思路,利用网络通过异地协同操作来实现数据的交互、共享;针对数据的高维度、高冗余度,可以通过在数据预处理端选择适合的特征提取算法进行数据处理,以缩减数据量和提取高价值数据。
(2)基于“技术融合”思路的算法改进方法
由前边关键技术的分析可以得出,任何一种算法,不管是特征提取还是故障分类,都具有一定的针对性,在解决某一类问题时有一定的优势,但在液压系统比较复杂、系统交联度高时,单一的诊断技术通常难以取得满意的诊断效果,往往在解决过程中还会引出新的难题。因此,将一些有效的算法进行融合是液压系统故障诊断的常用方法。在液压系统的故障诊断中,将已有的算法适时地结合新的研究成果如Deep Q Networ(DQN)算法等进行技术上的改进、融合是值得关注的研究方向。
(3)基于“技术探索”思路的数据分析方法
探索一些新的方法,对当前的研究热点进行深入研究。引入深度学习的一些其他方法,如深度置信网络、循环神经网络等进行液压故障诊断的探索研究;针对抽象故障信息数据比较多的情况,可以考虑用深度学习算法直接进行特征提取,之后再针对数据的实际情况,如有无先验知识、数据样本是否完备、有无多源异构的问题等选择合适的故障诊断分类方法。针对数据样本多或者故障模式多样的情况,引入分布式的思想,采用多个诊断单元来并行处理不同类别的故障,在降低模型复杂度的同时可以有效利用不同算法的优势进行针对性诊断,做到优势互补,在一定程度上可以提高故障诊断的精度。
(4)基于“技术借鉴”思路的数据解释方法
借鉴新的技术进行研究是实现功能突破、技术创新的重要途径。知识图谱是大数据研究的前沿问题,兼具知识抽取、知识表示、知识推理等关键技术,可以说是故障诊断的一个理想技术,既可以应用在特征提取中,也可以在实现故障推理的同时对故障结果进行可视化表达。目前,应用知识图谱进行诊断在医学方面已有研究,但在液压故障诊断中还未曾提及。
液压装备多年的使用维护积累了大量的数据,这些数据多源、高噪声、实时性强,但其中包含大量有价值的信息,值得深入挖掘分析。
本文作者结合大数据分析技术,针对液压领域的故障诊断,围绕近几年故障诊断的研究现状,归纳总结了基于大数据分析的液压故障诊断原理;重点讨论了诊断的关键技术,阐述了这些技术的优势与不足;对液压系统故障诊断方法进一步的研究思路进行了展望,以为后续的研究提供参考。