李良钰,苏铁熊,马富康
(1. 中北大学 机电工程学院,山西 太原 030051;2. 中北大学 能源动力工程学院,山西 太原 030051)
高压共轨系统作为一个由高压油泵、共轨管、电控喷油器与高压油管等组成的复杂的系统,在运行中易受冲击振动、磨损、腐蚀与老化等因素的影响,发生各种故障.因高压共轨供油系统工作时的振声与振动较小,易被其他信号干扰与覆盖,故传统的通过振动或振声信号诊断故障的方法较难实现.通过对发动机油液的检测则很难精确诊断故障且存在检测周期长、成本高及无法实时监测等问题.近年来,小波分析、经验模态分解(EMD)、集合经验模态分解(EEMD)等[1-5]时域分析方法被广泛应用于柴油机故障的分析与诊断中.在特征值的识别领域,能量熵、排列熵、奇异值以及时域特征等被应用于特征参数的提取[6-11].在分类组合问题上,支持向量机、神经网络等分类算法被应用于故障诊断中.通过时域、频域分析提取构建振动、振声信号的特征向量,并利用分类算法进行故障诊断的方法日趋成熟.但是以上故障诊断方法的使用前提是拥有大量的不同运行数据进行分类的训练,并非所有运行状态都可以获得足够的数据,特别是对高压共轨柴油机这种结构复杂的动力机械而言,某些运行状态的数据不具有大规模获得的基础与条件,妨碍其大规模获取数据的原因主要有:(1)某些故障仅发生在特定环境或工况下,台架试验难以模拟此种故障的发生环境与工况;(2)某些故障的发生原因与机理尚不明确,台架试验无法模拟此种故障的发生;(3)模拟某些故障的台架试验成本过高,无法大规模获得运行数据;(4)某些故障是破坏性的,模拟此故障可能对台架试验甚至是试验人员造成伤害.
当因为某些原因无法获得大量此故障的运行数据时,如何利用少量的运行数据进行故障诊断便成了亟待解决的问题,即笔者所指的小样本故障诊断问题.传统方法主要通过建立仿真模型的方法获取大量数据,但仿真数据与真实数据始终存在误差,且仿真数据的多样性较弱,无法充分表现此状态的特征参数.在深入研究高压共轨系统故障诊断后,笔者借鉴深度学习中单样本学习的相关方法,解决高压共轨系统小样本学习问题.单样本学习是已经学习的旧类别可以帮助只有一个或几个标签的新类别学习[12],可分为在少量样本中学习的小样本学习和没有样本情况下通过其他信息学习的零样本学习[13].小样本学习已经广泛应用于计算机视觉领域,并出现许多成熟的算法模型,主要有基于模型微调、基于数据增强和基于迁移学习等3类.基于模型微调的小样本学习方法需要通过大量数据训练一个模型,然后通过少量数据对模型进行微调,但少量数据并不能很好地反映大量数据的真实分布情况,故这种做法可能导致模型出现过拟合.基于迁移学习的小样本学习方法属于前沿研究,存在诸如算法不成熟、复杂度高、样本过小时准确度较低及样本维度变大时计算复杂度过高等问题.而基于数据增强的小样本学习方法虽然在计算过程中存在引入噪声等负面影响,但可以通过提高诊断模型性能解决此类问题.另一方面,由于大部分运行状态都可以获得足够的训练数据,使用基于数据增强,特别是基于数据合成的小样本学习方法可以获得大量的合成数据,与其他运行状态共用一个诊断模型,有利于降低诊断系统的复杂程度.
笔者选择基于数据合成的小样本学习方法合成训练数据供故障诊断模型训练使用,为加快计算速度,使用经自适应随机测试(ART)初始化参数的反向传播(BP)神经网络对经EEMD的轨压信号进行故障诊断,证明了该方法的正确性;通过在多个运行状态上与仿真模型和传统对抗神经网络(GAN)的对比发现,笔者所用方法有着较高的诊断正确率与良好的普适性,并证明了该方法的优秀.
对高压共轨系统的故障诊断一般以振动与振声信号为基础,辅助其他运行参数进行特征值向量的提取与构建,由于高压共轨供油系统运行状态中产生的振动与振声较小,通过传统方法极难准确提取与构建高压共轨供油系统的特征向量.在高压共轨供油系统中,共轨管作为连接高压油泵、喷油器与其他零件的重要部件,其共轨管压力包含许多信息,可通过轨压提取与构建高压共轨供油系统的特征向量.以10缸柴油机高压共轨系统作为研究对象,为简化计算,搭建一5缸单轨柴油机高压共轨供油系统台架进行研究.该试验系统由德尔福(DELPHI)高压共轨式燃油喷射系统、汉斯曼22kW喷油泵试验台、EMI-II型瞬态参数测试分析系统、EFS8233型共轨喷油器电磁阀控制仪、EFS8244型轨道压力控制仪、轨道压力传感器、高精度角度传感器及高强度联轴器等组成.其原理示意如图1所示.
图1 共轨测试装置系统原理示意Fig.1 Schematic diagram of the system principle of the common rail test device
提取轨压信号后,因轨压传感器易受包括系统、环境及其他高频噪声的影响.为提高轨压信号质量,采用一阶低通模拟滤波器进行轨压信号的前期处理,其时间常数为450µs,传递函数H(S)如式(1)所示,此滤波器可有效消除频率在350Hz以上高频噪声.
式中:T为信号总时长;s为信号.
为解决轨压信号采集时出现的信号损坏、缺失等问题,统一轨压信号步长,提高轨压信号的质量,通过线性插值处理采集的轨压信号.这是一种基于叠函数系统(IFS),能够反映插值点之间局部波动特征的插值方法,在描述非线性变化的曲线时,拥有比传统插值方法更高的精度[14].
设存在一组插值数据D为
式中:ix为第i个x的值;yi为第i个y的值;I为数据长度.插值函数f(x)对于每一个 ix,都有f(xi)=yi,且插值数据(xi,yi)不共线.吸引子为插值数据的连续图像.设映射函数Wj为
且满足条件如式(4)所示.
依据IFS的条件推导映射函数,可得到式(3)中aj~fj的表达式分别为
式中:dj为自由变量,称为垂直比例因子,将差值函数迭代到吸引子G附近,即可完成分形插值拟合.图2为处理前、后的轨压信号.
图2 轨压信号Fig.2 Rail pressure signal
作为一种强大的生成网络,生成式GAN被广泛应用于图片生成、数据增强与样本生成等领域.GAN由生成模型G和判别模型D这两个深度神经网络构成,传统GAN的损失函数可表示为
式中:pdata为真实数据的概率分布;pz为根据噪声生成的数据的概率分布;z为噪声;x为真实数据;Ex~pdata为真实数据的期望;Ez~pz为噪声的期望.生成式对抗网络中的生成模型和判别模型是相互对抗的,生成模型的目标是尽量生成与真实数据相似的合成数据,判别模型用来判断目标是否为真实数据.传统GAN结构示意如图3所示.其通过输入一个根据高斯分布或正态分布产生的随机噪声,生成模型G 将输入噪声转化为一个数据,判别模型D将输入数据转化为一个标量,用来表示输入是真实数据的概率,GAN通过损失函数训练生成模型G 与判别模型D,并学习真实数据的分布.
图3 传统GAN结构示意Fig.3 Structure of traditional GAN
图4 为GAN基于概率的训练过程.其中,点线、虚线和实线分别表示真实数据的分布、合成数据的分布以及判别模型,箭头表示生成器G如何将输入噪声转换为合成数据.
图4 GAN训练过程示意Fig.4 Schematic diagram of GAN training
基于数据合成的小样本学习方法通过合成新的带标签数据来扩充训练数据,Royle等[15]首先提出将GAN应用于小样本学习中,通过训练两个相互对抗的神经网络合成数据,但是合成数据的质量不甚理想,存在多样性差等问题.为了提高GAN性能,近年来学者们对GAN的架构进行多种改进.Silver等[16]将卷积神经网络应用到GAN架构中,提出了卷积生成对抗网络.Mirza等[17]通过将条件变量作为附加信息约束生成过程,提出了条件生成对抗网络.此外,还有其他优秀的GAN架构被广泛运用于各个领域.但上述一些网络架构在训练过程中稳定性较差,特别是在小批次样本训练中根本无法使用.故障诊断中的小样本学习是为了给诊断模型提供足够的、高质量的以及能够充分描述运行状态的训练数据,故除了要求GAN的生成质量外,还要合成的数据具有较强的多样性.在各种构架中,Goodfellow等[18]通过将交叉熵损失函数换作最小二乘损失函数提出了LSGANs,使用不同距离而非分布概率作为量度构建一个多样性更高的生成式对抗网络,得到了质量高、多样性强的合成数据.以LSGANs构架为基础,使用EMD评价合成数据与真实数据的相似程度,为防止合成数据与真实数据过于相似、降低数据的多样性,设置迭代停止条件使网络在适当时候停止迭代,以此合成训练样本集.LSGANs的损失函数为
式中:a、b和c为常数,使用二元标签0和1,则常数b=c=1,a=0.
为防止合成数据与真实数据过于相似、降低数据的多样性,设置迭代停止条件如式(13)所示.
式中:k为输入真实数据数量;P为输出合成数据数量;K为经验系数;EMD(q,)w为第q个输入数据和第w个输入数据的EMD,这是一种通过一次线性规划计算两个几何或向量距离的算法,其在评估两个多维分布的差异性上有着广泛的应用;EMD(d,s)为第d个输入数据和第s个输出数据的EMD;V为最小迭代次数;v为当前迭代次数.对于任意两条空间曲线,其EMD值越小,说明其相似性越高,差异性越小;反之,则表示相似性越低,差异性越高.当满足上述不等式时,代表着合成数据与真实数据的平均EMD已经小于或等于真实数据之间的平均EMD,此时停止迭代能够得到具有良好多样性的合成数据.
设存在两组特征向量为
式中:ix、yj分别为两个轨压信号的特征值;Wix、Wyj分别为对应特征值的权重;m、n分别为向量X、Y的长度;H为样本.通过求解式(15)中的最优解得到fij.
式中:dij为 ix与yj之间的距离.
根据上述表达式得到两个轨压信号的EMD为
针对轨压信号的特性,对式(14)做修改可以得到式(17).
式中:pix为轨压信号X的第i个轨压极小值;ixT为其对应的时间;pyj为轨压信号Y的第j个轨压极小值;Tyj为其对应的时间.式(15)中dij为
为验证合成数据的准确性,利用EEMD将轨压信号分解为不同的固有模态(IMF),使用能量熵构建特征向量,建立一BP神经网络作为共轨系统故障诊断模型,进行故障诊断.
集合经验模态分解(EEMD)是一种在经验模态分解(EMD)基础上提出的将信号分解为固有模态函数的方法.通过向原始信号中加入白噪声信号,使不同时间尺度的信号分布到合适的参考尺度上,经过多次平均抵消噪声,集成均值得到最终结果.EEMD利用白噪声信号频谱均匀分布的特性解决了EMD存在的模态混叠问题,进一步提高了分解的精度,较为准确地保留了原始数据中的特征[12].
每一个IMF分量的能量都代表着此频率内信号的能量,故信号与能量之间存在某种映射关系,可以作为故障诊断的依据.在此对IMF1~IMF3提取相应的能量构建特征向量[19].各IMF分量的能量Ei为
式中:Ei为第i个IMF的能量;ic为第i个IMF曲线的值;T为信号长度.
作为一种反向传播误差进行学习的多层前馈网络[17-18],BP神经网络可以实现复杂的非线性映射函数,它通过梯度下降阀法向代价函数的负梯度方向调整权重与阈值[15-16],依次求得代价函数的最小值,完成神经网络的训练.为加快BP神经网络的学习效率和收敛速度,避免陷入局部最优解,FSCS-ART算法对BP神经网络的参数进行初始化.自适应随机测试(ART)是一种自适应的随机测试算法,而D-ART是最好的ART测试算法之一,其核心思想是首先生成一候选测试集,由候选测试集中每个个体与测试集中每个个体间的最短距离组成最短距离集,再将最短距离集中的最大距离更新至测试集[20].
根据高压共轨柴油机供油系统常见故障及其分类,选取4种运行状态进行分析,其中1种为正常运行状态,3种为故障状态.4种运行状态分别是正常状态、2号喷油器延迟喷油状态、2号喷油器电磁阀磨损状态和高压油泵柱塞磨损状态.将上述4种运行状态分别命名为状态1、状态2、状态3与状态4.对上述4种运行状态分别采集50组轨压,每组轨压信号为一个喷油循环.图5为经处理后4种状态的轨压信号.
图5 不同运行状态的轨压信号Fig.5 Rail pressure signals in different operating states
建立的LSGANs中,生成器G含有473个输出层节点,输出层使用tanh函数作为激活函数;判别器D为一含有一个隐藏层的BP神经网络,它有473个输入层节点、1个输出层节点,所有层均使用LeakyReLU作为激活函数,最小迭代次数为1000代,最大迭代次数为100000代;若达到最大迭代次数则计算停止,并认为此次计算未收敛.每1代检查是否符合停止迭代条件,为方便计算,所有EMD的计算均使用归一化后的信号.
综合考虑,选择22作为判别器隐藏层节点数,10作为生成器输入层节点数.随机选取一次使用未喷油时的轨压信号作为生成器输入信号的计算结果,其合成信号与输入的真实信号之间的平均EMD与输入真实信号之间的平均EMD随迭代次数变化的曲线,如图6所示.其在11313代结束迭代循环,输入真实信号之间的平均EMD为1.689.最终生成的轨压信号质量良好,与真实信号差异较小.
图6 信号之间偏差随迭代次数的变化Fig.6 Deviation between signals varies with iteration algebra
图7为采用上述数据合成方法对状态2~状态4进行轨压信号合成处理后的真实轨压信号与合成轨压信号(归一化后)对比.
图7 归一化后不同状态真实轨压信号与合成轨压信号对比Fig.7 Comparison of real rail pressure signals and synthetic rail pressure signals in different states after normalization
为验证所建立的高压共轨系统小样本故障诊断模型的正确性,并与其他方法进行比较,现运用不同的小样本学习方法对所提及的4种运行状态进行故障诊断,不同方法的简介如表1所示.其中,方法1、方法2由不同的小样本学习方法生成某一故障状态的轨压信号;方法3为使用真实的故障状态的轨压信号进行故障诊断,以对比不同小样本学习方法与理想状态的性能差距.
表1 故障诊断方法简介Tab.1 Introduction o fault diagnosis methods
为验证使用仿真模型数据进行小样本学习的故障诊断正确率,喷油器自进油端至出油端依次命名为喷油器A~喷油器E,喷油次序为A—E—B—C—D.图8为正常状态下喷油压力试验值与仿真值的对比,选取试验曲线与仿真曲线吻合程度较差的点(如a、b、c、d和e处标记的数据点),将这些点的仿真值、试验值与相对误差对比见表2.
图8 喷油压力试验值与仿真值对比Fig.8 Comparison of experimental value and simulation value of fuel injection pressure
数据标记点 时间/ms 试验值/MPa 仿真值/MPa 误差/%a 3.50 82.233 79.77 2.99 b 3.75 151.51 147.01 2.97 c 4.00 178.28 171.89 3.58 d 4.25 166.71 162.91 2.27 e 4.50 102.66 101.15 -1.47
从图8与表2中可以看出,喷油压力试验值与仿真值的最大误差在5%以内,符合仿真要求,故本仿真模型能够较为准确地模拟此共轨系统在正常状态下的运行,依照上述方法分别对其他3种状态下仿真模型的正确性与准确性进行验证.经过上述验证,认为本仿真模型能够较为准确地模拟此5缸柴油机在上述4种状态下的运行.
每种运行状态选取35组作为训练样本,15组作为测试样本,测试样本根据运行状态不同依次编号,将训练样本的特征向量输入故障诊断模型中.对测试样本的三维能量特征向量输入故障分类器中进行故障诊断.表3~表5为使用不同小样本学习方法生成状态2~4的轨压信号故障诊断正确率,表中方法EMD1指数据与原始数据的平均EMD,EMD2指原数据自身的平均EMD,诊断状态1~4分别代表测试样本的状态,正确诊断代表对此状态下的测试样本进行故障诊断时诊断为本状态的样本个数.
表3 合成状态2轨压信号的故障诊断正确率Tab.3 Fault diagnosis accuracy rate of the composite state two-rail pressure signal
表4 合成状态3轨压信号的故障诊断正确率Tab.4 Fault diagnosis accuracy rate of the composite state three-rail pressure signal
表5 合成状态4轨压信号的故障诊断正确率Tab.5 Correct rate of fault diagnosis of the composite state four-rail pressure signal
针对高压共轨系统故障诊断中的小样本学习问题,所使用LSGANs在各个故障状态下均有着最高级的正确率,在小样本集上的诊断正确率在86.6%以上,说明其合成的轨压信号有着优秀的质量和较高的多样性.在面对状态2与状态3等这种真实数据间平均EMD较小的故障状态时,其在小样本集上的诊断正确率均可达100.0%;在面对状态4这种真实数据间平均EMD较大故障状态时,其在小样本集上的诊断正确率仍可达到83.3%,此时真实数据间平均EMD为3.11,而使用LSGANs合成的轨压数据与小样本数据间的EMD为2.87,合成的轨压数据自身的平均EMD为2.56,说明合成数据在既保证了与原始数据的相似度,又保证了合成数据有着与原始数据相似的多样性,能够体现此状态下的轨压信号特征;这表明此方法在各个故障状态下均可合成质量与多样性较好的轨压数据,在面对不同状态的小样本问题时均有着较高的正确率.
相比之下,原始GAN合成的轨压信号质量很高,在各个状态下其与真实数据集的平均EMD均为最小.在面对状态2与状态3这种真实数据间平均EMD较小的故障状态时,其在小样本集上的诊断正确率分别为93.3%与100.0%,与使用的LSGANs性能相差不大,但在面对状态4这种真实数据间平均EMD较大故障状态时,其在小样本集上的诊断正确率仅为66.6%,此时真实数据间平均EMD为3.11,但使用原始GAN合成的轨压数据与小样本数据间的EMD仍为1.76,其合成的轨压数据自身的平均EMD仅为1.69,在此状态下的数据多样性较差,无法充分体现此状态下的轨压信号特征;普适性较差,无法在多种状态下均取得较好的诊断正确率.而使用仿真模型进行小样本训练的方法在多个状态下均取得了最低的正确率,合成质量和多样性较差,无法体现此状态下的轨压信号特征.
综上可以得出,采用的高压共轨小样本故障诊断方法在解决小样本故障诊断问题时,生成合成数据质量更高、多样性更强,故障诊断模型正确率更高,在面对不同状态的高压共轨小样本故障诊断问题时均有着较高的正确率.
(1) 为解决高压共轨系统小样本故障诊断问题,通过台架试验,获得了高压共轨系统不同运行状态下的轨压信号;通过对轨压信号进行前期处理,获得了质量良好、可以进行时频分析的轨压信号;针对当前因获取难度大、获取质量差或获取成本高等原因造成的故障信号样本量小这一问题,使用LSGANs进行轨压信号的合成,得到了质量高、多样性强及在面对不同状态的小样本问题时均有着较高的正确率的训练样本集.
(2) 为验证所使用小样本学习方法的正确性与优秀性,采用台架试验设备收集经前期处理的训练与测试数据,通过与使用GAN的小样本学习方法对比,证明了基于LSGANs的小样本学习方法具有质量高、多样性强及在面对不同状态的小样本问题时均有着较高的正确率等优点;在为提高训练集数量而进行的小样本学习中较高的信号多样性与质量可以在有限的训练集上尽可能地描述此状态下的轨压信号特征,提高诊断正确率;使用的LSGANs合成质量较高、多样性最强,在合成多个状态的轨压信号时均取得了最高的故障诊断正确率,特别是在面对诸如状态4等多样性较强的故障状态时,其在小样本集上仍然有着86.6%的诊断正确率;与之相比,使用GAN解决训练集样本不足问题时仅有66.6%的诊断正确率,而使用仿真模型解决训练集样本不足问题时仅有46.6%的诊断正确率.
(3) 提出的基于生成式对抗神经网络的高压共轨小样本学习方法能够解决高压共轨系统故障诊断中的训练样本不足的问题,在面对多种故障状态时均有着较高的诊断正确率,是最适合高压共轨小样本故障诊断领域的小样本学习方法.