基于融合型深度学习的滚动轴承亚健康识别算法

2018-10-16 02:56李大伟牛明航高一丹
计算机应用 2018年8期
关键词:亚健康编码器准确率

张 利,孙 军,李大伟,牛明航,高一丹

(辽宁大学 信息学院,沈阳 110036)(*通信作者电子邮箱zhang_li@lnu.edu.cn)

0 引言

自深度学习[1-3]模型提出以来,深度学习在包括故障诊断的多个领域都取得了快速发展。故障诊断简单来说就是比较正常工作时的数据与测量取得的特征值判断滚动轴承是否处于正常状态,亚健康识别是判断滚动轴承是否处于正常状态与不正常状态之间的一种状态,是故障诊断中的一种方法,本文将故障诊断与亚健康识别看作相同概念。

随着深度学习的发展,在故障诊断方面也出现了多种方法,其中自动编码器就是一种广泛应用的方法。在自动编码器的基础上衍生出了多种编码器方法,如稀疏、降噪、收缩、边缘降噪自动编码器等。深度学习与机器学习不尽相同,深度学习可以不依赖人的经验进行学习,通过从训练数据集中提取特征自主调节权重和偏置,当训练集合适时,经过适当的训练就可以得到一个较为理想的模型。

本文提出一种新的滚动轴承亚健康识别算法,尝试将自动编码器与相关向量机相结合用于滚动轴承的亚健康识别,旨在提高亚健康识别的工作效率。该算法首先从滚动轴承上采集数据进行傅里叶变换和归一化处理,然后用一种改进的稀疏边缘降噪自动编码器和另一种改进的相关向量机-深度自动编码器分别进行分类,最后运用D-S(Dempster-Shafer)证据理论融合得出最后的分类结果。与传统的层叠降噪编码器对比训练时间发现,本文算法能在较短时间内完成收敛,准确率相对稳定且有所提高,通过D-S证据理论能正确识别数据集的类别。

1 相关研究

1.1 深度学习

深度学习通过构建有多个隐含层的神经网络模型,从输入数据中获取较深层次的数据特征,这使得分类任务不仅节省了时间还提高了工作效率。工作流程大致分为两个阶段:预训练和微调。预训练阶段从输入层输入数据通过映射方法到各个隐含层,其中下一层的输入都为上一层的输出。此阶段网络的参数已经初步确定,然后利用反向传播算法对网络进行微调,得到最后较为理想的神经网络模型。深度学习常用的方法有自动编码器及其衍生出的各种自动编码器、玻尔兹曼机等。

假设一个含n个隐含层的神经网络模型的输入为i,输出为o,则可表示为i→n1 →n2 → … →n→o的形式。神经网络模型的结构如图1所示。

图1 神经网络模型的结构

1.2 相关向量机

相关向量机(Relevance Vector Machine, RVM)[4-6]是贝叶斯理论框架下的一种机器学习方法。相比支持向量机(Support Vector Machine, SVM),相关向量机泛化能力强、检测精度高,而且具有核函数选择更加自由、鲁棒性和泛化能力提高的特点。RVM对数据集进行分类任务时,一般采用sigmoid函数,结果值位于(0,1),值越接近1表示结果越准确。基本步骤如下:

1)初始化{αi},σ2,分类任务中不需要初始化σ2,α为超参数。

2)计算μ、Σ,Σ为权重的协方差。

3)利用公式

4)回到步骤2),判断是否满足停止条件,直到满足为止。

5)找到相关向量,即权重非零的样本,同时计算RVM模型参数。

1.3 滚动轴承亚健康识别

文献[7]中提出了用改进的粒子群算法优化BP(Back Propagation)网络的权值,用D-S理论对输出融合得到最后的分类,实验结果也表明改进模型比单独的BP网络分类效果更好;文献[8]中提出了一种改进的堆叠降噪自动编码器,用粒子群算法优化堆叠降噪自动编码器,并通过softmax分类,提高了泛化性能和识别准确率;文献[9]用改进的蚁群算法来优化SVM参数,然后用改进的支持向量机来检测滚动轴承亚健康状态,能有效提高检测精度;文献[10]中用改进的粒子群算法优化BP神经网络,建立了改进的粒子群神经网络模型,经实验表明改进后的算法在学习能力、收敛速度等方面都有很大改善;文献[11]将神经网络模型应用到滚动轴承的可靠性评估和剩余寿命预测上,并验证了该预测算法的合理有效性。

2 降噪自动编码器算法改进

2.1 改进的稀疏边缘降噪自动编码器

在原型自动编码器[12-15]的基础上加上某些特定的限制功能就会生成一种新的衍生编码器,稀疏边缘降噪自动编码器就是将稀疏自动编码器与边缘降噪自动编码器结合在一起,既可以减少来自噪声的影响也可以发挥稀疏自动编码器的优势,让隐层神经元大部分时间处于抑制状态,相当于此时网络以较少的神经元在工作的方式,一定程度上减少了计算量。

本文也采用将稀疏自动编码器和边缘降噪自动编码器相结合的方式,提出一种新的稀疏边缘降噪自动编码器。稀疏边缘降噪自动编码器与传统的自动编码器结构相似,由输入层、隐含层、输出层构成,结构如图2所示。

图2 隐含层加入规则示意图

与传统编码器不同的是,本文改进的模型结合了稀疏自动编码器和边缘降噪自动编码器的特点,在新形成的网络里加入了稀疏性的约束条件L1和边缘降噪自动编码器的约束条件L2,即最终模型的损失函数表达式如下:

(1)

在深度学习模型增加了隐含层的层数,使得神经网络模型在很多方面表现出色,应用也越来越广泛,但是想要得到一个自己满意的模型,需要大量的数据集来训练,这样才会获得合适的权重和偏置,因此,减少训练时间成了本文要解决的问题。

本文前面已经定义了模型的损失函数表达式,为了提高数据的处理速率,一般采用梯度下降算法,数学表达式如下:

θ(t+1)=θ(t)-η(t)▽L(θ(t))

(2)

其中:L(θ)为定义在数据集上的损失函数,▽L(θ)是损失函数的梯度,θ(t+1)与θ(t)是第t+1与第t次迭代的参数值,η(t)为学习率。

为了降低▽L(θ)的代价,本文用随机梯度下降算法,即选取一部分样本计算损失函数梯度的方式降低代价,如式(3)、(4):

θ(t+1)=θ(t)-η(t)▽Lm(θ(t));m=1,2,…,M

(3)

(4)

其中:▽Lm(θ)为第m批次数据经过计算得到的梯度值,N为第m批次数据集的大小。用随机梯度下降算法更新网络的权值和偏置方式如式(5):

(5)

其中η为学习率。

为了使网络有好的适应能力,本文选用一种自适应的全参数形式学习策略——AdaGrad,这样网络就可以自己调节参数,计算方式如下:

(6)

其中:η(0)为学习率初始化值一般为0.01,η(t)是t+1次迭代时的学习率,▽Lm是第s次迭代时损失函数的梯度,K为常数一般取值为1。分母部分可以保证学习率的变化趋势表现为整体下降趋势。

2.2 改进的深度自动编码器-相关向量机网络模型

改进后的结构先将输入数据通过稀疏边缘降噪自动编码器采用无监督训练的方式提取深层特征,但这样的数据没有经过微调,解决问题的能力有限,本文使用有监督的softmax函数对各个隐含层的参数进行微调,再利用RVM进行训练,这样就得到改进后的模型,结构如图3所示。

图3 改进后的自动编码器

传统的相关向量机(RVM)将低维数据映射到高维空间采用的是单一的核函数[16-18],这种方法适合样本数较少的情况,对于训练样本数据较多、结构相对复杂的情况,需要采用更加高效的方法。本文采用Fisher准则[19]计算的核参数和最大熵原理[20-21]计算的核参数相结合形成改进的相关向量机核参数。

则样本类间散布矩阵为:

Sb=(μ1-μ2)T(μ1-μ2)=

(7)

样本类内散布矩阵分别为:

(8)

(9)

根据Fisher准则得到的最优核参数为:

根据最大熵原理得到的最优核参数为:

其中E1、E2为样本X1、X2的分布熵:

(1-λ)×arg max(E1+E2);λ∈[0,1]

与SVM相似,RVM进行的是二分类模式识别问题,这对亚健康识别并不适用。为实现多分类模式识别,要对多个相关向量机进行组合,本文采用“一对多”的分类方法。这种方法分类函数数量较少,不会超过目标类别数,在分类中分类速度相对较快。

3 D-S证据理论

D-S证据理论在多个领域都得到广泛的应用,在机械设备“亚健康”识别中更为常见。D-S证据理论是由Dempster提出采用一个概率范围来模拟不确定性,后来,在Dempster基础上,Shafer又作了进一步研究并给出了两个证据的合成规则[22-24]。

本文方法流程如下:将预处理后的数据分别输入到稀疏边缘降噪自动编码器和相关向量机自动编码器中进行多分类,然后根据D-S证据理论融合,再利用D-S决策理论决策出结果,得到最终的结果。其中采用的决策规则如下:

(24)

其中:A1是最后的结果,ε1、ε2是提前设定好的阈值,Θ为识别框架,m(Ai)为基本可信数。

4 实验与结果分析

4.1 实验数据

利用美国凯斯西储大学(Case Western Reserve University)的滚动轴承实测数据来验证本文方法能否达到预期的效果。实验数据有1 000多个样本,数据量虽然不大,但从最终实验结果的准确率(如表5)上来看,平均准确率能达到97%以上,说明本文的方法是有效的,以花费训练时间为代价,深度自动编码器-相关向量机网络模型在准确率和稳定性上都有不错的效果。

用DAT(data)记录器在16通道采集振动信号,Matlab处理得到的振动信号。采样数字信号的频率为12 kHz,同时以48 kHz的采样频率来采集驱动端的数据。本文实验数据选取的采样点是在驱动端,采样频率为12 kHz。采集的8种滚动轴承数据如表1所示。

表1 8种滚动轴承数据

以0负载为例,4种状态下对应的振动信号如图4所示,经过傅里叶变换后频域如图5所示。

选取隐层神经元400个,隐层层数设为3,选取了8种初始状态,所以输出神经元个数是8,各层学习率对比如图6所示。从图6(a)~(c)对比可以看出本文设计的学习率改进方法是有效的。

表2比较了本文提出的稀疏边缘降噪自动编码器与传统的层叠降噪编码器在达到稳定状态时训练时间的差别。从表2中可以看出,稀疏边缘降噪自动编码器在训练时间上明显缩短,本文训练了3次,改进前的训练时间都在120 s左右,改进后的训练时间在98 s左右。

表2 改进前后训练时间对比

图4 4种状态下驱动端振动信号(0负载)

图5 傅里叶变换后4种状态驱动端振动信号频谱图

图6 每一层学习率变化趋势

表3列出了通过Fisher准则方法、最大熵原理及本文方法计算的各参数值。表4为在Fisher准则和最大熵准则基础上得到的最优核参数应用到深度自动编码器-相关向量机模型对数据集的识别准确率,可以看出改进后识别准确率达到了98.6%,较改进前分别提高了3.9个百分点和2.5个百分点,达到了改进的效果,提高了识别准确率。

表3 不同方法求得的最优核参数值

表4 不同方法最高准确率对比

本文在选取的8种状态下各选取3种进行实验,得到深度自动编码器-相关向量机模型的准确率与准确率均值如表5所示。由表5的数据可以看出,深度自动编码器-相关向量机模型的训练效果比较稳定。

表5 识别准确率对比

4.2 结果分析

设置采样频率为12 kHz,以滚动轴承负载为0、转速为1 797 r/min的驱动端的正常基线数据为正常状态,以驱动端负载为3 HP、转速为1 730 r/min的正常基线数据作为亚健康状态,以负载为3 HP、转速为1 730 r/min、故障直径为0.007 mm的滚珠故障数据作为故障状态,得到识别框架为Θ{健康状态,亚健康状态,故障状态}三种状态,输出结果采用二进制编码形式,正常状态、亚健康状态、故障状态分别表示为[1 0 0]、[0 1 0]、[0 0 1]。设置ε1=0.30,ε2=0.60。识别结果如表6~7所示。

从表6可以发现第二空间中编号为2的样本被分到了亚健康状态中,但在第一证据空间和期望输出中都是正常状态,说明第二证据空间中得到的结果是错的,通过D-S证据理论融合后识别结果为正常状态,说明已经正确地将结果更正过来。

类似的,对于表7中的亚健康样本可以看到,第一证据空间编号为1的样本被分到了健康状态,但在第二证据空间和期望输出中都是亚健康状态,说明第一证据空间中的结果是错的,通过D-S证据理论融合后识别结果为亚健康状态,说明已经正确地将结果更正过来。

表6 D-S证据理论对正常样本的识别结果

表7 D-S证据理论对亚健康样本的识别结果

5 结语

本文提出了一种改进自动编码器的方法,首先是稀疏边缘降噪自动编码器,实验表明改进方法在训练时间上较层叠自动编码器有所增加;然后是改进相关向量机自动编码器,经实验表明这种改进在正确率和稳定性上都有不错的效果;最后结合得到的证据空间经过D-S理论融合后能正确识别出不正确的分类,达到了目标。不过本文模型增加了训练时间,还有改进的空间,也是进一步需要研究的内容。

猜你喜欢
亚健康编码器准确率
融合CNN和Transformer编码器的变声语音鉴别与还原
设定多圈绝对值编码器当前圈数的方法
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
转炉系统常用编码器选型及调试
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
舞台机械技术与设备系列谈(二)
——编码器
党员“亚健康”,咋办?——咸阳探索“党性体检”
甩掉亚健康 我们在行动