基于RF-ELM的轴承故障诊断

2020-12-24 08:00崔立业陈楠
装备维修技术 2020年16期
关键词:随机森林故障诊断

崔立业 陈楠

摘要:在工业迅猛发展、生产力大大提高的时代背景下,人工智能方法在解决机械设备的安全问题上有着巨大潜力。一般的,机械设备的故障是目前主要的研究方向,其中齿轮箱、轴承故障是研究热点。通过对简单且容易获得的振动信号进行分析,达到对机械故障的识别与预警。本研究提出了一种基于独热编码及随机森林特征选择的极限学习机轴承故障识别算法,实验表明,经过特征提取与独热编码处理类别标签,能有效地提高识别准确率,降低故障识别时间,能有效地解决轴承故障问题,减少生产危险事件的发生。

关键词:故障诊断;独热编码;随机森林;极限学习机

1 引言

目前,滚动轴承故障诊断的方法主要包括振动诊断、铁谱诊断、温度诊断、声学诊断、油膜电阻诊断及光纤监测诊断等方法。其中,应用最为广泛的是振动、铁铺、温度诊断技术。在工业生产过程中,轴承元件的工作表面可能会出现疲劳剥落、压痕及局部腐蚀,这使轴承在运行中会产生周期性的脉冲信号[1]。由安装在轴承座上的传感器采集这些信号,为振动诊断技术提供数据基础。随着神经网络等人工智能方法的普及,利用神经网络与振动信号来监测旋转机械中轴承的故障变得更为有效[2]。一般的,利用振动信号进行故障诊断的方法会使用经验模态分解、变分模态分解、小波分解等信号处理方法,在时域、频域上对信号进行分析,提取有用特征,从而匹配相应的故障。胡爱军等[3]提出一种基于集成经验模态分解与峭度准则的包络解调方法,解决了经验模态分解模态混叠问题,从而有效地提取滚动轴承故障特征信息,能够实现滚动轴承故障的精确诊断。刘长良等[4]提出了以变分模态分解为信号处理方法的模糊C均值聚类滚动轴承故障诊断方法,实现滚动轴承故障的精确诊断。除了利用信号处理方法对信号进行特征提取,Joshuva A等[5]通过计算相同长度信号的描述性统计参数作为信号特征,使用特征选择方法J48决策树选择有效信号特征,构建决策树实现了对风力机叶片的故障诊断。

可见,对于振动信号的处理对于特征提取至关重要,本研究提出了一种基于独热编码作为故障类别标签,通过计算固定长度滚动轴承振动信号的描述性统计参数作为特征提取方法,使用随机森林进行特征选择,建立极限学习机(Extreme Learning Machines, ELM)故障诊断模型,对凯斯西储大学(CWRU)轴承数据中心的数据进行了实验。实验结果表明,提出的特征提取与特征选择方法有效的提高了模型的故障诊断精度,并且使用ELM作为模型则更加快速。

2 振动信号处理

从CWRU获取的轴承数据是由安装在基座上的加速度计采集的包含采样频率为12K、48K驱动端、12K风扇端轴承故障数据及对应频率及转速下正常的基座数据。本研究提取了0马力(电机转速为1797转/分)下12KHZ采样频率的驱动端轴承与对应正常的基座数据。CERU的数据其中包含10种故障类别,分别为正常数据以及人工放电加工植入0.007、0.014、0.021英寸深度下产生的内圈故障、滚动体故障、外圈故障。使用由张伟[6]提出的数据预处理方法,处理为10000组,信号长度为864(2个周期)的数据集。

2.1振动信号特征提取

由于轴承故障信号为时域信号,无法直接作为特征输入到模型中进行故障诊断。因此,对这10000组数据分别计算其描述性统计参数,这些参数包括信号点之和、均值、中位数、最大值、最小值、极差、偏度、峰度、标准差、样本方差。

其中偏度、峰度公式如下:

(2-1)

(2-2)

其中, 为均值, 为标准差。

2.2振动信号的特征选择

良好的特征选择有利于提高模型精度并减少分类时间,随机森林是一个包含多个决策树的分类器,本研究采用随机森林(Random Forests, RF)方法,通过对第二节得到的10个描述性统计参数与对应的独热编码进行预分类实验,得到所选特征的重要性排序。

根据图2-1可知,描述性统计参数中的中位数与偏度的重要性比前八个参数要低很多,因此,特征选择前八个参数作为模型的输入。

2.2 归一化

由于使用ELM神经网络进行建模,而对于神经网络需要消除输入特征之间不同量纲的影响,所以需要对网络的输入,即8个描述性统计参数进行归一化处理。公式如下:

(2-3)

其中, 为归一化后数据, 、 分别为该特征最小值和最大值。

3 建立極限学习机故障诊断模型

如图3-1所示,极限学习机是一种是前馈神经网络,它具有一个输入层,一个单层隐藏层和一个输出层,相比于其他神经网络,它不依靠基于梯度的反向传播来调整权重,而是通过穆尔-彭罗斯广义逆(Moore-Penrose generalized inverse)来设置权值a和b,因此其训练时间非常短,具有良好的泛化性能以及极快的学习能力[7]。

4实验

4.1评价指标

轴承故障诊断是多类分类问题,所以为了验证模型的有效性,使用准确率(accuracy)、精确率(precision)、召回率(recall)、F1-Measure作为分类性能的评价指标。

(4-1)

(4-2)

(4-3)

(4-4)

其中,FN:False Negative,被判定为负样本,但事实上是正样本。FP:False Positive,被判定为正样本,但事实上是负样本。TN:True Negative,被判定为负样本,事实上也是负样本。TP:True Positive,被判定为正样本,事实上也是正样本。

4.2实验

4.2.1特征选择有效性实验

为了显示特征选择的重要性,分别做了特征选择前后的分类实验。结果如表4-1所示,可以看出,通过特征选择后的建模算法在计算时间与各评价指标上均有所改善,证明特征选择方法对于建模具有减少时间和提高精度的作用。

4.2.2不同模型之间的对比实验

为了显示本研究所提算法的有效性,分别与深度神经网络(Deep Neural Net, DNN)、支持向量机(Support Vector Machine, SVM)建模方法进行对比。结果如表4-2所示,对于大样本数据来说,RF-ELM与RF-SVM在计算时间上相比于RF-DNN有更大优势。然而,RF-ELM相比剩余两种方法具有更高的准确率、精确率以及F1-Measure。综合比较3种方法,可以得知,本研究提出的RF-ELM具有更好的分类性能。

5参考文献

[1] 郑怀亮, 王日新, 杨远涛, 等. 数据驱动故障诊断方法泛化性能的经验性分析[J]. 机械工程学报, 2020, 56(09): 102-117.

[2] 朱丹宸,赵磊,张永祥. 复杂装备滚动轴承的故障诊断与预测方法研究综述[J]. 中国测试, 2020, 46(03): 17-25.

[3] 胡愛军, 马万里, 唐贵基. 基于集成经验模态分解和峭度准则的滚动轴承故障特征提取方法[J]. 中国电机工程学报, 2012, 32(11): 106-111+153.

[4] 刘长良, 武英杰, 甄成刚. 基于变分模态分解和模糊C均值聚类的滚动轴承故障诊断[J]. 中国电机工程学报, 2015, 35(13): 3358-3365.

[5] Joshuva A, Sugumaran V. A data driven approach for condition monitoring of wind turbine blade using vibration signals through best-first tree algorithm and functional trees algorithm: A comparative study[J]. ISA Transactions, 2017, 67: 160-172.

[6] 张伟. 基于卷积神经网络的轴承故障诊断算法研究[D]. 哈尔滨工业大学, 2017.

[7] Li Y, Zeng Y, Qing Y, et al. Learning local discriminative representations via extreme learning machine for machine fault diagnosis[J]. Neurocomputing, 2020, 409: 275-285.

猜你喜欢
随机森林故障诊断
风力发电机组齿轮箱轴承故障诊断分析
基于人工神经网络的故障诊断专利浅析
浅谈机电一体化设备的故障诊断技术研究
基于EMD和SSAE的滚动轴承故障诊断方法
随机森林在棉蚜虫害等级预测中的应用
基于二次随机森林的不平衡数据分类算法
拱坝变形监测预报的随机森林模型及应用
基于随机森林算法的飞机发动机故障诊断方法的研究
基于随机森林算法的B2B客户分级系统的设计
基于多视角特征融合与随机森林的蛋白质结晶预测