改进Logistic回归模型的滚动轴承可靠性评估方法

2018-03-06 02:18王奉涛敦泊森李宏坤韩清凯
振动、测试与诊断 2018年1期
关键词:主元特征参数轴承

王奉涛, 王 贝, 敦泊森, 李宏坤, 韩清凯, 朱 泓

(大连理工大学机械工程学院 大连,116024)

引 言

滚动轴承在旋转机械中广泛应用,是易发生故障的零部件,它的运行状态对于保障设备安全可靠运行意义重大[1]。据不完全统计,在旋转机械的各种故障中,约有30%是由滚动轴承的故障引起的[2]。如果能准确地对滚动轴承进行可靠性评估,则能够有效减少停机时间和维修费用、延长设备寿命、提高设备的完好率和可用度,满足设备的任务可靠性要求[3]。

传统意义上的可靠性主要将统计学和概率论作为工具,通过大量的失效实例来建立相同工况下一批设备的平均可靠度[4]。但是,获取大量失效样本比较困难,实际轴承的工况、转速和故障类型不同,导致可靠度也不同。因此,轴承的可靠性是个性问题,运用统计学和概率论得出的平均可靠度难以满足单个轴承可靠性评估的要求。由于轴承的状态振动特征量能够提供可靠性评估的重要信息,因此基于状态的可靠性评估越来越被重视[5]。Jardine等[6]提出可靠性主要有3类:统计学方法、人工智能方法和基于模型的方法。目前,人工智能方法在可靠性评估方面运用仍然比较广泛。孟光等[7]对近年来一些主要的寿命预测方法和预防维护规划模型进行了总结、分类和比较,并讨论了一些潜在的研究方向。丁峰等[3]研究了基于设备振动信号的峭度值和方均根值等特征,利用比例故障模型实现对铁路机车轮子的滚动轴承的可靠性评估。Ali等[8]采用数据驱动的方法研究了基于威布尔和人工神经网络的轴承寿命预测。Zhang等[9]研究了基于混合威布尔比例故障模型实现对高压水泵轴承的寿命预测。文献[10]研究了基于相关向量机和Logistic回归模型的机械性能退化评估。Tran等[11]研究了基于设备比例故障模型和支持向量机的机械性能退化评估。以上方法均存在建模复杂、参数假设会对预测结果产生主观影响的缺陷。

Logistic回归模型主要研究的是客观事物变量之间的联系,它是用来寻找隐藏在那些看上去不确定现象中规律的统计方法[12]。Logistic回归和线性回归最大的区别是因变量为类型变量,例如在机械设备健康状态研究中,可分为正常、早期故障、中期故障和严重损坏[13]几种类型变量。模型中参数较少且易于估计,可以采用似然估计的方法将其参数估计出来,因此相对威布尔比例故障模型具有参数易于估计、不需要假设的优点[14]。其自变量可以是离散的、连续的或者哑变量,表征一个设备性能从正常到失效需要多个特征量。Logistic通过分析描述设备在多特征条件下的失效概率,这对设备工程师制定维修计划非常有利[15]。文献[16]提出把在线数据的特征量输入Logistic中来评估电梯门实时性能。但是,Logistic回归模型具有自身的局限性,在可靠度函数计算过程中仅考虑到当前的特征量,不能反映轴承振动信号特征量的劣化趋势。

为了建立轴承运行状态与可靠性的关系模型,笔者对Logistic回归模型进行改进,提出一种基于改进Logistic回归模型的滚动轴承可靠性评估方法。该方法在可靠性评估时充分考虑轴承的退化趋势,能够消除随机波动信号对可靠性评估结果的影响。试验结果表明,该方法不但提高了可靠性评估精度,而且对于同类轴承有很好的适用性。

1 改进Logistic回归模型

滚动轴承状态可由一系列的特征参数表示,当数据样本由特征参数和滚动轴承状态组成时,Logistic回归模型能建立评估滚动轴承状态的模型[17]。将影响滚动轴承状态参数的协变量用向量X(t)={x1(t),x2(t),…,xm(t)}表示,其中,m为协变量的个数,即为特征指标数。事件不发生(yt=1)的条件概率表示为

P(yt=1|X(t))=

(1)

其中:β0,β1,…,βm为协变量对应的回归系数,并且β0>0。

轴承在t时刻的状态可分为正常和失效,分别对应yt=1和yt=0两种状态。协变量X(t)={x1(t),x2(t),…,xm(t)}表示当前时刻设备状态监测信号的特征参数。根据滚动轴承的特性,该时刻的滚动轴承状态信息yt和协变量X(t)应该是非线性关系。

假定滚动轴承当前的特征量为X(t),则滚动轴承的可靠度函数R(t|X(t))与累积失效分布函数F(t|X(t))=1-R(t|X(t))之比满足

(2)

其中:β0为截距,是常数项;β0,β1,…,βm反映协变量的权值大小;βi>0表示事件发生比率随特征量xi的增大而增大,反之,减小;βi=0说明该自变量对此模型没有影响。

对其参数用极大似然估计方法求解,似然函数对数形式为

(3)

因为Logistic模型为非线性的,因此可以由最大似然估计出。 求出β0,β1,…,βm之后,滚动轴承的可靠度函数可表示为

P(t|X(t))=

(4)

Logistic回归模型在可靠性评估时仅考虑当前时刻t的特征量,导致模型的可靠性评估精度低。由式(4)可知,Logistic回归模型在可靠度计算时仅考虑轴承当前时刻的特征量,会因不同轴承个体之间的差异和采集的数据随机波动性给可靠性评估结果带来干扰,而且不能消除恢复期[18]带来的干扰。因此笔者将滚动轴承退化过程考虑到可靠性评估中,提出ILRM。对于滚动轴承振动信号的某个特征向量的时间序列{xi(1),xi(2),…,xi(N)},根据嵌入理论[19],认为数据的未来值与其前面的m数值之间存在一定的函数关系,即

xi(j+m+1)=F(xi(j),xi(j+1),…,xi(m+1))

按照式(5)~(7)对Logistic回归模型改进

ui(j+m+1)=αjxi(j)+αj+1xi(j+1)+…+

αj+mxi(j+m)+xi(j+m+1)

(5)

(6)

其中:αk(k=j,j+1,…,m+j+1)为模型的修正系数。

αi(k)=

(7)

改进Logistics回归的可靠度函数为

P(t|H(t))=

(8)

由式(5)~(8)可知,改进Logistic回归模型具有自适应性,一方面可以消除数据波动的影响,另一方面可以把轴承的劣化趋势兼顾到轴承可靠性评估过程中,有利于提高精度。wi(t)为ui(t)在特征值正常时期的一段趋势平稳数据的均值。H(t)={h1(t),h2(t),…hm(t)}为时变模型的特征量。

其似然函数对数形式为

(9)

Logistics回归模型仅考虑当前轴承的特征,没有考虑之前的退化趋势,易受到特殊点干扰,使可靠度评估结果因数据波动而产生较大误差。ILRM兼顾之前的轴承状态,摆脱了多种不利影响,得到更加精确的评估结果。

2 方法步骤

基于改进Logistic回归模型的滚动轴承可靠性评估方法流程如图1所示。

图1 笔者提出的算法流程图Fig.1 Algorithm flow chart

1) 特征参数选择:从滚动轴承振动数据中提取全寿命周期的时域特征、频域特征和时频域特征参数,筛选出有效特征参数,组成特征向量集。

2) 相对高维特征集的构建:选取滚动轴承特征量正常期的一段求取均值,该特征的全寿命数据除以该均值得出相对特征,分别求取有效特征参数的相对特征,构建混合域的相对高维特征集。

3) 主元分析:对混合域的相对高维特征集进行主元分析,选取累计贡献率大于95%的主元。

4) 建立模型:根据选取的主元对模型进行参数估计,建立ILRM。

5) 可靠性评估:利用测试组的轴承数据按照训练组的方法步骤选取出模型的协变量,利用已建立的改进的Logistic回归模型对滚动轴承进行可靠性评估。

3 试验分析

3.1 滚动轴承试验台介绍

笔者采用的数据是由美国辛辛那提大学智能维护中心提供的滚动轴承全寿命周期加速轴承性能退化试验数据[18]。试验台轴承位置和传感器布置如图2所示。一根转轴上装有4个轴承,型号为Rexford ZA-2115, 由直流电机通过皮带联接驱动,轴承转速为恒定值2 kr/min,由弹性加载器施加22.24 kN的径向载荷。油反馈管道安装磁性螺塞,收集润滑油的碎屑用以验证轴承的性能退化。系统电器开关的关闭由磁性螺塞吸附的金属碎屑量决定。随着轴承性能不断退化,当吸附的碎屑量达到预先设定的阈值,数据采集工作便会停止。传感器为8个高灵敏度石英加速度传感器PCB353B33,分别采集每个轴承x和y方向的加速度信号,振动信号用NI公司的DAQCardTM-6062E数据采集卡进行采集,采集时间间隔为20 min,采样频率为20 kHz,采样长度为20 480点。

图2 试验台装置示意图Fig.2 Schematic diagram of test bench

试验共进行3组,每组包含4个轴承。第1组轴承编号为1~4,第2组轴承编号为5~8,第3组轴承编号为9~12。表1为各组轴承的试验结果。失效轴承表示在试验结束时轴承已经损坏。失效模式表示轴承的失效类型,包括内圈故障、外圈故障及滚动体故障。删失轴承表示在试验结束时轴承没有损坏。笔者采用3号轴承数据验证模型,其他11组轴承数据被用来训练模型。

表1 试验结果Tab.1 Experimental result

a为内环故障;b为滚动体故障;c为外环故障

3.2 协变量选取

根据滚动轴承振动信号特征,提取时域、频域和时频域的52个特征[20]。根据各参数的全周期变化过程,筛选出有效的特征参数如下。

时域特征:峭度值、峰峰值、IMF1能量、方差、平均功率、IMF2能量、绝对均值、标准差、脉冲因子、裕度因子和峭度因子。

频域特征:峰值频率和均方根频率。

时频域特征:3层小波包分解的第3频带归一化小波包能量谱(E3)和第7频带归一化小波包能量谱(E7)。

由于各个轴承制造、安装和实际工况的差异,同一工作环境下同型号轴承间的特征参数存在一定的差异。1~8号轴承的峭度值特征、峰-峰值特征、均方根频率特征和E3(3层小波包分解的第3频带归一化小波包能量谱)的参数对比如如图3所示。可以看出,1~8号滚动轴承特征量的均值存在很大的差异。这种现象导致一些轴承在故障期时的特征参数会小于其他没有发生故障的轴承。因此,利用原始特征值不但无法对轴承全寿命进行分段,而且会因不同轴承之间的差异给建模带来干扰。

图3 1~8号轴承特征参数平均值对比Fig.3 The comparison of bearings feature parameters

为降低上述影响,笔者使用相对特征值,具体做法如下:选择每个特征值正常期内一段趋势平稳的特征值,将该段特征值的平均数作为标准值,计算原始数据与标准值的比值,得到相对特征值,结果如图4所示。其中:(a)(b)为时频域特征小波包第3,7能量谱;(c)(d)为频域特征;(e)(f)(g)(h)(i)(j)(k)(l)(m)(n)(o)为时域特征;(p) 表示全寿命周期轴承数据采集是否间断,间断点为空数据,在此时间内未进行数据采集。

滚动轴承特征参数所反应的特征状态各不相同,很难看出哪些特征参数能较好且全面地反映轴承的状态。因此,在上述特征分析的基础上提取有用且全面的轴承特征尤为重要,但是选取过多的特征量作为协变量会给建模带来困难。笔者利用主元分析达到选取有效特征量的目的。用PCA分别对相对特征参数和原始特征参数进行降维,结果如表2所示。由于滚动轴承制造、安装和工况差异引起数据离散,故直接对原特征集降维的效果远低于对相对特征集的分析效果。相对高维特征集PCA降维之后,到第2主元时贡献率已达到96.57%,因此笔者选择前二主元作为ILRM的协变量。

表2主元分析结果

Tab.2TheresultofPCA

贡献率/%第1主元第2主元第3主元特征值86.6789.5393.69相对特征值91.1796.5797.81

为观察主元分析的效果,把相对高维训练集投影到二维空间上,结果如图5所示。从第1主元可以看出,正常期、 早期故障、 中期故障、严重故障[13]从小到大依次排列,明显反映轴承的退化趋势。其中,恢复期在第1主元上处于正常期和中期故障之间,原因是故障裂纹被磨平,一些故障特征的特征值相对早期故障减小的缘故,但恢复期的故障相对早期故障较为严重,因此轴承可靠性评估应该注意该时期,防止出现误判从而干扰制定维修计划。从第2主元可以看出,早期故障相对其他故障较高,主要是以峭度值为主要特征的特征量在故障初期升高的原因。

图4 滚动轴承全寿命相对特征值Fig.4 Relative characteristics of whole lifetime

图5 第1,2主元滚动轴承状态图Fig.5 The rolling bearing state of 1,2 principal components

综上所述,主元特征量能准确包含滚动轴承劣化趋势的有效信息,不但能够反映轴承的退化趋势,而且把维数从15维降到2维,解决了模型有效协变量选取和模型参数估计困难的问题。

3.3 可靠性评估

为了验证算法的有效性,用Logistic回归模型可靠性评估结果和本研究算法可靠性评估结果进行比较。用极大似然估计方法根据式(3)和式(9)估计Logistic回归模型和ILRM的参数,如表3所示。

将第1和第2主元带入ILRM和Logistic回归模型,分别求出全寿命可靠度如图6,7所示。

表3 模型参数估计Tab.3 Model parameters

图6 ILRM可靠度曲线Fig.6 Reliability curve of improved Logistic regression model

图7 Logistic回归模型可靠度曲线Fig.7 Reliability curve of Logistic regression model

由图6,7可知,笔者提出算法的可靠度曲线能够反映轴承的退化趋势。在正常时期,ILRM的可靠度曲线开始下降,这和随着工作时间的增加轴承可靠度降低的现场情况相一致;Logistics回归模型的可靠度曲线没有下降趋势并且有较大的波动,这违背了实际工况。在恢复期,由于早期故障的裂纹被磨平峭度值、峰值等特征的幅值降低,造成Logistic回归模型的可靠度曲线出现上升的趋势[18],可靠度超过了早期故障,这不符合滚动轴承的实际工况,给制定预防性维修计划造成干扰。ILRM改善了以上不足,可靠度曲线在恢复期继续下降,这与滚动轴承的实际工况相吻合。在故障的中期和后期,ILRM可靠度曲线波动较小,可靠度按照故障阶段顺序依次下降,而Logistic回归模型可靠度曲线波动较大,且严重故障时期一些点的可靠度高于中期故障。由于波动的存在图7中早期故障的一些时间点的可靠度比恢复期和中期故障的可靠度还要小,这不符合滚动轴承的实际工况,会给预测性维修带来干扰。这是由于ILRM通过PCA选取了更为全面的反映滚动轴承劣化趋势的特征量、有效的对原模型进行优化以及消除了轴承个体差异的影响,从而使可靠度曲线与实际工况更为吻合。ILRM通过式(5)~(7)降低了滚动轴承振动信号的随机波动,把轴承的退化趋势引入到模型中,提高了模型可靠性评估的精度。

4 结 论

1) 相对多特征的主元分析方法降低了轴承制造、安装和实际工况差异产生的不同轴承个体之间的差异的影响,可以选出有效的协变量,避免传统协变量选取方法带来的局限性,优化了Logistic回归模型协变量选择方法。

2) ILRM解决了Logistic回归模型仅考虑当前时刻特征量不能兼顾轴承的劣化趋势的问题,可以很好地适应振动信号的随机波动,降低因振动信号波动对可靠性评估结果产生的影响。

3) 该方法适用性强,根据转动设备振动数据样本建立ILRM进行可靠度评估,为制定维修计划提供有力支持。

[1] 梅宏斌. 滚动轴承振动监测与诊断-理论·方法·系统[M].北京:机械工业出版社,1996:1-6.

[2] 盛兆顺,尹琦岭. 设备状态监测与故障诊断技术及应用[M].北京:化学工业出版社,2003:224-226.

[3] 丁锋,何正嘉,訾艳阳,等. 基于设备状态振动特征的比例故障率模型可靠性评估[J].机械工程学报,2009,45(12):89-94.

Ding Feng, He Zhengjia, Zi Yanyang, et al. Reliability evaluation of proportional failure rate model based on equipment state vibration characteristics[J]. Journal of Mechanical Engineering, 2009,45(12):89-94. (in chinese)

[4] O′Connor P D T. Commentary: reliability-past, present, and future[J]. IEEE Transactions on Reliability, 2005,54 (1):3-10.

[5] Saranga H, Knezevic J. Reliability prediction for condition-based maintained systems[J]. Reliability Engineering and System Safety, 2001,71(2):127-130.

[6] Jardine A K S, Line D, Banjevic D. A review on machinery diagnostics and implementing condition-based maintenance[J]. Mechanical Systems and Signal Processing, 2006,20(7):1483-1510.

[7] 孟光,尤明懿. 基于状态监测的设备寿命预测与预防维护规划研究进展[J]. 振动与冲击,2011,30(8):1-11.

Meng Guang, You Mingyi. Research progress of equipment life prediction and preventive maintenance planning based on state monitoring[J]. Journal of Vibration and Shock, 2011, 30(8): 1-11. (in Chinese)

[8] Ali J B, Chebel-Morello B, Saidi L, et al. Accurate bearing remaining useful life prediction based on Weibull distribution and artificial neural network[J]. Mechanical Systems and Signal Processing, 2015,56-57:150-172.

[9] Zhang Qing, Hua Cheng, Xu Guanghua. A mixture Weibull proportional hazard model for mechanical system failure prediction utilizing lifetime and monitoring data[J]. Mechanical Systems and Signal Processing, 2014,43(1-2):103-112.

[10] Caesarendra W, Widodo A, Yang B S. Application of relevance vector machine and logistic regression for machine degradation assessment[J]. Mechanical Systems and Signal Processing, 2010,24(4):1161-1171.

[11] Tran V T, Hong T P, Yang B S, et al. Machine performance degradation assessment and remaining useful life prediction using proportional hazard model and support vector machine[J]. Mechanical Systems and Signal Processing, 2012, 32(4):320-330.

[12] 何晓群. 实用回归分析[M].北京:高等教育出版社,2008:219-230.

[13] 汪寅虎. 基于状态监测的旋转部件可靠性评估方法研究[D]. 大连: 大连理工大学,2014.

[14] Liao Haitao, Zhao Wenbiao, Guo Huairui. Predicting remaining useful life of an individual unit using proportional hazards model and logistic regression model[J]. Reliability and Maintainability Symposium, IEEE Transactions on, 2006, 127: 132.

[15] Chen Baojia, Chen Xuefeng, Li Bing, et al. Reliability estimation for cutting tools based on logistic regression model using vibration signals[J]. Mechanical Systems and Signal Processing, 2011, 25(25): 2526-2537.

[16] Yan J, Lee J. Degradation assessment and fault modes classification using logistic regression, Transactions of the ASME[J]. Journal of Manufacturing Science and Engineering, 2005, 127 (4): 912-914.

[17] Cao Xiangang, Jiang Pingyu, Zhou Guanghui. Facility health maintenance through SVR-driven degradation prediction[J]. International Journal of Materials and Product Technology, 2008, 33 (1): 185-193.

[18] Qiu Hai, Lee J, Lin Jing, et al. Wavelet filter-based weak signature detection method and its application on rolling element bearing prognostics[J]. Journal of Sound and Vibration, 2006, 289(4-5):1066-1090.

[19] Takens F. Detecting strange attractors in turbulence dynamical systems and turbulence[J]. Dynamical Systems and Turbulence, 1981, 898: 365-381.

[20] 孙建. 滚动轴承振动故障特征提取与寿命预测研究[D]. 大连: 大连理工大学,2015.

猜你喜欢
主元特征参数轴承
轴承知识
轴承知识
轴承知识
轴承知识
冕洞特征参数与地磁暴强度及发生时间统计
应用主元变换法分解因式
基于交通特征参数预测的高速公路新型车检器布设方案研究
转换主元 解放思想
运用结构的齐次化,选换主元解题
基于PSO-VMD的齿轮特征参数提取方法研究