基于主元分析的逻辑回归模型混合域协变量选取研究

2018-07-26 08:28王萌王奉涛
轴承 2018年12期
关键词:主元频域时域

王萌,王奉涛

(大连理工大学 机械工程学院,辽宁 大连 116024)

目前,滚动轴承寿命理论归纳为基于统计分析的寿命模型,基于断裂力学分析的寿命模型以及基于状态监测的寿命模型,其中基于状态监测的寿命预测方法是当前研究的重点方向[1-3]。

文献[4]提出了基于逻辑回归的性能退化评估模型,并用试验进行了验证。文献[5]以均方根值和峭度值为协变量,比较了逻辑回归模型和Weibull比例故障模型对轴承退化状态的表征。文献[6]将逻辑回归模型应用在刀具的寿命预测中,其建立的刀具寿命预测模型的协变量选取的参数是小波包能量、小波包能量熵和时域特征。逻辑回归模型与Weibull比例故障模型的主要区别是,逻辑回归模型的假设条件和估计的参数较少,但能够更精确的预测剩余寿命。

在以往的研究中,逻辑回归模型使用的协变量选取不一,通常选取几个时域特征值作为协变量。然而,单一的评价指标并不能完全的表征轴承的退化过程。因此,提出一种基于PCA的逻辑回归模型协变量选取方法,其可以在保留大多数特征值的情况下更好的表征轴承的退化状态,从而更加有效地对轴承的可靠性进行评估。

1 理论基础

1.1 主元分析

PCA是一种常用的数据分析方法,可以提取数据的主要特征分量,常用于高维数据的降维[7-8]。

设有m个变量x1,x2,…,xm,每个变量有n个样本,第i个变量可以表示为xi=(x1i,x2i,…,xni)T,则由此构成的n×m阶矩阵为

(1)

将X记为X=[x1,x2,…,xm],其具体算法如下:

1)对原始的特征矩阵X进行特征中心化,计算均值,即

(2)

2)计算特征矢量的协方差矩阵

(3)

3)计算C的特征值λi和特征向量vi

Cvi=λivi;i=1,2,…,n。

(4)

4)计算贡献率

(5)

5)将λi从大到小排列,取前k个特征值与其对应的特征向量组成Δ=(λ1,λ2,…,λk)和V=(v1,v2,…,vk)。

6)计算k维特征矢量(k

P=VTX。

(6)

1.2 逻辑回归模型

逻辑回归模型中,因变量yt的取值为0和1,分别表示事件仅有的2种独立情况;t为事件发生的时间坐标,t=1,2,…,n;协变量X(t)={x1(t),x2(t),x3(t),…,xm(t)},m为协变量个数,即特征指标数。则事件不发生(yt=1)的条件概率为

P(yt=1|X(t))=

(7)

式中:β0为截距(或称常数项);βj为协变量xj(t)对应的回归系数。

滚动轴承当前的特征量为X(t),则滚动轴承的可靠度函数R(t|X(t))与累积失效分布函数F(t|X(t))=1-R(t|X(t))之比满足

exp[β0+β1x1(t)+β2x2(t)+…+βmxm(t)]。

(8)

由极大似然估计方法求出β0,β1,β2,…,βm后,滚动轴承的可靠度函数可以表示为

P(t|X(t))=

(9)

2 方法步骤

依据上述理论基础,所设计的算法流程如图1所示,具体实现步骤为:

图1 本文算法流程图Fig.1 Flow chart of algorithm in this paper

1)特征参数选择。从滚动轴承数据集中提取全寿命周期的时域特征、频域特征和时频域特征参数。

2)时域特征处理。对时域特征参数进行相对特征处理,求取相对时域特征值并与相对均方根值和相对峭度值进行相关分析,求取相关系数大于0.8的时域特征值组成时域特征集。

3)时频域特征处理。对轴承数据进行3层小波包分解,求取频带能量最大子带对应的样本熵作为时频域特征值。

4)PCA降维。对时域、频域和时频域组成的混合域特征集进行PCA降维,将高维特征集降为低维特征集,作为逻辑回归模型的协变量。

5)轴承可靠性评估。将基于混合域的逻辑回归模型的可靠性与基于时域相对均方根值和相对峭度值的逻辑回归模型的轴承可靠性进行对比,验证基于混合域特征集的逻辑回归模型的有效性。

3 试验分析

3.1 试验平台

采用由美国辛辛那提大学智能维护中心(IMS)提供的滚动轴承全寿命周期加速轴承性能退化试验数据[9]。试验台中的轴承位置和传感器布置如图2所示,试验轴承为双列圆锥滚子轴承,每列16个滚子,滚子组节圆直径为71.501 mm,接触角为15.17°,轴承转速为2 000 r/min,由弹性加载器施加26.689 kN的径向载荷。油反馈管道安装有磁性螺塞来收集润滑油中的碎屑,用以验证轴承的性能退化。系统电器开关的关闭由磁性螺塞所吸附的金属碎屑量决定,随着轴承性能不断退化,当吸附的碎屑量达到预先设定的阈值时数据采集工作便会停止。传感器为8个高灵敏度石英加速度传感器PCB353B33,分别采集每个轴承x和y方向的加速度信号,采集时间间隔为20 min,采样频率为20 kHz,采样长度为20 480点。

图2 试验台示意图Fig.2 Diagram of test rig

共进行了3次试验,每次试验中4套轴承均同时运行,选取第1次试验中3#轴承的全寿命数据进行分析。第1次试验结束时3#轴承内圈的严重故障如图3所示。

图3 轴承内圈的严重故障Fig.3 Serious fault of bearing inner ring

3.2 协变量选取方法研究

根据滚动轴承振动信号的特性,选择能准确反映滚动轴承运行状态的特征值。

3.2.1 时域特征

而由于制造、安装和实际工况的差异,同一工作环境下同型号轴承间的特征参数也会存在一定的差异,8套轴承正常工作期内一段趋势平稳振动信号的平均时域特征如图4所示。从图中可以看出,不同轴承的时域特征值存在较大的差异,为避免轴承个体差异的影响,兼顾良好的上升趋势并对初始损伤保持敏感,采用相对特征值进行后续处理。具体方法为:选取每个时域特征值正常运行期间中一段趋势平稳的数据,将该段数据的平均值设定为标准值,计算原始特征值与其对应的标准值之比,即相对特征值[11]。

图4 轴承正常运行期间的平均时域特征参数Fig.4 Mean time domain characteristic parameters of bearing during normal operation

时域特征值中常用的指标是均方根值和峭度值,取相对均方根值和相对峭度值作为进行相关分析的依据,将19个初选时域特征指标分别与相对均方根值和相对峭度值进行比较,取相关系数大于0.8的时域指标组成时域特征集,结果见表1。由表可知,相关系数大于0.8的时域特征值有13个,包括均方根值、标准差、方差、绝对均值、平均功率、方根幅值、峰值、峭度、峰值指标、脉冲指标、裕度指标、峭度指标和THIKAT。将这些时域指标作为逻辑回归模型的协变量参数。

表1 相关系数Tab.1 Correlation coefficients

3.2.2 频域特征

频域特征值选取重心频率和均方频率,其可以描述功率谱重心位置的变化情况;以及频率方差,用于描述功率谱能量分布的分散程度[12-13]。

3.2.3 时频域特征

小波包分解既对信号中的高频成分拥有较好的时频分辨率,又对低频信号的频率分辨率好。因此,选取3层小波包分解频带能量最大子带对应的样本熵作为时频域特征值。

3.2.4 主元分析

将选择好的时域、频域和时频域特征值组成混合域特征集,然后采用PCA对高维相对特征参数进行降维,前3个主元的累计贡献率见表2。由表可知:高维相对特征集经过PCA降维后前2个主元的累计贡献率已经达到了90%以上,第3主元的贡献率仅为3.09%,因此选择前2个主元作为逻辑回归模型的协变量。

表2 主元分析结果Tab.2 Results of principal component analysis

为观察主元分析的效果,将标准高维训练集投影到二维空间上,结果如图5所示。从图中可以看出:正常、早期故障、中期故障、严重故障从小到大依次排列,明显反应出轴承的退化趋势,其中恢复期[15]在第1主元上处于早期故障之间,这是由于轴承早期故障裂纹被磨平,振动冲击减小,故障特征频率不明显所导致;从第1主元上可以看出各个故障区分布很明显;从第2主元上可以看出特别明显的早期故障趋势,这是由于峭度值、峰值等特征指标对早期故障特别敏感的原因。

图5 第1,2主元滚动轴承状态图Fig.5 State diagram of rolling bearing of first and second principal component

3.3 轴承可靠性评估

为验证所述算法的有效性,将基于混合域特征集逻辑回归模型的预测结果与基于时域相对均方根值和相对峭度值的逻辑回归模型结果进行对比分析。2种模型获取的可靠度曲线如图6所示。

图6 逻辑回归模型的可靠度曲线Fig.6 Reliability curve of logistic regression model

对比分析可知:

1)轴承正常运行时期,混合域逻辑回归模型的可靠度在轴承从接近100%的位置开始,并随着轴承使用时间的增加平缓下滑;而时域逻辑回归模型的可靠度起点不仅在88%的位置,而且在轴承正常运行期间出现较大波动;说明经过PCA降维得到的特征值对轴承正常时期的表征要比仅仅依靠时域特征得到的可靠度要更加稳定、准确。

2)当轴承出现早期故障时,基于混合域特征的可靠度曲线出现小幅波动,并开始缓慢下降;而基于时域特征的可靠度曲线出现了剧烈的波动,这是由于峭度值对轴承早期故障特别敏感。

3)到达中期故障时,基于混合域特征的可靠度曲线波动仍较小,而基于时域特征的可靠度曲线仍存在剧烈的波动。

4)后期故障时,基于混合域的可靠度曲线能够平缓地描述轴承的退化过程,而基于时域的可靠度曲线出现断崖式的曲线。

综上所述,基于混合域的可靠度曲线在表征轴承的退化过程中要比基于单一时域特征值的曲线更加稳定、准确,且不受单一特征值对故障状态敏感性的影响。

4 结论

运用主元分析对逻辑回归模型的协变量选取进行了优化,通过试验研究得到如下结论:

1)相对时域特征值降低了轴承制造、安装和实际工况差异的影响,使轴承间的各体差异对时域特征集构建的影响大大降低。

2)将时域、频域和时频域组成的混合域特征集经过PCA降维后得到的特征值比单纯的时域特征值蕴含了更多能够表征轴承退化状态的信息。

3)基于混合域特征集的逻辑回归模型能更好的表征轴承的退化性能,比基于时域的模型更加稳定,可靠。

猜你喜欢
主元频域时域
大型起重船在规则波中的频域响应分析
多元并行 谁主沉浮
应用主元变换法分解因式
基于时域信号的三电平逆变器复合故障诊断
频域稀疏毫米波人体安检成像处理和快速成像稀疏阵列设计
运用结构的齐次化,选换主元解题
山区钢桁梁斜拉桥施工期抖振时域分析
网络控制系统有限频域故障检测和容错控制
基于极大似然准则与滚动时域估计的自适应UKF算法
基于改进Radon-Wigner变换的目标和拖曳式诱饵频域分离