基于FFT和LLTSA的传动系统故障诊断研究*

2022-04-22 12:52刘秋菊王仲英
机电工程 2022年4期
关键词:降维维数分类器

陈 晓,刘秋菊,王仲英

(1.郑州工程技术学院 机电与车辆学院,河南 郑州 450000;2郑州工程技术学院 信息工程学院,河南 郑州 450000;3河南经贸职业学院 工程经济学院,河南 郑州 450018)

0 引 言

在机器设备中,机械传动系统通常用来传输动力,其承载部件的运行状态往往会直接影响整台机器的性能。机械传动系统中,易损部件主要为齿轮和轴承,并且其最为常见的故障形式如疲劳失效,如点蚀、裂纹、磨损等。因此,为实现对轴承、齿轮的状态监测,故障诊断的提前预警具有重要意义[1,2]。

目前,在故障特征提取方面有一些常用的方法。王朝阁等人[3]提出的小波包变换自适应Teager能量谱的故障诊断方法;邵忍平等人[4]利用希尔伯特-黄变换(Hilbert-Huang transform,HHT)对信号进行的处理,能够更有效地提取故障特征;刘吉彪等人[5]将改进的局部特征尺度分解(local feature scale decomposition,LCD)方法与包络谱相结合,并将其应用于滚动轴承故障诊断中。

以上这些学者提出的Teager能量谱、HHT变换、LCD分解等方法,均是将原始振动信号进行时域、频域或时频域的转换,再提取相关特征进行故障建模。然而轴承、齿轮故障信息常常淹没在强大的噪声环境下,从原信号信息中所分解得到的信息往往是不全面的,原始振动信号的转换和特征构建方式的选择会影响后续的智能分类器训练和识别。

流形学习是一种高效维数约简方法[6-8],可以对复杂、非线性的高维信号通过优化融合策略获取敏感特征,进行维数约简和数据分析。流形学习原始样本空间的构建是决定流行学习算法及智能分类器识别效率的关键因素,样本空间的好坏直接影响最后的分类测试结果。

目前,常用的原始样本空间的构建方法可分为两种,第一种是单个的时域或者频域方法,第二种是混合的时频域方法。

陈果等人[9]提取了轴承早期故障的时域特征信号,利用时域信号的峰值、波形因数、歪度值、裕度指数等9个特征参数,构建了高维原始特征集;但这种方法存在一定的局限性,即这种方法选取得到的样本原始空间的冗余信息少,包含的信息量小。汤宝平等人[10]通过对轴承故障信号的时、频域正交特征进行划分,提取到了6种多维信息熵,并以此作为约简的原始信号高维特征;此种方法虽然可尽可能多地得到原始信号的特征信息,但是多维信息熵的冗余信息量太大,必然会影响流形学习的降维及后续的智能分类器训练与识别过程。

在传统的故障诊断方法中,往往先要基于先验知识,求取原始振动信号的时域特征、频域特征、时频域特征,并以此作为信号低维特征,将其输入到智能分类器中,最后对其进行模式的识别。

此处笔者提出一种基于FFT与LLTSA联合的智能故障诊断方法,即首先采用FFT变换算法,将原始数据从时域转换到频域,获得高维特征数据;然后使用LLTSA流形学习算法,对高维特征数据进行数据降维,将获取的低维特征用于智能分类器建模;最后以典型的轴承和齿轮试验台数据进行训练和测试。

1 基于流行学习的智能分类算法

1.1 基于LLTSA的流行学习方法

LLTSA是在流形学习非线性局部切空间排列(LTSA)的基础上,借鉴locality preserving projections等算法思想,为解决流形学习算法出现的算法泛化问题而提出的[11-13]。

LLTSA主要是寻找转换矩阵A,将Rp空间中具有N个点的含噪声数据集Xorg(故障样本集)映射为Rq空间数据集Y:

Y=ATXorgHN,q

(1)

式中:HN—中心化矩阵;I—单位矩阵;e—元素全部为1的N维列向量;Y—Xorg的q维非线性流形。

其中:

HN=I-eeT/N

(2)

LLTSA具体算法流程如下:

(1)获取特征信息样本集;

(2)设Apca为转换矩阵,将样本数据集做PCA映射,用X=[x1,x2,…,xN]表示映射后的数据集;

(3)按照k-Nearest Neighbor标准,选取Xi的k个最小距离近邻点作为邻域,并包含自身,以确定领域;把样本点Xi的近邻点组成一个领域矩阵XNi=(xi1,xi2,…,xij);

(4)提取局部信息。计算XiHk的q个奇异向量,组成局部低维空间矩阵V,并计算:

(3)

式中:Vi—与XiHk的第q个最大奇异值对应的右奇异向量。

(5)通过局部累加构造排列矩阵B(初始化B=0):

(4)

式中:Ii—k个近邻点。

其中:Ii={i1,i2,i3…ik}。

(6)计算映射。计算广义特征问题的特征值和特征向量:

XHNBHNXTa=λXHNBHNXTa

(5)

(7)与特征值λ1,λ2,…,λn对应的特征向量为:a1,a2,…,an,则:

Alltsa=(a1,a2,…,aq)

(6)

(8)得到转换矩阵为A=ApcaAlltsa,则原数据的最终低维全局坐标为:

Y=ATXHN

(7)

式中:Y—所求的低维数据样本。

低维数据样本最大限度地保留了原始高维信号的信息,可将其用于智能分类器的训练与识别。

1.2 FFT与LLTSA联合的智能分类方法

基于FFT变换的样本信息原始空间构造方法的核心思想,是减少数据降维分析过程中信息量的丢失。

FFT与LLTSA联合智能分类方法的过程如下:

(1)对原始样本信号进行FFT变换,因为变换后的信号仍能通过IFFT变换得到原始样本信号,所以在这个过程中没有信息量的丢失;

(2)取FFT变换后的信号模值组成降维后的数据样本,此时的数据样本维度为原信号的一半,利用LLTSA流形学习算法降维,获得样本信息的原始空间;

(3)将原始空间样本送入基于Cuckoo算法优化的智能分类器进行训练和测试,获得故障信息的分类诊断结果。

为比较不同降维算法的优劣性,笔者将基于流形的LLTSA算法,以及核函数的KPCA算法,采用非线性降维算法的稀疏特征表示MDS方法,对机械传动中的轴承、齿轮进行故障识别与诊断分类,以表明全信息FFT与LLTSA联合智能分类方法在机械传动系统故障检测中的有效性。

2 轴承故障诊断测试

此处轴承故障诊断测试采用美国凯斯西储大学(Case Western Reserve University)电气工程实验室的轴承故障诊断试验数据,对轴承工作数据信息进行获取与处理。

试验轴承型号为6205-2RS,试验转速为1 772 r/min,采样频率为12 kHz,负荷为轻载;

采集内圈故障、外圈故障,滚动体故障,故障形式均为裂纹故障,故障程度分3种等级,共9种模态下的轴承振动信号(用data1,data2,…data9表示),故障程度3个等级,等级1,等级2,等级3对应的裂纹长度分别为0.177 8 mm,0.355 6 mm,0.533 4 mm;

每种状态采集了50个样本数据,长度为2 048,其中40组用于分类器训练,10组用于分类测试[14]。

首先,笔者对获得的轴承实验数据先进行FFT变换,求取幅值。

裂纹长度为等级1的滚动体、内圈、外圈3种故障模式样本信号,经FFT变换后得到的频谱图如图1所示。

这3种故障模式的FFT幅值谱图的特征信息是比较模糊的,这是由于信号在傅里叶变换中,存在频谱泄漏、非等周期截断等原因而造成的。

从振动信号来分析,谱图紊乱的另一些重要原因是由于噪声的存在,以及信号的非线性、非平稳造成的。

为降低FFT频谱图的冗余信息,提取有用的特征信息,下一步将对获得的FFT幅值谱进行维数约简。维数约简分为两步:第一步根据信号的信息特征对降维后的维数进行最近邻域估计,维数估计算法不同的影响在第3节讨论。第二步采用3种降维算法KPCA、MDS和LLTSA分别对样本信号进行降维。

KPCA降维后的聚类结果如图2所示。

图2 KPCA算法降维后的效果

MDS降维后的聚类结果如图3所示。

图3 MDS算法降维后的效果图

LLTSA降维后的聚类结果如图4所示。

图4 LLTSA算法降维后的效果图

为了便于清晰地对比结果,上述对比图中显示了9种模态下的前6种故障模式的降维结果。

降维后的数据样本如表1所示。

表1 3种算法降维后的9种运行状态的数据样本对比

笔者将降维后的样本数据输入到分类器LSSVM[15],在训练与测试中选用Cuckoo算法[16]对外参数和惩罚因子参数进行了优化选取(Cuckoo算法的使用避免了经验选取分类器LSSVM外参数和惩罚因子的人为误差)。每种运行状态的40组样本用于智能分类器的训练,10组用于测试。

笔者采用训练后的智能分类器对各种运行状态进行识别,获得的识别率如表2所示。

表2 训练后的智能分类器对不同运行状态的识别率

由表2可知:

对于9种不同的运行状态,使用全信息FFT+LLTSA方法的智能分类器的识别率达到了100%;使用全信息FFT+KPCA/MDS方法的智能分类器的识别率则低于100%,但依然高于95%。

该结果说明,基于全信息FFT+流形学习算法+智能分类器对于不同工况、不同故障程度的轴承模式识别的有效性。

3 齿轮故障诊断测试

此处齿轮故障诊断测试采用旋转机械振动分析及故障诊断试验平台系统,对齿轮工作数据信息进行获取与处理。

齿轮箱振动测试系统如图5所示。

图5 齿轮箱振动测试系统图

图5中:驱动系统的动力源为直流电机1,主动齿轮4和被动齿轮12组成减速箱,齿轮均为渐开线直齿轮,齿数分别为30和45,11为磁粉加载器,联轴器有2,3,7,8,10,加速度传感器5获取轴承的振动信号,传感器9获取输出轴转速。

笔者共采集50组样本数据,40组用于分类训练,10组用于测试。

齿轮4的故障情况如表3所示。

表3 齿轮故障类型及数据编号

笔者获取齿轮实验数据并进行分析,其中,1~6组样本信号的频谱图如图6所示。

图6 齿轮样本信号全信息谱图(1~6组)

由于频谱图中包含大量的冗余信息,下一步笔者要对获得的幅值数据样本做维数约简,以突出故障特征,减少无用信息。

笔者使用关联维数估计方法和最近邻域估计方法得到最佳嵌入维数分别为3和5。

LLTSA算法降至3维后的样本特征如图7所示。

图7 LLTSA算法降至3维后的样本特征(1~6组)

LLTSA算法降至5维后的样本特征如图8所示。

图8 LLTSA算法将至5维后的样本特征(1~6组)

从图(7,8)中可以看出:不同的维数估计算法对降维效果的影响明显;

降至3维后,data1,data2,data5,data6区分较为明显,data3与data4存在一定的重叠;

降成5维后,虽然无法像降成三维后可以直观的看出不同的数据样本的聚类效果,但可以看出不同的特征不能进行线性的区分,需要智能分类器进行高维空间的最优分类,并通过测试结果来获知降成5维的数据样本的聚类效果。

笔者将降维后的样本数据的前40组用于智能分类器的训练,后10组用于测试。

经过训练后的智能分类器对各种运行状态的识别率如表4所示。

表4 训练后的智能分类器对每种运行状态的识别率

由表4可知:

(1)选用不同的维数估计算法,不同的降维算法对智能分类器的识别结果均有较大影响:

(2)在不同运行状态样本数目在20组以内时,2种维数估计算法和3种降维算法差异不太明显,智能分类器的识别率均能达到90%以上。

(3)当运行状态样本继续增加时,应用最近邻域估计算法得到的测试结果显示出了极大的优势,识别率始终保持在较高水平;其中,使用LLTSA降维算法在应用两种维数估计算法的情况下均显示出了较好的性能,识别率最为优异。

经过智能分类器训练后的1~8组运行状态模式分类图如图9所示。

图9 经智能分类器训练后的1~8组运行状态模式分类

图9的结果表明:

(1)笔者所提出的故障诊断方法是有效的;

(2)使用FFT减少数据降维分析过程中信息量的丢失,可以充分地表达传动系统原始数据的特征。

4 结束语

笔者提出了一种基于FFT与LLTSA联合的智能故障诊断方法,对传动系统局部故障进行有效的检测与诊断,在研究过程中同时将其与KPCA和MDS算法进行对比,结果显示出了LLTSA算法在故障检测与诊断能力上的优势。

研究结论如下:

(1)对数据进行FFT变换后,将获得的幅值信号作为样本信息直接用于降维,减少了因人为选择特征导致样本信息一定程度的衰减;

(2)在LLTSA维数约简中使用关联维数和最近邻域估计算法求取最优的低维嵌入维数,经过实验数据测试,最近邻域估计算法在样本模式种类较多时能获取更为精准的样本特征信息,提高了智能分类器的测试准确率;

(3)采用KPCA、MDS、LLTSA 3种流形学习算法对滚动轴承、齿轮实验数据进行了处理,对其效果进行了对比,结果显示,LLTSA算法降维进行智能分类训练后的故障识别效果最好,体现其方法的有效性。

由于数据样本有限,笔者没有对获取数据库以外的轴承和齿轮故障振动数据进行诊断,以获取更多的传动系统数据样本。在下一步的研究中,笔者将获取更多的传动系统数据样本,以此来验证这一诊断方法的有效性。

猜你喜欢
降维维数分类器
修正的中间测度和维数
一类平面数字限制集的维数
混动成为降维打击的实力 东风风神皓极
基于朴素Bayes组合的简易集成分类器①
含非线性阻尼的二维g-Navier-Stokes方程全局吸引子的维数估计
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
基于特征选择的SVM选择性集成学习方法
基于差异性测度的遥感自适应分类器选择
一种改进的稀疏保持投影算法在高光谱数据降维中的应用