叶智勇
【摘 要】本文设计了PCA用于滚动轴承故障诊断中数据降维的应用方法使得数据维数大幅下降,使得支持向量机的训练速度和判断准确率大幅提高。本文还设计了基于PCA的利用正常运行信息建立模型进行故障检测和故障诊断的方法,避免了其他方法由于故障信息不易采集导致故障检测、诊断不理想的问题,为过程控制、故障检测提供了一条新思路。
【关键词】PCA;机械制造;应用
随着工业过程规模的不断扩大和复杂性的日益提高,有效的过程监控和故障诊断是保证生产安全、提高产品质量和经济效益的关键。统计过程监控是一种基于多元统计理论的方法,它通过对测量数据进行分析和解释,建立统计监控模型,判断过程所处的运行状态,在线检测和识别过程中出现的异常工况,从而减少由过程故障所造成的损失,提高生产效率。
基于主元分析法(Principal Component Analysis,PCA)是一种多元统计分析方法,它可以从多个控制变量中解析出主要影响因素,挖掘数据规律,简化数据集与设备运行状态间的规律,在机械制造中的应用具有广阔的前景。它在工业制造中的应用可以归纳为以下两个方面:第一,PCA可实现数据降维,它通过线性投影分析把多个变量化为少数几个主成分,重构后的主成分向量能够反映原始变量大部分信息,从而达到压缩信息、提高计算效率并去除冗余的作用;第二,PCA模型可在状态监测和故障诊断中起到重要作用,通过对稳态数据的分析,可以建立主元模型,以主元模型为评价标准,对即时数据进行运算,从而判断生产系统是否正常,对处于故障状态的设备还可以通过贡献图等定位故障原因,实现故障的诊断与分离。
1 PCA在数据降维中的应用
近年来,基于数据驱动的各种研究方法展现出越来越大的优势,例如神经网络、支持向量机等,但是相关方法往往需要大量的数据分析。随着工业过程的自动化水平提高,监测的数据量越来越庞大,数据的激增带来了计算效率低下、冗余信息过多等一系列的问题,导致了决策系统的训练时间过长、收敛速度较慢等问题[3]。研究发现工业过程中采集的数据并不是所有都是敏感信息,也有冗余信息。PCA方法可以去除冗余信息,保留敏感信息来降低数据维度,从而提高计算效率、缩短决策系统的决策时间。
1.1 主元向量的计算
PCA实现数据重构主要包括主元向量的计算和主元个数的确定两方面。主元向量由协方差矩阵得到,协方差是一种度量两个维度关系的统计量。去冗余的目的就是使保留下来的维度间的相关性尽可能小,维度间的差别尽可能大。维度的差别就是同一纬度的方差,维度间的相关性就是协方差。
1.2 主元数目的确定
合理确定主元个数很重要,主元选取多则模型精确,但是会增加维数,选取的少又会丢失原始数据空间的许多信息,需要在个数和识别效果之间需找平衡。通常采用主元累积贡献率法来确定主元个数。
1.3 基于PCA的降维技术在工业数据分析的应用
本文设计了PCA用于滚动轴承故障诊断中数据降维的应用方法,具体的流程如下所示:
开始→样本数据S→对S做预处理得到标准数据矩阵X→计算X的协方阵C→计算C的特征值及特征向量矩阵→主元累积贡献率法确定主元个数k→确定投影矩阵P1→降维后的矩阵X=XP1→完成降维。
在滚动轴承故障的诊断中,先运用经验模态分解(EMD)对轴承原始振动信号进行分解,从各个IMF分量中计算时域特征值包括6个特征统计量,依次是均值、平方和、标准差、峰值、极差、变异系数。为了更好地检测故障,还选择倾斜度、峭度、峰值指标、波形指标、脉冲指标、裕度指标这6个无量纲特征,一共12个特征指标建立样本数据矩阵。然后进行数据降维,最后得到的数据矩阵用于支持向量机(SVM)的训练和检测从而进行故障诊断,诊断正确率比没有进行数据降维得到的判断正确率高,证明数据降维的效果明显。
2 PCA在过程控制中的应用
基于PCA进行过程控制的基本思想是:通过线性空间变换求取主元变量,将观测空间分离成一个获取过程的系统趋势的主元子空间,和一个包含噪声的残差子空间。因为某些故障主要影响两个子空间中的一个。在对过程性能进行监控时,一般利用Hotellings和平方预测误差(SPE)两个统计量进行监测[4]。
本文设计了基于PCA的用于滚动轴承状态检测和故障分析的应用方法,具体的流程如图1所示。
首先,运用EMD方法将滚动轴承故障信号分解成不同频率尺度的单分量固有模态函数,获取了不同频率范围的信号成分;其次,对各个IMF分量进行主成分分析并建立主元模型,计算相应的SPE控制限和Hotelling T2控制限;最后,将待检测轴承信号输入主元模型,计算测试数据的SPE统计量和T2统计量的值,判断是否超出控制限,如果没有超出控制限则表示处于正常状态,如果超出控制限则表示处于非正常状态,再计算各个变量对于SPE统计量和T2统计量的贡献值,并绘制各变量对于SPE统计量和T2统计量的贡献图,对统计量贡献最大的变量就是引起失常的原因,最终实现了故障的诊断与分离。
3 结论
根据机械制造中多参数的数据特点,利用PCA方法可以充分挖掘数据信息,去除冗余,再结合神经网络、支持向量机等方法对机械故障进行诊断,实验证明降维后的数据可以大幅消除冗余,使得运算速度大幅提高,说明PCA用于数据降维的效果明显。通常机械的故障样本不易获得,而正常运行的状态信息较易获取,本文设计实验运用正常运行信息样本建立PCA模型,通过判断测试信号的SPE和T2统计量是否超出控制限来对运行状态进行监测,并且通过计算各分量对统计量的贡献大小来判别故障源,从而实现故障的诊断与分离,避免了其他方法由于故障样本少导致故障诊断效果差的问题,为过程控制、故障检测提供了一条新思路。
【参考文献】
[1]MacGregor J F, Kourti T. Statistical process control of multivariate process[J]. Control Engineering Practice,1995,3(3):403-414.
[2]苏林,尚朝轩.基于多元统计的卫星姿态控制系统故障诊断[J].系统仿真学报.2010,22(8):1981-1985.
[3]徐卓飞,张海燕,王丹,等.基于EMD与KPCA的滚动轴承股脏特征提取及诊断方法研究[J].机械科学与技术,2014,33(10):1518-1524.
[4]徐倩倩.基于改进PCA-SVM的印刷机故障诊断方法研究[D].西安理工大学,2014.
[责任编辑:刘展]