自适应流形学习在故障诊断中的应用

2021-02-04 14:16:40陈明月刘三阳

计算机工程与应用 2021年3期

陈明月，刘三阳

西安电子科技大学数学与统计学院，西安710126

近年来，为了降低目标空间的维数，人们提出了许多降维方法。如主成分分析法（Principal Component Analysis，PCA）[1]、线性判别分析法（Linear Discriminant Analysis，LDA）[2]等。这些方法均不能揭示数据的内在结构。而流形学习方法能够很好地表征事物流形[3]。本文主要运用流形学习这一特点，将其应用于机械故障检测领域，并取得了较好的效果。

故障检测的研究中已有许多成果，如文献[4-6]将时频分析法应用到故障检测邻域；文献[7]使用自适应多小波能够获得高灵敏度的故障特征；文献[8-9]通过高阶统计量法提取故障特征，这些方法均取得较好的效果。其中文献[10]提出了一种基于双谱纹理特征提取的故障诊断方法，这种方法能够很好地去除高斯噪声。随后，文献[11]提出了针对非高斯噪声的基于EMD和双谱分析的故障特征提取方法。文献[12-13]提出了自适应局部切线空间算法，能够自适应选择邻域大小，无需人工干预。

结合文献[10-13]方法的优点，本文提出了一种自适应流形学习的故障检测方法，这种方法能够有效地去除高斯和非高斯噪声，能够克服固有邻域的局限性，有效地提取低维特征。首先，介绍了故障特征提取的方法，以及降维的方法，接着描述了算法流程，并通过对加速度传感器采集的6205-2RSJEM SKF轴承驱动端的振动信号进行了故障类型和退化程度的识别与检测，证明了此算法的有效性。本文将这四种方法相结合，为滚动轴承的故障特征提取提供了一种新方法。通过与文献[14]中传统的EEMD算法和其他流形学习算法比较，表明该算法的分类精度较高。

1 EEMD和双谱分析的特征提取

为了进行有效的故障特征提取，首先采用EEMD方法去除非高斯噪声，然后使用双谱分析法去除高斯噪声。结合两种方法可以有效地去除噪声，同时保留相位信息。

1.1 EEMD分解

EEMD 方法最早由Wu 和Huang 等人提出[15]，通过提取不同频带的能量值作为故障诊断的特征值。首先用EEMD算法将轴承振动信号分解为多个IMF，然后根据相关系数原理提取前5个IMF分量，计算能量特征。

1.2 双谱分析

高阶谱（High-Order Spectrum，HOS）又称为高阶累积量谱或多谱，是随机过程高阶统计量的多维傅里叶变换，其分析过程包含了对相位信息的分析[16]。双谱（三阶谱）因其计算最简单等优点被广泛使用。

定义设是一个零均值k阶平稳随机过程，则k阶积累量被定义为：

定义若是绝对可求和的，即则k阶积累量的离散傅里叶变化被定义为k阶积累量谱：

当k=3 时，公式（2）被定义为双谱，它是三阶统计量信号x(n)的二维傅里叶变换，定义如下：

2 纹理分析和自适应流形学习的降维

使用纹理分析从上一章得到的双谱等高线图中提取故障特征，得到高维纹理特征矩阵，作为自适应流形学习的数据输入，然后使用自适应流形学习方法进行降维，能够很好地得到低维特征。

2.1 纹理分析

灰度共生矩阵（Gray-Level Concurrence Matrix，GLCM）本质上是一个矩阵像素距离和角度的函数，通过计算图像中一定距离之间的关系及在一定方向上（0°，45°，90°，135°）两点的灰度，得到图像反映在方向、间隔、变化范围和变化速度的综合信息。为了分析方便，采用下列公式对矩阵进行归一化：，由此得到归一化共生矩阵。

GLCM共有14个特征统计量，本文在进行轴承故障诊断时选取角二阶矩、对比度、自相关、逆差矩、熵、最大概率、平均值、方差、残差的方差等9个相关的纹理参数。

2.2 自适应流形学习

流形学习算法可以有效地进行非线性降维，同时在低维空间保持原有的拓扑结构。将自组织映射（Self-Organization Mapping，SOM）与局部切线空间对齐算法（Local Tangent Space Alignment，LTSA）相结合提出了一种自适应流形学习算法（Self-Adaptive Local Tangent Space Alignment，SALTSA）[12]。基于自适应邻域选择，可以有效地提取低维特征，通过网格的自适应划分竞争机制可以获得节点邻域，克服了固定邻域的局限性。

3 基于自适应流形学习的故障检测

基于自适应流形学习的故障诊断方法（SAML），用第1 章中方法对信号进行故障特征提取得到双谱等高线图，并使用第2章中介绍的GLCM从中提取信息构成高维特征矩阵，然后用SALTSA 降维。因此，该算法主要分为特征提取和自适应流形学习降维两大部分。

3.1 SALTSA降维

在自适应学习算法中，自组织映射可以自适应地划分网络节点，利用竞争层神经元来匹配流形结构局部邻域的中心，然后对高维流形的局部邻域进行自适应划分。

由此得到SALTSA算法步骤如下：

（1）采用SOM 网络对权值进行优化。为了保持最优结果的一致性，将W的初始权值设为单位矩阵，将H学习比设置为1.1。

（2）自适应选择邻域。将权重W的每一个元素设置为局部中心节点。为了保证邻域之间有足够的重叠，设邻域半径为中心节点之间最大距离的一半。根据邻域半径，可以求出邻域Xi，其中i=1,2,…,k且k为拓扑网格的数量。

（4）构造一致性矩阵。一致性矩阵B可以采用公式对矩阵B局部求和得到。

（5）调整全局坐标。计算矩阵B的d+1 个最小特征向量，得到特征向量矩阵对应于第2 到d+1个最小特征向量。设全局坐标ud+1]T，在全局坐标下，在低维空间T中得到特征值。

3.2 基于自适应流形学习的故障检测

此方法用于滚动轴承故障诊断的流程图如图1 所示，步骤如下：

（1）用EEMD和双谱分析对原始振动信号进行故障特征提取。

（2）利用GLCM算法提取在（0°，45°，90°，135°）4个方向上的9个典型纹理特征值，构成36维纹理特征矩阵。

（3）利用SALTSA算法对高维纹理特征矩阵进行降维处理，得到基本流形的低维特征。

图1 自适应流形学习故障诊断方法流程图

（4）将（3）中得到的低维纹理特征，用支持向量机（SVM）进行训练和测试。SVM的核函数采用径向基函数（RBF），惩罚参数C和核函数参数σ，通过遗传优化算法（GA）优化得到。

（5）在不同的故障条件下得到不同的分类精度。

图2 健康数据经EEMD处理

图3 外圈故障经EEMD处理

图4 内圈故障经EEMD处理

4 实验验证

4.1 获取滚动轴承故障数据

本章测试所用的旋转轴承实验数据来自凯斯西储大学滚动轴承数据中心。测试轴承为6205-2RSJEM SKF深沟球轴承。实验轴承采用电火花加工，故障直径分别为7 mils、14 mils、21 mils、28 mils（1 mils=0.001 英寸=0.002 54 cm），设置单点故障。本文的数据为驱动端加速度计数据。其中转子的转速为1 797 r/min，采样频率为12 000 Hz，且每组数据包含2 000个点，采集健康、内圈故障、外圈故障、滚动元素故障4 个类型滚动轴承振动加速度信号。

4.2 特征提取

4.2.1 基于EEMD的故障特征提取

对信号用EEMD 进行分解可以有效地去除非高斯噪声，EEMD方法能够自适应地将信号从高频到低频进行分频得到多个IMF分量，根据能量相关法提取前5个IMF作为特征向量，实验结果如图2～5所示。

4.2.2 基于双谱分析的故障特征提取

图5 滚动元素故障经EEMD处理

由于信号中还存在大量的高斯噪声和其他干扰成分，不能直接从振动信号中分析出故障类型。因此采用双谱分析法去除高斯噪声，得到双谱等高线图如图6。分析图6 可知不同故障状态下的纹理特征存在较大的差异，各图像特征也各不相同。由此可以看出，准确提取图像纹理特征的情况下，可以识别出各种故障类型。

4.3 基于GLCM的纹理特征提取

利用GLCM 方法计算不同故障条件下4 个方向上（0°，45°，90°，135°）的9种纹理特征参数，得到各故障条件下的36 维纹理特征矩阵。不同故障条件下角二阶矩、方差、相关性、对比度4种纹理特征在0°方向上的分布如图7所示。分析图7可以看出这些纹理特征参数具有较好的分类性能，在图7（a）和（b）状态下，参数的值是相对稳定的，但在图7（c）和（d）状态下，参数存在着较大的分布混淆。由此可见，利用部分纹理特征参数在一定程度上可以识别故障类型，因此为了得到更好的分类效果，本文计算多个方向的多种纹理特征参数。

4.4 基于SALTSA的降维

4.4.1 参数优化

（1）最小嵌入维度m。确定最小嵌入维度的方法有很多，本文使用Cao方法[17]。为了研究维度的变化定义其中表示a(i,m)的均值，可以通过判断其值是否大于一个给定的阈值来判断一个假邻域，由于很难确定合适的阈值，所以常取的平均值E(m)。利用此方法能够求出不同故障条件下的最优维度参数设置。如图8～10所示，利用Cao方法求出在3种故障状态下的最小嵌入维度，分别mBF=10。

图6 双谱等高线图

（2）自适应选择邻域ε。众所周知，在处理高度扭曲和折叠的流形结构时，较大的邻域会引起混淆。相反，即使将连续流形划分为不相交的子流形，小邻域也会错误地估计邻域之间的关系。所以，为了构造流形拓扑结构，自适应选择邻域大小必须满足以下两个原则：

①在构造流形拓扑结构时，所有的子空间是连通的。

②为了传输局部信息，相邻邻域之间应该具有足够的重叠。

4.4.2 SALTSA算法降维

SALTSA 算法采用SOM 算法自适应选择邻域参数ε，利用Cao 方法来确定最小嵌入维度m，无需人工干预，提高了算法的效率和可操作性。

遗传算法GA用来寻找支持向量机SVM最优参数，其中设置种群大小为20，最大迭代次数为200，SVM 的惩罚函数C和核函数ε的搜索范围都设置为0 到500，每个故障条件下选取100 个数据集，其中20 个为训练集用于训练GA-SVM，80 个为测试集。分别进行5 次实验，取不同故障条件下的最优值和5 次实验的平均值。使用GA-SVM在不同故障条件下滚动轴承故障诊断的分类精度如表1 所示。分析表1 可知故障类型识别和轴承退化程度识别精度最优都可达100%，平均识别精度达到99%以上，从而证明了该方法的可靠性。另外，多次实验取平均值发现，无论是轻微故障，还是严重故障，平均分类精度均可以达到99%以上，这也说明了本文提出的方法具有较好的灵敏性。实验结果表明，本文方法一方面能够准确地识别出不同的故障类型；另一方面对轴承退化程度也有较好的诊断能力。

图7 不同故障部分纹理特征在0°方向上的分布

图8 外圈故障的最小嵌入维度

图9 内圈故障的最小嵌入维度

图10 滚动元素故障的最小嵌入维度

表1 SAML方法5次实验的最优和平均分类精度%

4.5 与其他流形学习算法比较

为了证明SALTSA算法相比于其他流形学习算法，具有较好的降维效果。采用主成分分析法（PCA）、局部线性嵌入（Local Linear Embedding，LLE）、保局投影（Local Preserving Projection，LPP）、局部切线空间对齐（Local Tangent Space Alignment，LTSA）算法与之进行比较，取相同的最优维度参数m和邻域尺寸ε，比较下列4种情况：Case 1 健康数据、内圈故障、外圈故障、滚动元素故障的分类精度。Case 2 外圈退化程度识别精度。Case 3 内圈退化程度识别精度。Case 4 滚动元素轴承退化程度识别精度。

在4种情况下几种算法的分类精度如表2所示。从表2 中可以看出，SALTSA 算法在故障诊断及轴承退化程度判别方面精度更高。

表2 在4种情况下不同降维方法的分类精度%

4.6 与EEMD特征提取算法进行比较

为了证明SAML方法在故障诊断中的有效性，将该算法与EEMD-energy算法进行比较，通过实验证明了此算法较EEMD-energy算法分类精度更高。

EEMD-energy 方法提取不同频带的5 个IMF 能量值作为特征向量，利用GA-SVM 算法进行模式识别[17]。选择20组数据作为训练样本，80组数据作为测试样本，识别精度如表3，由表3 可以看出EEMD-energy 方法在识别故障类型上比在判别轴承退化程度上有较好的性能。同时通过比较可以看出，SAML方法的分类精度较高，特别在判别轴承退化程度方面优势更加明显。

表3 故障诊断结果比较（分类精度）%

5 结束语

本文针对人工干预的故障检测中需要根据经验手动选择参数而导致算法的通用性和可操作性降低的问题，提出了基于自适应流形学习的故障诊断方法。首先，将振动信号进行EEMD 分解和双谱分析，得到双谱等高线图；其次，用SALTSA 算法对使用纹理分析构造的高维纹理特征矩阵进行降维，得到低维流形结构；最后，用SVM进行分类识别。

实验结果表明，本文提出的方法在缓变故障和突变故障中均适用，不仅能很好地去除噪声，保留有用信息和故障特征信息，而且无论是在故障类型诊断方面，还是在判别轴承退化程度方面都具有较好的分类性能。未来进一步研究如何将本文提出的方法更好地应用在现实场景中。