基于BFD和MSCNN的风电滚动轴承智能故障诊断

2021-06-10 00:25邓敏强邓艾东史曜炜马天霆

东南大学学报（自然科学版） 2021年3期

邓敏强邓艾东朱静史曜炜马天霆，3

(1东南大学能源与环境学院，南京 210096)(2东南大学火电机组振动国家工程研究中心，南京 210096)(3 国华太仓发电有限公司，苏州 215000)

滚动轴承作为风电传动链的关键零部件[1]，其健康状态的准确识别对提高风电机组运行的安全性与经济性意义重大[2].受时变风况的影响，风电机组常处于变速变载荷条件下运行[3].针对变工况下滚动轴承的故障诊断问题，国内外学者开展了大量的研究工作[4].其中，以振动信号分析为基础的诊断方法受到了广泛关注,其主要根据包络谱中的故障特征频率实现滚动轴承健康状态的有效识别[5].然而，该方法一定程度上依赖专家经验，难以实现设备故障的自动诊断[6].

随着机器学习和人工智能技术的发展，数据驱动的旋转机械智能故障诊断受到了越来越多的重视.唐贵基等[7]建立了一种基于快速谱相关和粒子群优化支持向量机的故障诊断模型，赵小强等[8]提出一种基于改进AlexNet的滚动轴承变工况故障诊断方法，施杰等[9]提出了一种变分模态分解与深度迁移想结合的诊断方法.已有的研究成果主要以特征参数、原始时域波形和傅里叶谱等为特征量，其易受转速、载荷等运行条件的影响，一定程度上降低了模型在不同工况下的泛化能力.因此，已有的智能诊断方法在模型构建过程中都需要有标签或无标签训练样本覆盖完整的运行工况.然而，受现场采集条件的限制，难以获得覆盖全工况的训练样本.因此，仅根据部分工况下的数据构建适用于全工况的智能诊断模型有待深入研究.

针对该问题，本文从包络阶次谱(EOS)智能识别的角度出发，提出了一种基于带宽傅里叶分解(BFD)和多尺度卷积神经网络(MSCNN)的风电滚动轴承故障诊断方法.BFD根据傅里叶谱能量分布将原始信号分解为窄带的带宽模态函数(BMFs)，能有效地从振动信号中分离出包含故障特征的窄带分量[10].然后，提出了一种希尔伯特阶次变换(HOT)算法并将其应用于BMF的包络阶次谱计算.最后，根据特征阶次比选择分解结果中包含故障信息最多的有效分量，并通过MSCNN学习其包络阶次谱与故障类别之间的映射关系以实现滚动轴承健康状态的自动识别.实验结果表明，本文所提方法以BFD分解结果有效分量的包络阶次谱作为故障识别的特征量，可有效提高模型的泛化能力，降低了对样本量的要求，能准确识别出变工况下滚动轴承的健康状态.

1 算法原理

1.1 带宽傅里叶分解

假设时域信号x(t)是定义在区间[a,b]上的能量有限信号，BFD的目标是将时域信号x(t)通过傅里叶变换转换成频域信号X(ω)后，在频域内将其自适应分解为K个稀疏的以{ωk}为中心的窄带子信号{Uk(ω)}，然后通过傅里叶逆变换将{Uk(ω)}转换为带宽模态函数{uk(t)}.在BFD算法中，子信号的稀疏性和窄带性通过对总带宽的优化实现，其构造的约束性优化问题为[11]

L0({Uk(ω)},{ωk})=

(1)

采用拉格朗日乘数法将式(1)中的约束性优化问题转换为如下无约束性求极值问题：

L1({Uk(ω)},{ωk})=

(2)

通过对式(2)求鞍点即可得到Uk(ω)的解析式：

(3)

将式(3)代入式(2),原始优化问题L0({Uk(ω)},{ωk})可简化为中心频率ωk的搜索问题L′1({ωk})：

(4)

其中

(5)

通过对L1({Uk(ω)},{ωk})求鞍点可得中心频率ωk满足的隐式方程：

(6)

式(6)迭代计算至其收敛后，对{Uk(ω)}求傅里叶逆变换即可得到时域信号x(t)的BFD分解结果{uk(t)}.

由式(1)中构造的优化问题可知，中心频率的数量K对BFD的分解结果有较大的影响.K过小会导致信号的欠分解，从而出现模态混叠现象，K过大可能会导致特征信息被分解在2个或以上的BMF之中，从而降低算法的特征提取能力.因此，BFD算法中心频率数量K的确定方法如下：

①令K=2.

②对原始信号x(t)进行BFD运算.

④令K=K+1，执行步骤②.

其中，步骤③通过BMF中心频率的分布判断BFD是否出现过度分解.在BFD算法中μ取0.1，即2个相邻的BMF叠加为一个分量后仍满足窄带信号的条件时，算法出现过度分解.

1.2 希尔伯特阶次变换

传统的阶次分析以角域重采样为基础，然而该方法需要大量的插值运算，一定程度上增加了计算难度.本文在希尔伯特变换的基础上提出了希尔伯特阶次变换算法，可通过积分运算直接计算出窄带分量的包络阶次谱，有效降低了计算的复杂性.

假设有一调频信号y(t)，其解析式为

(7)

式中，A为幅值；ω1(t)为角频率；fr(t)为时变转频;o1为特征阶次.其阶次谱计算式为

(8)

式中，T为时间长度.文献[12]的研究验证了下式的正确性：

(9)

则式(8)可进一步简化为

(10)

式(10)表明，根据式(8)计算得到的阶次谱在特征阶次o1处存在一条突出的谱线，即该算法能有效应用于特征阶次的检测.因此，对于任意窄带信号x(t)，其包络阶次谱F(o)的计算式可写为

(11)

式中，xe(t)为信号x(t)的包络函数，根据希尔伯特变换得

(12)

1.3 多尺度卷积神经网络

与传统机器学习算法相比，深度学习模型能更有效地从高维复杂输入中自动提取特征.卷积神经网络(CNN)是应用最广泛的深度学习模型之一，通过卷积、池化等操作提取原始数据的特征，并通过权连接层输出模型的计算结果.其中，卷积核的大小在一定程度上影响着特征提取的效果和模型的故障识别能力.MSCNN是一种改进的卷积神经网络，通过不同大小的卷积核从多尺度挖掘特征信息，有效解决了传统CNN模型卷积核的自适应选择问题[13].在本文所提方法中，模型输入为包络阶次谱，其阶次范围为0～50，阶次分辨率为0.05，输入特征的维度为1 000，输出的类别数为4.图1给出了本文构建的MSCNN模型网络结构，其参数设置如表1所示.

图1 MSCNN网络结构图

表1 MSCNN网络参数

首先，考虑到转速测量误差导致的阶次偏差，MSCNN通过池化层提取池化范围内的最大值以降低阶次偏差对故障识别的影响；然后，利用不同大小的卷积核从多尺度提取池化输出的特征，并对其进行线性加权；最后，通过全连接层和Softmax激活函数计算模型输入属于不同类别的概率，并根据最大概率对设备健康状态进行分类.该模型的正向传播过程如下：

(13)

式中，x为模型输入；pc为分类器输出的类别概率；pool(·)表示池化操作，其输出为y；⊗为卷积运算，其通过ci线性加权后的输出为z；Wi和bi分别为不同尺度的卷积核及其偏置；W为权连接矩阵；f(·)为偏置是bi的Softmax激活函数.

2 故障诊断方法

变工况下风电滚动轴承的故障特征不仅受强背景噪声的干扰，而且受到转速、扭矩等时变运行参数的影响.本文通过信号分解技术从原始数据中分离出包含故障信息的单分量信号，并通过包络阶次分析降低变工况对故障特征的影响，最后通过MSCNN自动识别设备的健康状态，具体的方法步骤如下：

①提取包络阶次谱.通过BFD算法将原始振动信号分解为窄带的BMF，并通过希尔伯特阶次变换计算各BMF的包络阶次谱.

②有效分量选择.信号分解后仅部分BMF中包含相对较多的故障信息.参考文献[10]的研究结果，本文根据特征阶次比(COR)挑选出分解结果中包含故障信息最多的有效分量，其计算式为

(14)

式中，F为BMF的包络阶次谱，其阶次范围为0～oend；M为特征阶次的最大倍数，本文取3.由式(14)可知，COR反映了阶次谱中最突出阶次的比例，本文取COR最大的BMF作为分解结果的有效分量，并将其包络阶次谱作为MSCNN模型的输入.

③模型训练.将部分工况下的数据作为训练样本，构建智能诊断模型.

④模型测试.对未知工况下的测试样本，通过BFD算法和阶次分析提取包络阶次谱，并通过训练好的MSCNN自动识别设备健康状态.

3 实验验证

3.1 数据集

实验数据采用国外公开数据集，以模拟风电传动链高速端滚动轴承的运行工况.

数据集Ⅰ是美国凯斯西储大学轴承数据中心提供的滚动轴承振动加速度数据，其实验台如图2(a)示，主要由驱动电机、扭矩传感器、编码器和测力计等部件组成.本文使用的实验数据采集自电机驱动端的6205-2RS-JEM SKF型深沟球滚动轴承，信号采样频率为12 kHz，其故障特征阶次如表2所示.数据集Ⅰ包括4种健康状态，分别为正常、内圈故障、外圈故障和滚动体故障，其信号时域波形如图3(a)所示.为模拟不同的运行工况，实验分别在4种工况下进行：①转速1 797 r/min,负载0；②转速1 772 r/min,负载0.75 kW；③转速1 750 r/min,负载 1.49 kW；④转速1 730 r/min,负载2.24 kW.表3给出了数据集Ⅰ的样本分布，其中信号的时间长度为0.5 s，每种工况下各类别的样本数为117，总样本数为1 872.

数据集Ⅱ是加拿大渥太华大学提供的滚动轴承振动加速度数据，其实验台如图2(b)所示.测试轴承的型号为ER16K，数据集主要包括正常、内圈故障和外圈故障3种类别的振动信号，其故障特征阶次如表2所示.实验在匀变速工况下进行，转速的变化范围为900～1 620 r/min，信号的采样频率为200 kHz.数据集Ⅱ的样本分布如表3所示，其中信号的时间长度为0.5 s，每种工况下各类别的样本数为60，总样本数为720.

(a) 数据集Ⅰ实验台

(b) 数据集Ⅱ实验台

表2 滚动轴承故障特征阶次

表3 数据集样本

3.2 对比方法

用于对比的故障诊断方法主要包括以下5种：

1)本文所提方法，即将BFD分解结果中有效分量的包络阶次谱作为模型输入，以MSCNN为分类器；将该方法记为BFD-MSCNN.

2)将原始信号的包络阶次谱作为MSCNN的输入，以验证BFD算法提取原始信号中有效分量的必要性；将该方法记为EOS-MSCNN.

3)将原始振动信号作为模型输入，通过多核残差卷积神经网络(ResCNN)构建诊断模型[14]；将该方法记为waveform-ResCNN.

4)将振动信号的傅里叶谱作为模型输入，通过多注意力一维卷积神经网络(MACNN) 构建诊断模型[15]；将该方法记为spectrum-MACNN.

5)将振动信号的特征参数作为模型输入，以支持向量机(SVM)为分类器.将该方法记为featureSVM.

其中，本文方法和EOS-MSCNN方法中无超参数优化；waveform-ResCNN、spectrum-MACNN和feature-SVM方法分别以原始时域信号、傅里叶谱及特征参数为模型输入，以验证本文所提方法中以BFD分解结果的包络阶次谱作为故障识别特征量的优越性.waveform-ResCNN和spectrum-MACNN方法中振动信号的时间长度取0.5 s，神经网络的结构可参阅文献[14-15]；feature-SVM方法中提取的特征参数主要包括6个时域特征(均方根、峭度、偏度、波形因子、峰值因子和标准差)、5个频域特征(中心频率、均方频率、均方根频率、频率方差、频谱散度)和4个时频特征(包络阶次谱中旋转阶次和故障特征阶次处的幅值)，SVM的超参数通过贝叶斯优化算法搜索最优值.

3.3 实验结果

3.3.1 故障信号分析

以数据集Ⅱ中内圈故障为例，说明本文所提方法中BFD算法和HOT算法在故障特征提取方面的有效性.图3(a)和(b)分别给了BFD分解结果的波形图和包络阶次谱.由图3(b)可知，BMF5～BMF9的包络阶次谱中能清楚地观察到内圈故障特征阶次(5.45)及其倍数，即本文所采用的信号处理方法能有效地提取出原始信号中的故障特征.表4给出了各BMF特征阶次比的计算结果.由表可知，BMF9的特征阶次比高于其他分量，即BMF9的故障特征相对较突出.因此，取BMF9为有效分量，并将其包络阶次谱作为MSCNN的输入.

(a) 时域波形

表4 分解结果的特征阶次比

3.3.2 全工况交叉验证

在智能故障诊断研究中，通常将不同工况下的历史数据随机划分为训练集和测试集以验证模型的有效性.图4给出了各诊断方法10次三折交叉验证的平均准确率.由图可知，本文所提出的BFD-MSCNN方法、EOS-MSCNN、waveform-ResCNN和spectrum-MACNN的测试准确率都超过99%，即深度学习模型能有效挖掘并学习故障信息，实现设备健康状态的准确识别.以特征参数为模型输入的feature-SVM方法准确率约为95%，略低于其他方法，表明该方法对故障信息的表征与识别能力略低于其他4种方法.图4中结果还表明，训练样本覆盖全工况的情况下，有监督深度学习和机器学习模型的故障识别效果均比较理想.

图4 三折交叉验证准确率

3.3.3 变工况故障识别

实际应用中往往难以获得覆盖完整运行工况的故障样本，有限的训练数据对模型在变工况场景下的泛化能力提出了更高的要求.如表5所示，本文依据训练样本所属工况的不同，将数据集Ⅰ和数据集Ⅱ分别划分为4个诊断任务，每个诊断任务中训练样本与测试样本均采集自不同的工况.

表5 诊断任务设置

表6和表7分别给出了数据集Ⅰ和数据集Ⅱ的测试准确率.由表可知，在训练样本所属工况与测试样本完全不同的情况下，BFD-MSCNN仍然有97%以上的平均准确率，即本文所提方法仅根据部分工况下的监测数据即可准确地识别出设备在其他工况下的健康状态.EOS-MSCNN的测试准确率明显低于BFD-MSCNN，验证了基于BFD的信号分解与有效分量选择对故障识别的有效性.waveform-ResCNN、spectrum-MACNN和feature-SVM在数据集Ⅰ和数据集Ⅱ上的平均准确率低于EOS-MSCNN，验证了本文所提方法中以包络阶次谱为故障识别特征量的优越性.

表6 数据集Ⅰ测试准确率

表7 数据集Ⅱ测试准确率

3.3.4 小样本分析

图5给出了本文所提方法在变工况故障识别中的平均准确率随各类别样本数的变化趋势.由图可知，BFD-MSCNN仅需10个以上类别的训练样本即可获得95%以上的测试准确率，即该方法能有效地应用于小样本情况下的故障诊断.

图5 BFD-MSCNN测试准确率随样本数变化趋势

3.3.5 特征可视化分析

为进一步分析本文所提方法的有效性和优越性，取数据集Ⅰ变工况故障识别中的诊断任务A进行特征可视化分析，其结果如图6所示.其中，前4种方法采用文献[14]的研究思路，取神经网络最后一层的输入，通过T-SNE进行特征分布分析.由图6(a)可知，在本文所提BFD-MSCNN方法中，同类别样本的特征聚集性较好，不同类别的样本特征混淆较小，具有较强的可识别性；此外，训练样本与测试数据的分布较接近，即该方法具有较强的跨工况泛化能力.由图6(b)～(e)可知，EOS-MSCNN和feature-SVM方法出现了一定程度的特征混淆，waveform-ResCNN和spectrum-MACNN方法中训练样本和测试数据的特征分布存在较大的差异，一定程度上降低了故障识别能力.图6(f)给出了小样本分析的特征可视化结果，其中各类别的样本数为10.图6(f)中同类别特征的聚集性和不同类别样本的可识别性进一步验证了本文所提方法在小样本识别中的有效性.

(a) BFD-MSCNN

(d) spectrum-MACNN

4 结论

1)本文所提方法仅根据部分工况下的训练数据即可准确识别变转速滚动轴承的健康状态，其平均准确率达到97%以上.

2)本文所提方法对训练样本的依赖性较小，在小样本情况下也有较高的识别率，仅需10个以上类别训练样本即可获得95%以上的测试准确率.

3)通过BFD信号分解提取振动信号的有效分量，并从包络阶次谱自动识别的角度构建智能诊断模型，有效降低了变工况对故障特征的影响，也降低了模型对样本的依赖.