基于多尺度特征提取的风机音频信号故障诊断方法研究*

2023-02-13 05:58孙启涛罗智孙鲁纳纳

机电工程 2023年1期

关键词：特征提取音频风机

孙启涛,罗智孙,梁好,鲁纳纳

(明阳智慧能源集团股份公司,广东中山 528436)

0 引言

风能作为一种清洁的可再生能源,近几年来发展尤为迅猛。风力发电机组作为将风能转化为电能的重要工具,由于其本身结构的复杂性,发生故障的概率大大增加。

现阶段,风电机组传动链部件故障诊断技术主要是基于振动信号监测原理的方法,基于声音信号的故障诊断应用相对较少。

振动监测传感器需要在被测部件表面放置,对测点位置要求比较高,并且价格昂贵;相对来说,声音信号的诊断方式具有非接触、成本低的优点,是一种经济实惠的信号采集方式,因此,进行基于音频信号的故障诊断研究是非常有意义的。

目前,已有很多基于声音信号的机械故障诊断研究。付国梓等人[1]提出了一种自适应噪声的完全集合经验模态分解方法,改善了集合经验模态分解的模态混叠;为解决传统多尺度熵中粗粒时间序列长度不一致和数据缺失的问题,提出了平滑粗粒化处理的改进多尺度熵,采用该方法可根据齿轮箱运行的声音信号识别出故障。刘少康等人[2]提出了一种改进局部均值分解方法,将音频信号的调频调幅成分分离出来,并根据掩膜信号可抑制模态混叠的特点,采用二分法在幅值加权平均频率的1～1.5倍范围内搜索掩膜信号频率,同时利用掩膜信号与局部均值分解方法多次结合的循环迭代方式,成功抑制了模态混叠现象,并诊断出了齿轮箱复合故障。蒋沁宇[3]针对在强高斯噪声环境下,设备振声信号的频谱特征质量易受影响导致故障分类精度差的问题,研究了基于频谱优化特征和支持向量机的故障分类算法,在基于低阶矩谱故障特征和频谱图的基础上,进一步提取了频谱图局部波动特征;利用区分度和鲁棒性更强的设备故障特征,提高了在低信噪比条件下故障分类的精度。

上述方法在音频信号模式分类领域虽取得了不错的效果,但依然具有一定的局限性。如工程上风机传动链大部件运行时噪音成分比较复杂,进行频谱或包络谱分析时,各类噪音频率混杂在故障特征频率范围附近,不利于故障特征的提取;此外,在噪音音源和频率未知的情况下,使用降噪算法进行降噪,其效果也极难度量,降噪效果太强必然会损失音频中的故障特征信息,反之故障特征频率又易被噪音频率所掩盖。

笔者提出一种基于多尺度特征提取的音频信号故障诊断方法,即从时域、频域和倒谱域等多个尺度对音频信号进行特征提取,得到多维复合特征矩阵后进行一系列数据处理;然后，使用支持向量机分类预估器对其进行分类,并在此基础上使用粒子群算法进行优化;最后，通过实验,对该方法在风机传动链部件音频故障诊断与模式识别上的准确性进行验证。

1 数据采集及预处理

数据是分析工作的基础。在对音频信号数据进行分析前,首先需确保采集到有效的数据。在采集过程中需做到统一标准,以减小各方面因素影响而产生的误差。

音频数据采集系统拓扑图如图1所示。

图1 音频数据采集系统拓扑图

图1中,音频数据采集使用的是拾音器,为单通道采集,采样频率为48 kHz。

选择风机传动链各部件测点,固定好拾音器,拾音器通过适配器连接支持以太网供电的交换机,交换机给拾音器供电,并将各测点拾音器采集的声音信号通过环网交换机传输到工控机,在工控机上使用采集软件对采集信号进行解码压缩并存储,得到一系列mp3文件。采集到风机音频数据后,需要对杂乱的数据进行一系列的数据清洗工作,以便后续的特征提取。

笔者先将音频mp3文件转换为数字信号,为确保采集数据的有效性,对音频数字信号提取均方根、裕度和峭度等时域指标,使用异常检测算法对数据进行清洗,筛除异常数据,只保留有效数据;之后再对有效数据进行预处理。

预处理过程主要包括4个步骤,分别为:预加重、分帧、加窗和转速匹配。其中,预加重处理主要是为了补偿高频分量的损失[4];分帧则是为了更方便地对音频数据进行局部批量处理。分帧时,每帧信号需包含部件至少一个转动周期,且帧移不能超过帧长的二分之一[5]。由于信号的非周期截断,会导致频谱在整个频带内发生严重的拖尾现象,导致非常严重的误差,称为泄漏[6],为了使分帧后的每帧信号依然满足连续性,减少截断效应的影响,需要将每帧数据都乘以一个窗函数,即加窗处理;通过分析矩形窗、汉明窗和汉宁窗3种窗函数的频率响应幅度特性可知,汉明窗的主瓣最宽,旁瓣高度最低,能有效克服音频频域中的泄漏现象,具有更平滑的低通特性[7],因此笔者使用的是汉明窗。

在对音频信号预加重、分帧和加窗后,需要将风机监控数据中的发电机转速信息提取出来,按照采集的各个音频的时间刻度标记每帧数据对应的发电机转速,用于对局部音频信号分析时根据发电机转速筛选对应工况。同时,根据所采集风机对应部件状态是否正常或故障,添加相应的状态标签,以便后续对数据进行分类训练。

2 多尺度特征提取

在音频识别领域,对于音频的特征提取极为重要。根据声音信号的特点,分别从时域、频域、倒谱域等对其进行全方面、多尺度的特征提取,综合进行分析,再对提取的特征进行降维,以便于筛选出有效特征,提升所建模型的分类性能。

2.1 时域特征

2.1.1 短时平均过零率

短时平均过零率是音频时域信号分析中的一种特征参数,其数学意义是每帧信号通过零值的次数。它在区分清音和浊音信号时具有很好的效果:若过零率高,则代表清音,若过零率低,则是浊音[8]。

其计算公式如下:

(1)

式中：yi(n)—分帧后第i帧音频第n个点的信号幅值，m；L—帧长；n—每帧的点序数；sgn—符号函数。

其中，sgn符号函数的定义为：

(2)

式中：x—音频信号的振幅，m。

2.1.2 短时能量

短时能量是音频信号强弱程度的度量参数，代表的是信号幅值的变换[9]。与短时平均过零率一样，短时能量同样可以用于区分清音和浊音，表征每帧信号能量大小随时间的变化，是语音信号的一个重要时域特征。

其计算公式如下：

(3)

式中：E—短时能量，kg/s2；yi(n)—分帧后第i帧音频信号；L—帧长；n—每帧的点序数。

2.2 频域特征

短时功率谱密度是一种频域内信号特征参数,它将时域信号转换到频域,定义为单位频带内的信号功率,直观展示了信号方差与频率的函数关系。因此,可借此分析出信号在哪些频率范围内数据的变化波动较大[10]。

2.3 倒谱域特征

2.3.1 梅尔倒谱系数

梅尔倒谱系数(Mel frequency cepstrum coefficient,MFCC)特征是一种感知频域倒谱系数,它基于人类的听觉机理,在Mel标度频率域中从低频到高频按照临界带宽的大小由密到疏安排一组共H个三角带通滤波器群组[11]。滤波器组的个数和临界带的个数需相近,一般取22～26,文中取H=24。

Mel标度频域中的三角滤波器排列如图2所示。

图2 Mel标度频率域中从密到疏的三角滤波器群组

笔者对输入信号预处理后进行傅里叶变换,然后通过该滤波器群组,并计算每个滤波器组输出的对数能量,再经过离散余弦变换即可求出MFCC系数。

MFCC特征计算公式如下:

(4)

式中：S—Mel滤波器能量，kg/s2；下标i—帧序数；h—Mel滤波器(共有H个)的序数；n—离散余弦变换后的谱线。

由于MFCC特征不依赖于信号的性质,对输入信号不做任何的假设和限制,又利用了听觉模型的研究成果[12]。因此,MFCC特征与基于声道模型的LPCC特征相比具备更强的鲁棒性,并且更加符合人耳的听觉特性,当信噪比较低时仍然具有较强的识别能力[13]。

标准的MFCC倒谱系数只反映了音频信号的静态特性,为了获取更多的信息,笔者对静态特征求差分,得到了其动态特性,通过将动、静态特征结合分析,有效提高对音频信号的识别性能。

2.3.2 线性预测倒谱系数

线性预测倒谱系数(linear prediction cepstrum coe-fficient, LPCC)是线性预测系数在倒谱域的表示,线性预测编码是一种很重要的编码方法。

其原理是:根据音频信号样点间的相关性,使用过去的样本点可预测现在或未来的样本点,即一个音频信号的抽样能用过去若干个音频信号抽样的线性组合来逼近,并通过使实际音频信号抽样值和线性预测抽样值之间的误差在均方准则下达到最小值来求解预测系数[14]。该预测系数同样也反映了音频信号的特征,因此可用于音频的模式识别。

2.4 多维复合特征矩阵

为了提高风机传动链部件音频识别故障的能力,笔者分别提取上述时域、频域、倒谱域3个尺度的特征,并将特征参数组合成复合特征矩阵。

提取音频的短时过零率作为特征矩阵的第1列,短时能量作为第2列,短时功率谱密度作为第3列;使用24个Mel三角滤波器,得到24列MFCC系数,并求其对应的一阶差分参数作为动态特征,最后的MFCC特征共48列,作为复合特征矩阵的第4～51列;LPCC系数矩阵,共48列,作为特征矩阵的第52到99列,加上部件名称和实时发电机转速,多维复合特征矩阵共101列,其中,部件名称和实时转速只用于模型训练前的数据筛选,并不参与模型的训练。

2.5 特征分析及降维

由于基于多尺度特征提取的复合特征矩阵维度较高,必然会造成特征冗余问题。为确定所提取特征的有效性,笔者对各特征进行相关性分析,从而筛选出可区分出机组正常状态和故障状态的有用特征。通过相关性分析,得到4个较为明显能区分机组正常和故障的特征,分别为短时过零率、短时能量、第7列MFCC系数和第10列LPCC系数。

笔者筛选发电机转速在1 700 r/min～1 800 r/min区间范围内的正常机组与故障机组的主轴测点的特征数据。

各特征分布的散点图如图3所示。

图3 正常机组与故障机组各特征散点分布图

由图3中各子图可观察到:正常机组和故障机组提取的部分特征存在一定的差异,并且由图3(d)子图可观察出,正常机组和故障机组的第10列LPCC系数值差异较为明显,侧面验证了笔者所提取特征的有效性。

利用上述特征可实现对正常机组和故障机组的状态划分,为下一步音频信号的数据分类、模式识别提供了可靠依据。

分析出部分正常与故障样本数据差异性较强的特征后,需要对多维特征矩阵降维处理,以去除特征矩阵中的冗余特征。特征降维不仅可以提升分类的性能,还能尽量避免分类过程中的过拟合现象。

特征降维中使用最为广泛的方法是主成分分析法(principal components analysis,PCA),笔者选用PCA法对音频数据特征矩阵进行降维时,设定保留90%的信息,特征矩阵的维度从原有99列经重构后变为25列。

3 PSO-SVM分类预估器

在进行数据预处理、多尺度特征提取、特征降维后,笔者通过下文实验过程对各类分类算法的粗略对比,选用支持向量机对数据进行分类,并建立其模型。基于多尺度特征提取的SVM预测模型即是把风机健康状态问题转化为对相关特征向量的分类问题,通过对风机每帧数据分类,并根据分类的结果最终评估出风机部件的状态。

SVM是机器学习中的一种有监督的学习模型,经常被用于进行模式识别、分类(异常值检测)以及回归分析。由于它具有唯一的全局最优解和出色的学习能力,在解决小样本、非线性、高维化等问题具备优良的性能,并且能满足风机故障特征的随机性、时变性、非线性等特点[15],在模式识别、聚类分析、机械故障预测、信号处理等领域得到了广泛的应用。

SVM进行数据分类的基本思想[16]是:将采集得到的音频信号数据映射到高维特征空间,构造一个超平面对数据进行分割,并在这个高维空间内进行最优化处理,寻找到间隔最大的超平面,从而达到最佳的分类效果。

SVM对于核函数参数的选择非常敏感,为获得适应度更佳的模型,需要对其参数(C,gamma)进行调整优化。C为惩罚系数,定义为对误差的宽容度;gamma为核函数影响系数,表示单个样本对于整个超平面的影响大小[17]。在优化参数C和gamma时,使用粒子群优化算法,寻求最优的粒子点作为SVM的C和gamma。

粒子群(PSO)算法是一种启发式全局搜索算法,它从随机解出发,利用适应度来评价解的质量,通过初始化一群随机粒子,所有粒子具有位置和速度两个属性,每一次迭代过程中,粒子通过粒子本身寻求的最优解和整个种群当前寻找的最优解全局极值进行更新。

基于多尺度特征提取的PSO-SVM音频故障诊断算法流程图,如图4所示。

图4 基于多尺度特征提取的PSO-SVM算法流程图

4 实验及结果分析

为了验证所提改进SVM算法在音频数据分类上的性能,笔者使用上述音频采集系统,对某风场两台2.0 MW双馈式风电机组主轴音频数据进行测量(其中一台为正常,另一台为主轴前轴承重度磨损,视为故障)。

风机主轴测点拾音器安装位置如图5所示。

图5 风机内部主轴前后轴测点拾音器安装位置

图5中,笔者分别在风机主轴前后轴测点安装拾音器,采集主轴音频,结合两测点音频信号进行分析。

拾音器为网络拾音器,采样频率设置为48 000 Hz,尺寸为85 mm×85 mm×24 mm,拾音范围半径为1.5 m,工作环境温度为:-40 ℃～75 ℃,最大可采集声压为120 dB,满足机舱内音频采集的条件。

由于现场风机内部设备安装较为分散,因此文中所使用采集装置在实验室内安装图如图6所示。

图6 实验室内实验装置图

图6中,拾音器固定在被测部件表面,连接转换器,转换器再连接交换机并利用交换机对拾音器供电,同时使用稳压电源对交换机进行供电,交换机主要安装在机舱柜内;利用风机上下通讯光纤将交换机与工控机相连,在工控机上用采集软件进行音频的采集及存储,工控机安装在塔基柜内。

笔者按照上述流程进行预处理、特征提取和转速筛选后,得到多维复合特征矩阵,经降维后对数据集采样,抽取2 000帧数据训练模型。其中,正负样本比例为1 ∶1,训练集与测试集比例为4 ∶1。

笔者首先分别使用现有几种常用机器学习算法—如K近邻(K-nearest neighbors,KNN)、高斯朴素贝叶斯(Gaussian naive Bayes,GNB)、决策树(decisiontree,DT)与随机森林(random forest,RF)进行模型的训练,通过将这几种算法的分类结果与支持向量机分类结果进行粗略对比,以验证SVM分类预估器的性能。其中,SVM还使用了3种核函数进行分类效果对比,分别是线性核(linear kernel,LK)、高斯核(Gaussian kernel,GK)以及多项式核(polynomial kernel,PK)。

为保证对比的公平性,几种算法的参数设置应该统一,即使用不同核函数进行SVM分类时选择相同的惩罚系数C,决策树与随机森林的树深应设置成相同的值。

各类机器学习算法分类性能对比如表1所示。

表1 各类机器学习算法分类性能的粗略对比

由表1的对比结果可知:各类机器学习算法中,在只考虑精度要求时,使用高斯核的支持向量机分类算法训练的模型精度最高,其次是随机森林法。

综合考虑模型的精度和训练所需要的时间,笔者使用高斯核非线性SVM预估器对音频数据进行分类。

使用高斯核非线性SVM分类预估器对测试集400个样本预测结果,如图7所示。

图7 高斯核非线性SVM分类预测效果图

为验证所提取的多尺度复合特征鲁棒性强、不易受其他噪声信号干扰的特点,笔者依然使用上述2 000帧数据,对该数据集添加不同类型的噪声(分别为高斯噪声、椒盐噪声和拉普拉斯噪声),划分数据集后,再使用SVM分类预估器,对加入不同噪声后的数据集进行分类,并对比添加噪声前后的分类情况。

添加不同噪声前后预测结果如表2所示。

表2 添加噪声前后预测精度对比

由表2可知:给复合特征矩阵添加各类不同噪声信号干扰,SVM预估器分类的准确性会有所下降,但依然保持着较高的分类准确性,测试分类误差下降的幅度低于5%。该结果从侧面证实了笔者所提取的特征具备一定鲁棒性,不易受噪音信号的干扰。

为了进一步提升SVM的分类精度,需要对模型进行调参。高斯核SVM需要调整的主要参数有惩罚系数C和核函数系数gamma。在进行参数调优时,由于根据经验选取的参数具有一定的盲目性,使用暴力网格化搜索得到最优解的方法计算所需时间成本又相对较高,因此,笔者选择PSO优化算法进行高斯核SVM预估器参数空间内的迭代寻优。

经PSO优化后与使用其他参数确定方法的对比如表3所示。

表3 不同SVM参数选择方法比较

由表3可知:使用粒子群算法进行SVM的参数优化,相较于使用经验参数的方法,模型分类的精度得到提升,可达到98%;与网格化暴力搜索相比,搜索到全局最优解的时间不足它的一半,在计算精度与计算性能达到了巧妙的平衡,摒弃了SVM参数选择的盲目性,在综合考虑模型分类精度与训练时间的情况下具备一定优势。

不同种群规模寻优性能对比如图8所示。

图8 不同种群规模的粒子群寻优迭代次数与精度关系图

由图8可知:通过设定合理的粒子群参数如种群规模等,寻优速度还能进一步得到提升,当种群规模为100时,迭代次数为17时,便搜索到了全局最优解。相比种群规模为50和150的情况,显然优化性能更好。

为了验证笔者所提基于多尺度特征提取的PSO-SVM风机音频分类方法的泛化性能,除上述两台机组外,笔者再选取从不同风场采集的两台同型号机组的音频主轴测点数据(其中一台为正常机组,另一台主轴有中等点蚀,视为故障机组)。

所选用4台机组中,其中2台故障机组的故障损伤状态如图9所示。

图9 风机传动链主轴部件故障损伤状态图

笔者将所采集的各个机组的音频数据进行前文中预处理、转速筛选、特征提取、特征降维等步骤,得到了机组的特征矩阵,使用其中同个风场采集两台机组数据抽样提取了正、负样本各1 000帧进行模型的训练后,先使用同风场采集的用于模型训练数据集之外的数据进行了模型的准确性校验,再使用从不同风场采集到的正常及故障机组的数据集进行了泛化性能验证,利用改进模型进行了预测,并根据预测结果,对各台机组主轴部件的状态进行了评估。

其中,风机1和风机2为用于模型训练的机组,风机3和风机4为其他风场同型号机组采集数据。健康状态评估的阈值设置在65%,在保证数据量足够的情况下,正常数据占比若大于该阈值,则视为正常,小于该阈值则视为故障[18]。

模型预测效果及健康状态评估结果如表4所示。

表4 模型预测效果及评估

由表4中结果可知:该分类预测模型对几台风机主轴部件的健康状态评估结果与机组实际状态吻合,并且风机2相对于风机4异常数据占比更大,而实际情况中风机2的故障相较于风机4也更为严重。

因此,通过该实验进一步证实了所建分类模型的准确性与泛化性,并且若根据风机分类结果的异常数据占比来进行部件健康状态程度的划分,其结果也具备一定参考性。

5 结束语

在研究基于风机传动链大部件音频信号故障诊断方法过程中,笔者提出了一种基于多尺度特征提取的PSO-SVM故障诊断方法,即在对音频信号进行预处理和数据清洗后,从时域、频域、倒谱域等多尺度进行了特征提取,并利用所提取的特征矩阵,使用PSO-SVM分类预估器建模并对数据进行了分类,实现了风机传动链大部件的故障诊断与状态评估。

笔者通过使用多个风场的多台风机采集的音频数据进行了对照组实验。研究结果表明:

(1)在对风机传动链大部件音频信号进行诊断时,基于PSO-SVM的分类算法具有分类精度高、适应度强的特点,并且具备一定泛化性能;

(2)对音频信号进行多尺度特征提取,使特征矩阵不易受噪声信号干扰,具有鲁棒性强的优点。

在后续的研究工作中,笔者将重点研究各类仿生算法对SVM进行参数空间内的寻优效果,以期获得更快的收敛速度和更好的分类性能,同时需要采集更多的故障样本,并对故障类型进行进一步细分,以实现不同类型故障的精准定位。