基于声纹的高泛化性风机叶片异常检测方法研究

2021-10-13 04:51:38邹宜金连应华黄新宇刘培王颖蕊
电子科技大学学报 2021年5期
关键词:语谱直方图音频

邹宜金,连应华,黄新宇,刘培,王颖蕊

(福建华电可门发电有限公司 福州 350512)

当前,风力发电正以极快的速度发展,但由于风电机组大多安装在高山、荒野、海滩、海岛等相对恶劣的环境中,容易出现故障,维修起来耗费大量人力物力。

在风力发电机组中,叶片作为整个风电机组最前端的捕风机构,造价约占整机的20%左右。从叶片本身看其复合材料结构决定了其运行期间自身状态的复杂性;从运行环境看,风机叶片是整个机组暴露在外部环境中长期运行的最大部件,风沙、盐雾、紫外线、雷电等都会对叶片造成一定的损伤;从功能发挥上看,作为捕风机构的叶片在运行过程中要承受各种风况施加的多变震、弯曲、扭转的交替应力变化[1]。在以上因素的影响下,随着运行时间的推移将导致叶片发生破损、开裂乃至断裂等质量问题,这些问题无论从影响程度还是维修成本上都居高不下。由于叶片的维修和更换,相对其他设备更为复杂,耗时更长,所以叶片故障引起的停机时长,在机组总故障中的比例高达34%[2],因此对风电机组叶片工作状况进行异常检测非常必要。有效的风机叶片异常检测能提高生产率,减少运维成本支出,增强作业安全性。

1 相关工作

在风机故障检测领域,已发展基于声发射[3-4]、振动分析[5-7]、光纤光栅[8]、红外热成像[9]等多种原理的检测技术。考虑到实际情况,能符合检测效率实时、非接触式且便于安装要求的有SCADA 数据分析和声学检测两类方法。

SCADA 数据分析[10-11]是对SCADA 传感器数据进行分析,采用聚类或者趋势预测对风机叶片可能发生的异常进行分类判定。此类方法传感器数据汇总属性数据维度过高,采样频率较低,相关属性分析模糊,工况对数据影响大,模型准确度受限。

声学检测方法主要实现手段有:

1)传统数值统计分析,对波形进行时域频域分析,依赖其均方根值、峰值水平、峭度、斜度、波峰因数和其他数值特点进行风机叶片是否异常的判定。该方法是比较早期的研究方案,在实际运用中难以得到满意的结果。

2)非线性和非稳态的分析[12],采用小波变换或者希尔伯特−黄变换得到故障特征频率变化的特征。不过,输入信号复杂度高,采用小波变换也没有从根本上解决任意变频的问题,没有切合风机是一个线性系统的非定常响应问题。

3)普通机器学习采用分类方法、回归方法、神经网络、支持向量机、决策树、随机森林等[13]。这需要大量故障风机叶片的信号样本,但实际中风机叶片的故障类型、受损程度与部位不同都将导致叶片故障数据收集不全面,从而影响所建模型的准确度。此类方法,如果换个场景和风机,模型的准确度会存在问题。

实际应用中风场位置不同、风机类型各异、故障类型众多、背景环境多变等因素复杂交错。上述基于规则和特征的手段都面临非线性表征能力弱,泛化能力不强,识别率不高的问题,所以无法满足实际工程需要。基于深度学习的方法,受限于数据采集的规模难以实现,和实现过程中易过拟合及调参难的通病,难以泛化,故障诊断的可迁移性存在问题。同时,信号复杂度高、数据不均衡、数据收集困难也是解决风机故障监测必须直面的问题。

2 方法的设计

2.1 模型思考和设计

通过项目研究,发现风机实际运行中,由于叶片旋转具有周期性,采集叶片声音传感器位置在叶轮迎风侧正下方,故叶片扫风的声音信号也具有周期性。所以,可以利用受损叶片和正常叶片的周期性和差异性特点进行高效准确的异常检测。

区别于目前基于大量数据样本的智能诊断算法,不需要采集大量的数据信息,不需要建立诊断识别的模型,仅依靠单台风机3 个叶片之间的参考和对比就可以诊断该台风机是否故障,操作流程简单,诊断精度也较高;从算法角度,减少了计算量,提出基于聚类和中值收敛的周期性音频切割方法,对声纹进行有效的切割,为增强声纹变化的鲁棒性问题提供基础。

本文具体方法的设计如图1 所示。

图1 本方法实现示意图

2.1.1 原始音频预处理

声音采集器工作在复杂的室外,采集到的音频信号一般包含大量噪声,如鸟叫、风声、人声和其他风机造成的噪声等。目前,风机的启动条件一般为平均风速不小于3.5m/s,声音传感器采集的信号必然包含风噪,且相比其他背景噪声,风噪影响较大。风噪的频谱能量集中在350Hz 以下的低频区域,需要滤波器将低频的风噪滤除。

2.1.2 计算音频信号语谱图

声音信号的特征提取是核心步骤之一,提取到有效、可靠的特征能提高结果的准确性和有效性,降低处理的复杂度。经过实验语谱图能很好的表征风机叶片的音频特征。

2.1.3 语谱图切割

对语谱图峰图和峰图之间的间隔进行识别,实现精准的音频分割,得到分割的坐标。值得一提的是,虽然采用了声纹分割聚类[14]这个名字,但是其含义不是传统语音中的识别说话人数量和归属,是识别不同风机叶片扫风音频和扫风间隔音频。

不采用实时转速情况下,叶片周期的声纹切割算法有以下两种:

1)波峰波谷峰值计算。正常纯净扫风音频,可以使用该办法,但是在实际风场中,经常有无规律间隔叠加能量的干扰,且风机3 个叶片的功率强度轴也可能不同,导致相邻叶片的波峰波谷有较大的震荡区间,对峰值检测的精度和准度带来挑战。少识别的波峰,会导致错周期切割,直接影响后续的叠加算法。

2)深度学习。采用一维卷积神经网络或者其他模型,标注峰值区域进行特征学习,需要大量采集数据,还需要手工标注不少数据,模型也需要提前训练,工程实现较为冗杂。

本文采用聚类方法对中高维语谱图矩阵进行聚类,得到扫风声和安静声的标签序列,接着用中值收敛调整修正该标签序列,能精确得到安静音频到扫风音频阶跃的坐标点。这种设计不仅能无参数动态分割,还有较强的鲁棒性和泛化性。

具体实现如下:

2)对语谱图的中高维度进行截取,将降维后的矩阵输入K_means 两类聚类算法。

3)得到聚类的0,1 标签序列。K_means 聚类后的效果不错,得到扫风声和安静声的标签序列,能大体划分出扫风周期,不过由于信号复杂度高,K_means 聚类对异常值敏感,还是存在毛刺和缺失。需要对标签序列的毛刺和尖峰进行过滤。

4)接着进入收敛修正聚类标签操作,至此,可以得到分割点序列坐标。

2.1.4 叶片平均语谱图和均衡增强

透明度叠加,生成风机每个叶片平均语谱图。用分割的坐标将长矩阵切割成t个矩阵Ti(0

Tcol1,Tcol2,Tcol3为叶片音频的平均语谱图画像的矩阵表示,其叠加效果的热图如图2 所示。

图2 透明度叠加前后音频语谱图热图对比

风力微弱情形下,语谱图中有用数据的对比度会比较接近,采用直方图均衡算法[15]进行处理,通过这种方法,亮度可以更好地在直方图上分布。文献[16]提出了灰度直方图均衡化算法。由于彩色RGB 图片,有3 个通道,不能简单为每个通道应用灰度直方图均衡化算法,然后组合起来。非线性直方图均衡是非线性过程,均衡每个通道的做法会得到失真度非常大的结果。均衡涉及图像的强度值,而不是颜色分量,因此,需要将RGB 格式转为不干扰图像颜色平衡,均衡亮度值的YCbCr 格式。在强度平面上执行灰度直方图均衡化操作,然后再把YCbCr 格式转回RGB 格式。

2.1.5 相似度计算

(4) 模块配置.根据具体需求结合配置规则库,检索出符合设计要求的模块,并对模块进行组合、替换,完成设备模块配置方案.配置规则库的建立需要对企业长期积累的设计经验进行归纳总计.

采用图片化的SSIM(structural similarity)值来计算3 个特征矩阵热图图片相似度。结构相似性作为结构相似性理论的实现,结构相似度指数从图像组成的角度将结构信息定义为独立于亮度、对比度的,反映场景中物体结构的属性,并将失真建模为亮度、对比度和结构3 个不同因素的组合。采用均值作为亮度的估计,标准差作为对比度的估计,协方差作为结构相似程度的度量。

文献[17]提出了SSIM 值计算方法。3 个特征矩阵热图图片两者之间比较得到3 个SSIM 值,接着采用这3 个结果值进行统计和判断异常。

2.1.6 统计和告警

SSIM 值在连续6 分钟内,如果相似度都一致,而且大于阈值k(0

3 实验与结果分析

3.1 输入样本构造集

以山风场和海风场采集的故障和正常风机叶片声信号作为原始数据集,配置为单通道,44100 采样率,采样频率区间为0~12kHz,选择不同特性和背景风机的声信号作为原始数据集,如表1所示。

表1 原始数据集来源

图3 是不同音频频谱图表征。

图3 不同风机叶片扫风音频频谱图

第一组是正常叶片纯净扫风音频,第二组是叠加鸟鸣正常扫风音频,第三组是扫风微弱音频,第四组是叠加敲击声音频,第五组是风噪比较大的音频。

对原始音频进行样本重构得到数据集。重构方法主要有以下3 种:

1)由于风机是包含转速(3~17r/min)所以,采用拉伸和收缩处理得到不同转速下音频。

2)采用语音合成,对周期进行中途变化或者叠加背景噪声。

3)对音频进行软件数据增强处理。

通过样本重构,共得到200 组2000min 的音频样本。其中,异常组占40 组,异常组占比20%。

3.2 模型结果分析

样本输入模型后,输出结果如下:

异常识别的Recall 为0.975,Precision 为0.929,具体值如图4 所示,该结果与参数选择密切相关。

图4 模型识别结果

3.3 参数选择

3.3.1 声纹切割算法的表现

声纹切割算法的前提是聚类成功,由于聚类算法对异常值敏感,在音频受到严重干扰,转速过慢(伴随聚类中心点贴近问题)和转速过快(异常值敏感度加大)的音频切割准度下降。如图5 所示,但在正常转速情况下,切割算法的精度足够。

图5 切割算法在叶片不同转速下的精度

3.3.2 相似度方法选择

相似度方法有余弦相似度、均值哈希相似度、差值哈希相似度、感知哈希算法相似度、三直方图相似度、单通道直方图相似度及SSIM 结构相似度。设一组标签为相似度高的语谱图,与一组标签为相似度低的语谱图,输入不同相似度计算方法,其结果如图6 所示。差值明显的方法为比较适合的相似度方法。

图6 不同相似度算法效果

SSIM 相似度方法在相似度高和相似度低情况下,有比较大的差值,能比较好地表征叶片频谱图相似度。

4 结束语

本方法的独特性在于解决了声音异常检测的可行性和可泛化性。

1)异常检测的可行性:抛弃了主流的寻找异常声音特性和正常声音特性的方法。重新归纳定义了异常的概念:某个叶片只要和其他两个叶片声音特性不一致就标记异常。不依赖输入的大数据样本,不需要提前训练,易于部署和工程实践,从声音到图像的转变也使得异常检测有可靠和成熟的量化标准。

2)异常检测的可泛化性:能迁移,具有时间上和空间上的可泛化性。

研究工作的不足之处总结为以下两点:

1)只对风机叶片的异常检测进行检测和提示,没有进行具体异常的分类,比如哨音明显、叶片前缘异常、叶片后缘异常、叶片开裂等。

2)未进行合适的风机运行状态识别,未识别导致变桨、偏航、关机过程、停机过程等风机操作控制期间,识别失效的问题。

猜你喜欢
语谱直方图音频
统计频率分布直方图的备考全攻略
高中数理化(2024年1期)2024-03-02 17:52:40
符合差分隐私的流数据统计直方图发布
HR-DCGAN方法的帕金森声纹样本扩充及识别研究
用直方图控制画面影调
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
基于Daubechies(dbN)的飞行器音频特征提取
电子制作(2018年19期)2018-11-14 02:37:08
基于时频域特征的场景音频研究
语谱图二次傅里叶变换特定人二字汉语词汇识别
音频分析仪中低失真音频信号的发生方法
电子制作(2017年9期)2017-04-17 03:00:46
Pro Tools音频剪辑及修正
人间(2015年8期)2016-01-09 13:12:42