基于声纹识别的换流阀工况检测技术研究

2023-10-27 09:36何志甘陈光焰吕小伟朱亦斌
设备管理与维修 2023年18期
关键词:声纹梅尔频域

何志甘,陈光焰,吕小伟,林 石,朱亦斌

(国网福建省电力有限公司超高压分公司,福建福州 350003)

0 引言

受设备绝缘老化、机械部件松动、绕组变形、过热、内部放电等各种外界因素的干扰,在长时间使用之后换流阀极易产生故障。传统的故障诊断方法主要是通过人耳聆听换流阀的运行声音,以针对故障的具体类型、位置进行判断[1]。然而,这种方法本身主观性较强,且存在模糊性、局限性的特点,对于一些细微的声音来说则需要依靠一定的经验与知识积累[2]。正是因为换流阀面临的故障主要集中在内部,声纹识别就成为工况检测研究的主要方向。

1 换流阀声纹采集及处理

换流阀的数据主要是采用专业的声纹采集设备进行采集,获取声纹语料。完成数据采集之后,需要针对这些声纹数据进行预处理[3]。首先,针对换流阀音频实施分段处理,为有效保障输入音频均为完全统一的时间信息,需要针对相关的时长进行严格的限制。针对采集的数据进行切分处理[4]。因为换流阀声纹数据属于一系列离散点模式,其中每个点分别对应一个采样点,所以声纹数据对应的长度等于时间与fssample的乘积。其中fssample属于音频对应的采样频率。

针对完成分段的变压器音频来说,还需要进行分帧操作。帧作为声纹信号处理当中最小的一种单位,本身具有非常短的时间,同时也涉及非常多的声音特点。通常认为声纹信号在长时间内表现为多变性特征,在短时间内表现为不变性,即便是在非常短的时间内,都能将声音特征视作完全固定的。根据上述思维模式,针对换流阀当中的声纹数据实施切分。本文主要是将帧长设置为50 ms,步长设置为1/3 或1/2 的帧长。相较于语音声纹来说,换流阀声纹产生的变化相对较少。所以,主要选择将帧长设置为500 ms,步长设置为1/2 帧长。

针对分帧以后的换流阀音频实施加窗处理。通过分帧处理以后,尽管能够在一定程度上减少处理的数据量,但也会在一定程度上影响声纹信号。因此,后期还必须要针对分帧数据实施端点平滑加窗处理,选择Hamming 窗对帧实施处理:

其中M 为帧长。

2 变压器声纹特征提取

2.1 能量特征

根据图1 所示的时域谱线,获取时间、波形振幅的联系。由于瞬时波形对应的振幅直接对应数据瞬时能量,相应的振幅频率越大,对应的能量自然也就更高。从图1 能够看出,上述数据产生的峰值共计2 次,研究以后证明上述两个峰值位置产生了摩擦的声音[5]。尽管能量特征提取可以有效展现偏好的能量杂音位置,然而其并不能针对声音异常进行判断,也就不能针对杂音的详细位置进行检测,因此还需要选择其他方案进行研究。

图1 换流阀部分声音时域谱线

2.2 频率特征

为进一步掌握换流阀声音波形对应的振动特点,通常可以认为任何一段声音均能够划分为一系列不同周期与对应幅度的三角函数叠加。可以选择一系列三角函数对应频率与幅度来针对特征进行表现,且上述对应与时间没有关联,但与频率存在联系,所以可以与时域谱对应称之为频域。对于两者的转换来说,可以选择Fourier Transform 进行转换:

其中,f(t)属于时域周期函数,F(ω)属于处理之后的频域函数。图1 基于上述公式转换之后,得到图2 所示的频域波形。

图2 转换后的频域波形

2.3 梅尔系数

梅尔频率能够针对人耳所具有的听觉特征进行模仿,尤其处在低频范围内的增长速率较高[6]。但对于高频范围来说,整体增长速度则相对较为缓慢。频率与梅尔频率对应的关系如下:

对于梅尔频率所进行的转换与特征提取来说,常规是选择梅尔滤波器组来完成,当中包含一串根据梅尔频率转换关系进行设计的三角滤波器,当中单个滤波器都具有完全相同的带宽,具体公式如下:

其中,fh代表最高频,fl代表最低频。

基于4000 Hz 内的标准,选择24 个梅尔滤波器组,500 ms帧长的情况下对应的梅尔频率系数见图3。

图3 梅尔频率系数

针对数据进行处理,选择离散余弦变换(Discrete Cosine Transform,DCT)处理之后,获取MFCC(Mel Frequency Cepstrum Coefficient,梅尔频率倒谱系数):

其中,n=1,2,…,L。

2.4 频率压缩处理

尽管梅尔系数能够充分发挥降维的作用,同时在高频领域能够获得理想的压缩效果,但其本身仍旧暴露出低频分辨率欠缺的问题。针对上述问题,还需要持续增加低频分辨率情况下的基于梅尔频率“分辨率从高到低变化”的理念,选择较为相似的频率压缩方案,具体流程如下:

(1)针对声纹信息进行划分,分别纳入高、中、低对应的频段。

(2)结合3 种频段特征,分别选择针对性的频率压缩比例进行处理。

(3)对于压缩取值来说,选择最大值策略方案,即选择单个压缩区间最大值作为最终的压缩处理结果。

3 声纹相似度检测算法

假设声纹采集器获取的换流阀工况信息属于从稳定的声纹到不稳定的瞬时杂音叠加状态,忽视当中潜在的互相干扰问题[7]。在此基础上进行以下假设,推进声纹相似度检测算法。

假设1:假设一段音频需要在绝大多数时间保持相似的情况,不稳定信号相对较少,同时与稳定信号之间存在差异性。

假设2:这个过程中持续产生杂音,当对应的频率高于帧采样频率的情况下,就能够认作该信号稳定。

假设3:发生的不稳定信号属于瞬时发生的信号,抑或是在短时间内持续产生的信号或间隔大的信号。

对于假设1 提出的问题,选择余弦相似度来针对音频当中各个特征向量相似度进行计算。结合欧几里得向量点积公式进行计算:

当θ 属于向量A 与B 在空间当中的夹角,能够获得向量A=[A1,A2,……,AN]与B=[B1,B2,……,BN]相似度如下:

因此,结合上述研究将一段音频进行分离处理(包含稳定部分、不稳定部分),相似度置换算法如下:

换流阀声纹相似度置换算法:

K=选取向量数量

N=置换向量位置,一般为K/2

M=重复次数

4 结束语

综上所述,基于声纹识别的换流阀工况检测技术能够解决传统检测方案存在的不客观、检测模式等问题,通过获取声纹信息,同时针对声纹信息进行预处理,能够将处理后的声纹信息转化为频域信号来提出对应的特征,最终通过朴素贝叶斯完成声纹相似度检测,保障换流阀工况检测判断的科学性、准确性。

猜你喜欢
声纹梅尔频域
大型起重船在规则波中的频域响应分析
基于梅尔频谱分离和LSCNet的声学场景分类方法
梅尔维尔鲸
女诗人梅尔诗集《十二背后》三人谈
屏幕即指纹识别
“熊”视眈眈
频域稀疏毫米波人体安检成像处理和快速成像稀疏阵列设计
基于改进Radon-Wigner变换的目标和拖曳式诱饵频域分离
基于频域伸缩的改进DFT算法
基于数字水印的人脸与声纹融合识别算法