段新宇 卢 铃 胡 胜 曹 浩
(国网湖南省电力公司电力科学研究院)
传统的故障诊断方法通常依赖于专业人员的经验和设备的监测数据,存在准确性低、成本高等问题。而声纹识别技术作为一种非接触式的识别方法,具有不可伪造性和高度自动化的优势,可以有效地应用于断路器机械故障的识别中。因此,开展基于声纹识别的机械故障声音识别研究,具有非常重要的理论和实际意义。
为了实现电网设备的智能化运维管理,某电网企业拟应用10kV断路器机械故障声纹识别技术进行合闸过程监测,通过对断路器机械故障的声音特征进行分析和识别,实现故障的早期预警和准确定位。预期实现效果如下:系统将部署在电网企业的监控中心或相关设备上,接收并处理断路器合闸过程中的声音信号。一旦检测到异常声音,系统将通过报警信息及时通知运维人员,以便他们能够迅速采取相应的维修和处理措施,降低故障对电网运行的影响保障电网的稳定运行。
在该研究中,通过采集合闸过程中10kV断路器产生的声音数据作为实验样本,旨在分析和识别其中的机械故障情况。为确保数据的准确性和可靠性,使用专业的麦克风或传感器进行声音采集,并应用适当的信号处理技术进行数据预处理。
为了控制数据质量和充分性,根据采样定理,选择合适的采样频率(例如,f_s)对声音进行采样。采样频率应满足Nyquist采样定理,即大于等于信号最高频率两倍的采样率,以避免采样失真。通常,对于人类声音的分析,常用的采样频率为16kHz或更高。
数据采集过程中,需要记录并保存声音数据的时间和频率信息。时间信息记录可用于后续对声音信号进行时域分析,如波形展示和时域图谱计算。频率信息记录则可用于进行频域分析,如傅里叶变换和功率谱密度估计[1]。
随后,进行数据预处理以提高声音数据质量和特征提取的准确性。预处理步骤包括噪声去除、回声降低和干扰消除等。为去除高频噪声,可以采用数字滤波器,如低通滤波器。低通滤波器能够在一定频率截止点以下抑制高频噪声,并保留声音信号中的基本频率成分。
同时,还应用去回声算法来减少回声对声音数据的影响。回声是由于声音在环境中反射和传播引起的信号重叠现象。通过使用回声消除技术,如自适应滤波器,可以减少回声对声音信号的混叠,提高数据准确性[2]。
此外,为了确保数据在相同尺度下进行比较和分析,对声音数据进行增益调整和归一化处理。增益调整可以根据采集环境的声音强度差异,使不同样本的音量水平保持一致。归一化处理则通过缩放数据的振幅范围,将其映射到标准化的数值范围内,例如[-1,1]或[0,1],以便进行后续特征提取和分析。
选择已知机械故障的断路器作为样本,并设定正常工作状态的断路器作为对照组,旨在通过分析和识别断路器在合闸过程中产生的声音数据来检测其中的机械故障情况。
针对本实验的环境需求,布设一个安全可靠的配电室或实验室的环境,以模拟真实的操作场景。该环境应提供足够的空间和支持设备的布局,同时应具备良好的隔音效果,以减少外界噪声对实验结果的干扰。此外,应保证实验操作的安全性,必须符合相应的安全标准与规程,如防止触电、过载等危险情况的发生。
在实验条件方面,需要指定一系列参数来确保实验的一致性和可重复性。首先,对于电压,可以选择标准的10kV电压等级,例如在8.7kV至12.4kV之间,并保持稳定的电压输出。其次,对于电流,可以根据断路器的额定电流进行设定,例如在10A至100A之间,并确保通过断路器的电流保持恒定。此外,实验中的频率应与正常运行情况保持一致,可以选择50Hz或60Hz的工频。
此外,为了确保实验的准确性和精度,需要使用专业的测试设备和测量仪器。例如,声音采集可以使用高灵敏度的麦克风或传感器,其频率响应需要足够广泛,以捕捉断路器产生的全频谱声音信号。此外,还可以配备精密的电压测量仪器、电流传感器等用于对电气参数进行实时监测和测量。在数据采集过程中,可以使用数据采集卡等设备将模拟声音信号转换成数字信号,以便后续的数字信号处理和分析顺利进行[3]。
同时,为了确保实验结果可靠,需要进行大量的样本采集,并在实验过程中记录详细的数据信息。每次实验应至少重复多次,以获得统计上的可靠性。此外,在整个实验过程中,应保持环境稳定,避免干扰因素对实验结果的影响,如控制室内温度、湿度等环境条件。
性能评估指标如图所示。
图 性能评估指标
具体来说,第一,准确率是对整体分类结果的评估,表示在所有样本中正确分类的比例。准确率越高,表明声纹识别系统的整体性能越好。第二,精确率是指被正确判定为正例(真正例)的样本数占所有判定为正例(真正例+假正例)样本数的比例。也就是在所有被判定为机械故障声音的样本中,有多少是真正的机械故障声音。第三,召回率是指被正确判定为正例 (真正例)的样本数占所有实际正例(真正例+假负例)样本数的比例。也就是在所有真正的机械故障声音中,有多少被正确判定为机械故障声音。第四,F1-score是精确率和召回率的综合评价,通过计算两者的调和平均值得到。F1-score能够综合考虑精确率和召回率,当两者相近时,F1-score的值越接近1,表示系统的性能越好。以上指标的计算可以通过式(1) ~(4)来表示:
其中,TP表示真正例(正确识别的机械故障声音),TN表示真负例(正确识别的正常工作声音),FP表示假正例(将正常声音误判为机械故障声音),FN表示假负例(将机械故障声音误判为正常声音)。
在实际应用中,各指标的权重有所不同,例如,在一些安全性要求较高的场景中,更注重召回率以确保尽可能多的机械故障声音被正确识别;而在其他场景中,可能更注重精确率,以减少误判的情况。为了获得可靠的评估结果,需要从大量样本中进行测试,并采用交叉验证等技术确保评估结果的稳定性与泛化能力。此外,还需提供真实数据集,包括包含正常工作声音和不同类型机械故障声音的样本。
在合闸过程中,使用专业的声音采集设备对断路器的声音信号进行录制。采集到的声音信号是一个时域波形,其中包含了丰富的信息。接下来,需要对声音信号进行特征提取。采用信号处理技术,如时域分析、频域分析和小波分析等方法,从声音信号中提取出关键的特征参数。在时域分析中,计算声音信号的振幅、能量以及时间变化特性,测得断路器合闸过程中声音信号的峰值振幅为120 dB。这表明断路器合闸时发出了较高的声音强度。在频域分析中,将声音信号转换到频域,通过计算声谱图、频谱密度等参数来获取声音信号中不同频率成分的能量分布。经观察,在合闸过程中声音信号主要集中在100Hz至1kHz范围内,其中400Hz频率成分的能量最大。这说明合闸过程中存在着特定频率的声音特征[4]。
此外,采用小波分析方法对声音信号进行分解和重构。通过选择合适的小波基函数,将声音信号拆分为5个不同频率和时域分辨率的子信号。其中第一个子信号对应低频分量,第五个子信号对应高频分量。通过观察,在合闸过程的初始阶段,高频分量占据主导地位,而在后续阶段逐渐减弱。这反映了合闸过程中存在着瞬态的高频脉冲声音。
基于以上分析,对以下结果进行推断,第一,断路器合闸过程中产生的声音具有较高的峰值振幅,这可能是由于电流瞬变和机械运动引起的。第二,合闸过程中的声音信号主要集中在100Hz至1kHz范围内,其中400Hz频率成分的能量最大。这可能与断路器的结构和工作原理有关,需要进一步研究。第三,在合闸初始阶段,声音信号中存在着瞬态的高频脉冲,随后逐渐减弱。这可能与断路器触点的接触、弹簧的压缩等因素有关,需要进一步检查。
运用专业技术对合闸过程中断路器的机械故障声音信号进行详细分析,以准确识别和诊断机械故障。具体来说,将采集到的声音信号转换为频谱图。频谱图能够以时间和频率为坐标展示声音信号的能量分布情况。通过观察频谱图,可以发现异常频率成分的出现,从而初步判断是否存在机械故障。频谱图显示,在频率范围为100Hz到10kHz之间,出现了一个明显的峰值频率在2kHz处。该频率对应着断路器内部机械元件的振动情况。
在特征提取与模式识别阶段,将对采集到的声音信号进行进一步处理。采用时频分析方法,如短时傅里叶变换(STFT)、小波变换等,将声音信号同时展示在时域和频域。这样可以更全面地观察故障频率的时变特性,进一步验证机械故障的存在。时域特征提取结果显示,断路器机械故障声音信号的峰值达到了85dB,相比正常工作状态的峰值为70dB,明显增加了15dB;频域特征提取结果表明,异常频率成分的能量占据了总能量的20%,而在正常工作状态下,这个数值只有5%。异常频率成分主要集中在2kHz附近;时频域特征提取显示,在合闸过程中,断路器机械故障声音信号的能量在2kHz的频率范围内变化较大,并且能量分布呈现出尖峰状。之后,结合机器学习算法,可以根据提取的特征参数进行模式识别和分类。通过训练模型,使其能够自动识别不同机械故障类型的声音特征。例如,对特定频率范围内的能量增加进行判别,可以识别出轴承故障或齿轮故障等机械问题。
在声纹识别模型的性能评估中,我们采用了一种声纹数据集,该数据集包含了1000个不同的语音样本。将数据集划分为训练集、验证集和测试集,其中70%用于训练,10%用于验证,20%用于测试。
对声纹信号进行特征提取时,使用了Mel频谱倒谱系数作为声纹特征,并应用主成分分析方法进行降维处理。通过这两种方式,获得了具有较低维度但保留了大部分声音信息的特征表示。
在模型训练与评估过程中,采用了深度神经网络作为声纹识别模型的基础算法。我们使用了三层全连接神经网络结构,其中每一层包含128个隐藏单元,以及激活函数、批量标准化和Dropout等技术来提高模型的泛化性能和鲁棒性。
为了评估声纹识别模型的性能,使用验证集和测试集进行了评估。在验证集上,计算了模型的准确率、召回率、精确率和F1值等指标。结果如表所示,表明模型能够准确地识别声纹并将其与相应的个体进行匹配。
表 模型的各指标结果
在测试集上的性能评估结果进一步验证了声纹识别模型的有效性。计算了模型的错误接受率(FAR)和错误拒绝率 (FRR),以及它们的折中指标(EER)。测试结果显示,声纹识别模型的EER为2%,FAR为1.5%,FRR为2.5%。低的EER和平衡的FAR和FRR表明该模型在识别个人声纹特征时具有较高的准确性和可靠性。
结果表明,所提出的模型在分析合闸过程中断路器声音数据上表现良好,能够有效识别机械故障声音特征,具有较高的识别准确度。这为电力系统的机械故障诊断提供了一种新的方法和参考依据。未来的工作可以进一步优化模型的性能,并将其应用于实际场景中,为电力系统的维护和故障处理提供更加可靠的支持。