马文婧,郑欣,鲍克磊,张伟欣
(广东电网有限责任公司广州供电局,广东 广州 511400)
特高频检测与气体检测法广泛应用于带电监测中。该方法具有检测频率高和灵敏度高等优点,然而对于放电缺陷类型识别方面还有一些不足,后者检测结果比较准确,但对于突发情况反应较慢[1-2]。而声音识别由于其易于分类识别、低成本以及快速性广泛应用于生产生活领域,随着电网智能化的发展,越来越多的目光集中到这一领域[3]。
传统的声音识别主要是以高斯混合模型(gaussian mixture model,GMM)为分类器,进行模型训练,完成识别任务,但存在着识别率低以及寻找阶数困难等问题[4-5]。此外基于时频特征的识别受声音幅值以及频率影响较大,针对这种情况,本文使用声音信号语谱图和卷积神经网络相结合的方式来提取声音信号的特征参数[6-7]。生成的网络模型具备处理数据能力强、识别率高以及便于优化等优点。对比文献[8]20、文献[9]56,本文方法能够识别的声音信号更加多样化,同时在准确率上也有所提升[10-11]。
信号特征能反映声音的重要本质参数,而信号又处于非稳态且时变的状态,因而声音信号需要进行预处理,便于提取特征。预处理主要是对声音信号进行预加重、分帧以及加窗处理。
预加重一般通过数字滤波器实现,其传递函数如式(1)所示。
H(z)=1-ωz-1
(1)
式中:ω为常量,取值范围在0.9~1之间;z为原离散信号的Z变换。设原始声音信号为s(n),经预加重后如式(2)所示。
s(n)=s(n)-ωs(n-1)
(2)
式中:ω取0.97;n为离散信号点数。分帧计算公式如式(3)所示。
(3)
式中:LN、LW、LI分别为声音的信号长度、帧长和帧移。本文设置帧长为1 024,帧移为512。通过分帧将长为LN声音信号划分为f个几十毫秒的小段信号,这时可以将其视作稳态信号,采用汉明窗,其窗函数如式(4)所示。
(4)
式中:Whm(n)为汉明窗的窗函数;N为加窗的离散信号点数;LN、LW分别为声音的信号长度和帧长。
相较于矩形窗以及汉宁窗,汉明窗的第一旁瓣衰减较大,频谱泄露较少。加窗实际是用窗函数与分帧后的信号进行相乘。
y(n)=S(n)Whm(n)
(5)
式中:y(n)为加窗处理后的离散信号;S(n)为加窗前的离散信号。
由式(2)、式(3)可知:当n处于0到LW-1范围时,y(n)是分帧信号与窗函数的乘积;当n不处于0到LW-1范围时,y(n)为0,具有低通性质。分帧加窗后的声音信号频率混杂,需要再进一步处理,将每帧声音信号进行快速傅里叶变换,然后转换为各种频率的波形,并用能量表示信号的强弱程度,如式(6)所示。
(6)
式中:P为能量大小;N为FFT取点个数,为512;yi为第i个处理后的信号。
通过对分帧加窗处理的每一帧声音信号进行快速傅里叶变换来得到语谱图。语谱图着重反映了声音信号的动态频谱,能直观体现声音信号在时间轴上的频率以及声音信号能量强度。耐压试验过程中的放电声音信号以及对应的语谱图如图1所示。
图1(a)、图1(c)、图1(e)展示了信号幅值从出现到消失的动态变化情况。图1(b)、图1(d)、图1(f)展示了信号频谱从出现到消失的动态变化情况。坐标点颜色的深浅表示信号能量的大小,颜色越深,表示能量越大,反之,表示能量越低。相较于短时能量特征参数,语谱图能更清晰直观反映声音信号的整体特性[12-13]。
图1 放电声音信号波形以及语谱图动态变化过程
卷积神经网络主要分为卷积层、池化层和全连接层。一个基本的卷积神经网络的结构如图2所示[14]。
图2 卷积神经网络基本结构
卷积网络搭建完成后将语谱图构成的训练集导入输入层,然后对其进行训练,训练后再用测试集检验网络的性能,得出识别准确率。卷积神经网络训练流程图如图3所示。卷积网络训练完成后,可以用于识别,将测试集的数据导入网络模型,得到相应的识别准确率[15]。
图3 卷积神经网络训练流程图
试验声音数据中包含五类不同的声音信号,分别是冲击放电声、球隙放电声、工频放电声、电晕放电声以及空气噪声。其中训练集占70%,测试集占30%。搭建了三个不同结构的卷积神经网络,采用Adam优化函数,结构如图4所示[16]。
图4 不同结构卷积神经网络在线监测流程图
图4中模型a、模型b和模型c在结构上有所不同。三个模型的卷积核大小为3×3,采用2×2最大池化层[17]。三种网络分别进行10次独立训练,每次训练周期为30,得到的测试集准确率曲线如图5和表1所示。
图5 三个不同结构模型测试集准确率曲线
表1 三种网络平均准确率 %
可以看到表1中的训练集平均准确率>94%,然而测试集平均准确率相差较大,表明发生了过拟合现象。为此采用Dropout策略[18-19],在每个模型的全连接层之前加入一个Dropout层,分别构成模型a、模型b、模型c。采用该策略后,再次进行训练和测试,同样采用10次独立训练,每次训练周期30,得到的测试集准确率曲线如图6和表2所示。
图6 Dropout后三个模型测试集准确率曲线
表2 Dropout后三种网络平均准确率 %
可以看到,加入Dropout优化后,三种网络的平均准确率>94%,其中模型c的准确率最高。对模型c的每个声音信号类别进行平均识别率统计,结果如表3所示。从表3可以看到,每个类型的放电声音准确率>0.97%。
表3 模型c各个类别声音信号平均准确率 %
对比文献[8]20与文献[9]56的识别率,如表4所示。可以看出,卷积神经网络相较于文献[8]20自定义判据与文献[9]56中分类器识别率均有所提高,对于准确分析开关设备绝缘状况,进而排除绝缘故障,保障电力系统的安全稳定运行创造了基础条件。
表4 与文献[8]、文献[9]识别率对比
在对放电声音的识别中,本文提出的基于卷积神经网络的识别算法相较于传统的分类器有更高的准确率,并且卷积神经网络更擅长进行多类别的识别,类别划分更为细致。此外卷积神经网络能进行更大量级的数据训练,提取到声音信号更多的特征信息,从而使模型的识别准确率更高。在使用中,可能会发生过度拟合导致的问题。采用Dropout方法可以很好地解决此类问题,使得后续的模型优化更容易,以免模型提取过多的干扰特征,防止模型过拟合现象。