鲁 炜,顾安琪,骆昊骏,朱 炜,王火根,文 颖
1(上海电力高压实业有限公司,上海 200062)
2(华东师范大学,上海 200062)
3(上海曦途信息科技有限公司,上海 200437)
随着经济社会发展,人民生活水平提高,全社会对供电可靠性的要求越来越高,政府部门、电力监管机构、媒体网络对电网安全高度关注,对停电事件的容忍度愈发苛刻,电网安全压力进一步加大.运维检修作为电网企业核心业务单元之一,在保障电网设备安全健康、支撑大电网安全运行等方面发挥了重大作用,所以提高电网运维检修高效性和便捷性对电网的安全运行具有重大的意义和价值.输电铁塔上的螺栓由于拆装方便、利于检修等诸多优点,广泛应用于输电铁塔上,其连接的可靠性直接关系到输电线路的安全运行.目前的输电系统例如输电杆塔由于长期处于动态风载荷中,所以容易诱发杆塔组件间的螺栓松动问题,威胁杆塔结构安全.螺栓是输电系统中的重要组成部件,一旦出现故障隐患,将直接威胁高压电网安全,甚至造成难以估量的损失.所以,定期针对于输电杆塔上螺栓的检测尤为重要.目前,输电铁塔螺栓的松动监测主要靠人力攀爬检查,大大限制了运检效率,增加人力时间成本;另有少部分通过视频设备监测方式,该方式不仅经济成本高,而且对处于非可视面的螺栓存在检测盲区.基于上述问题,提出基于振动波的铁塔螺栓松动检测方案,用于高效、快速、可靠的检测输电铁塔螺栓松动情况,进一步的扩展电网运维检修的手段.
提取特征参数是语音识别中的基础,一般根据不同的语音识别任务和不同的特征提取方法,可以获得不同种类的语音特征参数,根据常见的语音识别特征参数提取有:线性预测分析(Linear Prediction Coefficients,LPC)[1]、感知线性预测系数(Perceptual Linear Predictive,PLP)[2]、Tandem 特征[3]和Bottleneck 特征[4]、基于滤波器组的Fbank 特征(Filterbank)[5]、线性预测倒谱系数(Linear Predictive Cepstral Coefficient,LPCC)[6]、梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)[7]等.本文采用的是提取声波信号的线性预测倒谱系数(Linear Predictive Cepstral Coefficient,LPCC),基于声道模型的重要特征参数.通过线性预测分析LPC得到线性预测系数,再通过迭代算法求得LPCC.LPCC 丢弃了信号生成过程中的激励信息,之后用十多个倒谱系数可以代表共振峰的特性,所以可以在语音识别中取得很好的性能.
针对声波特征的分类,一些传统的语音识别模型有矢量量化模型[8]、动态时间规整(DTW)[9]、隐马尔可夫模型(HMM)[10]、人工神经网络模型(ANN)[11]、高斯混合模型(Gaussian Mixture Models)结合隐马尔可夫模型(HMM)得到的GMM-HMM 模型[12]等.随着深度神经网络(Deep Neural Network)[13]崛起,其较强的非线性能力已经远远超过以上传统的语音识别模型,而卷积神经网络(Convolutional Nerual Network,CNN)[14]的出现更能处理一些具有类似网络结构的数据.但前馈网络、CNN、对序列数据只能采用固定长度作为输入,并且他们的信息传递都是单向的,他们的性能比循环神经网路(Recurrent Neural Network,RNN)[15]要差,因为传统模型不理解输入的上下文.但是循环神经网络RNN 无法很好处理远距离依赖问题并会出现梯度爆炸消失的问题,而长短时记忆网络(Long Short-Term Memory,LSTM)[16]网络以及他的变体门控循环控制单元(Gated Recurrent Unit,GRU)[17]网络却可以解决这些问题,并在保持LSTM的效果的同时又使结果更加简单,取得了较为不错的性能.
基于以上分析,本文提出一种基于门控循环单元网络的输电杆塔螺栓紧固检测方法,首先采用振动传感器和传感分析仪对杆塔进行敲击采集数据,通过提取采集的声波数据的LPCC 特征构建特征向量,并训练用于分类的(Gated Recurrent Unit,GRU)模型,进而实现对于螺栓紧固状态的检测.在现有获得数据中,我们通过实验验证了提出方法的有效性和较好的分类性能,并通过与其他分类器进行对别实验,进一步验证了我们提出的方法的检测准确性.
本方法的主要过程由声波预处理、模型训练、螺栓状态检测3个部分组成,如算法流程图1.
在原始声波信号数据采集完成后,为了过滤出采集的声波数据的背景噪声及不相关信息,更利于GRU模型学习对不同状态的螺栓的分辨,本文对原始声波信号数据进行声波预处理;其中预处理方式包括对声波信号进行预加重、分帧、加窗、端点检测等.具体来说,预处理可以消除声门效应和一些辐射的影响,进一步提升声波信号的高频分量,从而使得声波信号的频谱能趋于平坦,并且使得声波频谱在整个从低频到高频的频带中,能够用相同的信噪比来获得频谱,这样有利于进行频谱分析或者声道参数分析,通常预加重操作利用数字滤波器来进行声波信号的滤波处理;在进行预加重后,对声波信号进行分帧、加窗等操作,分帧就是将声波信号分成帧长为N的短时声波帧序列.加窗操作为了有限化数字信号,将声波信号分成若干个短时声波信号,常见的几种窗函数有:矩形窗函数、汉明窗函数、汉宁窗函数,其中,汉明窗相比于前两种窗函数更能反映出声波帧的频谱特性,其频谱具有更平滑的低通特性的同时,能够避免频谱泄露的问题.所以本文采用汉明窗对声波信号进行加窗操作,有效截取声波信号.端点检测的目的是能够区分开声波信号中的静音段和有音段,通过在声波信号中找到起始点和终止点,屏蔽掉无关的声波信号,得到声波信号的有效长度.常用的一些端点检测有:短时能量[18]、短时过零率[19]、双门限能量断电检测算法[20].
图1 算法流程图
将预处理后的声波数据划分为训练样本集合Dtrain和测试样本集合 Dtest,选取训练样本数N=20,用于训练GRU 模型.其中,训练样本有其对应的二分类真值向量,对应其状态为紧固或松动.
针对于训练样本,对声波数据进行特征提取,提取其LPCC 线性预测倒谱系数构成特征向量.对于每一个训练样本提取LPCC 特征,具体分为以下几个步骤:首先对声波频谱进行预加重、分帧、加窗;通过自相关算法分析得到线性预测系数LPC;再通过德宾递推算法求解线性预测系数,最后通过倒谱分析,获得12 阶LPCC 特征向量fi,作为每一个训练样本的最终的特征向量,其中i表示第i个训练样本.其中fi的计算可由Matlab和Python 语音工具箱完成.具体流程如图2所示.
图2 LPCC 特征提取流程
在对声波信号进行预处理之后,进行训练门控循环单元网络(GRU)分类模型.GRU 网络是LSTM 长短时记忆网络的一种变体网络,它能够保存长期序列中的信息,且不会随时间而清除或因为与预测不相关而移除,并且可以克服RNN 无法很好处理远距离依赖的问题,同时也能解决标准 RNN的梯度消失问题,GRU网络在保持了LSTM 效果的同时又使结构更加简单.并且对于非序列数据的输入,GRU 也可以当作分类器,其检测准确率高于一些传统的分类器如SVM、KNN、Naive Bayes、DT 等.如图3所示,首先特征向量fi作为GRU 网络的输入,经过GRU 单元得到输出,再连接全连接层和Softmax 层,最终输出长度为2的向量.
图3 GRU 训练过程
本文对使用的基本的GRU 网络结构定义如下:在一个GRU 单元中,特征向量fi作为GRU 单元的输入,混合前一时间步ht−1∈Rd隐藏状态和当前时间步隐藏状态作为输出,并作为下一阶段的输入,其中d为输出向量维度.GRU 网络主要包括两个门:更新门(update gate)zt和重置门(reset gate)rt.更新门zt是将LSTM 网络中的输入门和遗忘门合并,有助于捕捉时序数据中长期依赖关系,定义了前面记忆保存到当前时刻的信息量.重置门rt决定过去有多少信息被遗忘,有助于捕捉时序数据中短期的依赖关系,决定如何将新的输入信息与前面的记忆相结合.这两个门控向量决定了哪些信息最终能作为门控循环单元的输出,它们的特殊之处在于,能够保存长期序列中的信息,且不会随时间而清除或因为与预测不相关而移除.Wr,Wz,分别对应相应的权重.其中Xt为第t个时间步的输入向量,即输入序列X的第t个分量.为当前时间步候选隐藏状态,ht−1保存的是前一个时间步t−1 隐藏状态,ht为当前时间步最终隐藏状态,GRU 网络的更新状态可由如下公式表示:
式中,[]表示两个向量相连接,*表示矩阵元素相乘.σ表示Sigmoid 函数
门控循环单元不会随时间而清除以前的信息,它会保留相关的信息并传递到下一个单元,因此它利用全部信息而避免了梯度消失问题.
在对GRU 网络结构初始化时,设置GRU 隐藏单元的数量numHiddem=30,分类类别数量numClass=2,特征维数D=24,最大迭代次数maxEpoch=40,批大小miniBatchS ize=512,选择随机梯度下降(SGD)算法进行优化,损失函数选择交叉熵损失.通过迭代过程进行训练;每一次迭代通过前向传播计算交叉熵损失,最小化目标函数,并通过反向传播更新模型参数,最终得到GRU 分类模型.
实验所采集的数据是来自上海电力公司,输电铁塔上测得的数据,现场的3 座输电铁塔上的所有配件及结构与实际输电贴、铁塔相同,具有非常好的实验测试条件.实验首先在铁塔本体上产生标准化的振动,然后检测振动回波,通过对螺栓在紧固时的振动波形和松动时的振动波形对比,识别判断螺栓的松动状态.过程如图4所示.具体测试步骤如下.
图4 声波数据采集过程
1)将振动传感器安装在铁塔的基柱上,距离输电铁塔底座约1 m 处.
2)通过软件调试、频谱校核,确定传感器中心频率参数等.
3)利用回弹仪分别在安装振动传感基柱、相邻基柱和对角基柱各激振一次,所有激振的基柱相对位置相同,记录监测数据.
4)松动安装有传感器基柱的上一固定位置的螺栓1个,利用回弹仪在其他基柱上各激发振动一次,记录监测数据;松动2个螺栓,利用回弹仪在其他基柱上各激发振动一次,记录监测数据;松动基柱斜承处1个螺栓,利用回弹仪在其他基柱上各激发振动一次,记录监测数据.
采集的声波波形数据如图5.可以看到未松动螺栓敲击的波形比较稳定,而松动的波形则有不同的显示,这组特征可以作为训练模型的输入数据进行分析.
图5 样本波形图
此外,实验分析了样本数据直方图,如图6所示.本实验对此特征也进行学习.
实验对每段音频数据提取12 阶LPCC 特征,这些特征作为模型学习样本,训练GRU 模型并对测试样本进行测试.
图6 样本统计图
因此,本文对3 组不同特征进行实验对比,即:波形特征、统计特征和LPCC 特征作为输入,采用GRU深度模型进行训练分析,得出实验结果.
本实验对10个杆塔进行数据采集,每个杆塔4个基柱,每个基柱在紧固和松动螺栓状态下各击10 次,得到紧固和松动声波数据分别为400 组,随机选用600 组数据用作训练模型,200 组数据用于测试,实验测试5 次,取平均结果作为测试结果.通过对上述采集的数据进行训练,对比测试GRU和4 种分类器的性能,具体为:KNN、Naive Bayes、SVM、DT 模型,以及其他4 种网络:DNN、RNN、LSTM 进行比较.实验中采用bootstrap 随机抽样的方法验证相比于其他模型,训练模型的准确性,其中采样次数n=5.实验对比结果如表1所示,可以看到GRU 模型比其他3 种分类器的准确率较高,同时准确率也高于其他4 种网络,而采用LPCC 特征结合GRU的检测结果达到94.54%.
表1 不同模型检测准确率比较
上述实验结果显示采用LPCC+GRU 方法检测效果最后,本实验就此方法对杆塔中不同基柱的测试样本进行检测对比,其结果如表2所示.可以看出,本文所提出的检测方法,检测精度最高可以达到98.43%,最低可到89.39%.表2可以看出,基柱的检测螺栓不论紧固还是松动的检测率最高,相邻基柱的其次,对角基柱的检测率最低,这是因为松动实验的螺栓在基柱上.实验结果显示,无论松动的螺栓在杆塔的任何位置,通过敲击基柱的方法都可以较好地检测螺栓的状态.
表2 不同基柱的螺栓松动检测结果
本文针对输电系统螺栓紧固检测这一问题,实现了一种基于门控循环单元网络的输电杆塔螺栓紧固检测方法.首先,采用振动传感器和传感分析仪对杆塔进行敲击采集数据,然后对数据进行预处理、特征提取自相关算法分析得到线性预测系数LPC,而后经过倒谱分析等获得12 阶线性预测倒谱系数LPCC.最后,训练用于对螺栓紧固状态分类预测的门控循环控制单元网络GRU,对未知状态的螺栓进行紧固与否的检测.实验结果表明,GRU 网络检测准确率高于其他传统的分类器,本文提出的方法可以有效应用在高压输电铁塔螺栓紧固状态检测上.