何胜明,刘 剑,胡 捷,李 政,刘豪睿
(1.雅砻江流域水电开发有限公司,四川 成都 610051;2.北京华控智加科技有限公司,北京 100084)
现代水电站越来越多的按照无人值守的原则进行设计和改造,大量引入各级监控系统。传统监控系统采集振动、摆度、温度、电压、电流等信号数据;振动摆度数据反映转子等运动机械部件的状态、摩擦以及转速等;电压电流等数据则反映发电质量[1]。
但是在发电厂房内,仍旧会出现上述传感器所不能监测的异常故障现象。类似水轮发电机组转轮叶片裂纹、转轮室钢板脱落、过流部件空化空蚀和蜗壳门故障等缺陷在机组运行过程中难以用现有的诊断方式进行诊断。由于上述缺陷难以及时发现,且现有的在线监测手段也无法很好地解决这个问题。如果使用声音监测,则可使水电站运维人员更加直观地判断出设备运行状态,缩短故障诊断时间[2]。
基于声音信号的故障诊断技术被应用在多个领域,例如风机故障诊断,发动机故障诊断,放电故障诊断等,并引起了诸多学者的关注。目前,基于声音信号的水轮发电机组故障诊断研究可供参考成果较少,且仍存在一些问题,如:故障源不确定性,噪声复杂且信噪比较低,故障诊断分类器无法实现类别增量学习等[3,4]。Carvalho 针对水轮发电机组的放电声音事件,使用小波包进行降噪处理,在阈值选择等方面获得一定的成果[5]。目前声音处理领域的通用技术流程为:采集声音信号、预处理(重采样和解压缩等)、降噪、提取特征、使用统计分类器或深度学习模型等进行识别[6]。各种时频联合特征分析方法得到了广泛的研究和应用。从短时傅里叶变换到小波变换、维格纳分布等各类时频分布多达几十种。如今时频分析已经得到了许多有价值的成果[7]。辨识模型通常包括以SVM 为代表的传统机器学习算法和深度学习算法。以卷积神经网络为代表的网络模型在大规模图像样本识别中具有更多优点。因此在声学场景分类背景下使用卷积神经网络对频谱图进行分析[8-10]。
本文选取两河口2 号发电机组进行实验研究,全方位采集发电厂房的声音,对采集的声音数据进行RMS、频谱、声谱图(STFT)和深度神经网络分析;建立声纹模型,通过声音对发电厂房健康状况进行监测。使用基于神经网络的声谱图特征分类方法识别水轮机组发电设备的运行状态。因此在声学场景分类背景下使用卷积神经网络对频谱图进行分析[8-10]。
本次试验对两河口2 号水轮发电机组进行42 个测点布置,包括水车室、风洞和尾水门等。声音采集参数为48k 采样率。试验安排时间见表1。分析方法采用有效值趋势分析分析、频谱分析、声谱图分析和基于声纹特征的神经网络模型分析。
表1 试验工况总体说明Tab.1 General description of test conditions
机组甩负荷试验是检验主机和调速器、励磁装置、继电保护及管路等的设计、制造和安装质量最重要的试验项目之一。通过甩负荷试验测量主机的振动、转速上升率、水压上升率、电压上升率以及轴承温度上升等重要指标,来判定机组及其相应的引水管路和水工建筑物的设计、制造、安装是否符合要求。因此,在机组开机试验过程中进行不同负荷的升负荷甩负荷实验,负荷分别为额定功率的25%,50%,75%,具体调整时间表见表2。
表2 升/甩负荷调整时间表Tab.2 Load rejection adjustment schedule
声音采集装置采集信号数据为声压,使用公式(1),对各个测点的声压进行RMS(Root Mean Square)的计算:
式中:x1,x2,…,xn为采样时间内样本点的声压值;n为样本点数量。
图1~4分别为各个测点声压的RMS趋势图。
图1 水车室侧壁测点声音有效值趋势分析图Fig.1 Trend analysis chart of sound RMS of sidewall of waterwheel chamber
图2 尾水进人门测点声音有效值趋势分析图Fig.2 Trend analysis chart of sound RMS of tail water gate
由图1、2可见水车室侧壁和尾水进人门测点的声音有效值在不同负荷工况下有明显的差异,其中未加载负荷状态下声音有效值最大,不同负荷状态下声音有效值处于各自相对稳定的能级上。由图1可见水车室侧壁声音有效值在甩负荷的瞬间出现一个尖脉冲,且脉冲能级和被甩负荷的大小正相关。
由图3、4可见发电机风洞侧壁和定子机座测点声音有效值在不同的负荷状态下基本处于同一个稳定的能级,只有在甩负荷的瞬间出现一个尖脉冲,且脉冲能级和被甩负荷的大小正相关。
图3 发电机风洞侧壁测点声音有效值趋势分析Fig.3 Trend analysis chart of sound RMS of sidewall of generator wind tunnel
图4 定子机座测点声音有效值趋势分析图Fig.4 Trend analysis chart of sound RMS of stator frame
根据上述分析得到如下初步结论:水车室侧壁测点采集到的声音有效值对于机组的负荷和负荷变化具有良好的区别性。尾水进人门测点采集到的声音有效值对于机组的负荷具有区别性,但是对于负荷的瞬间变化不是特别敏感。发电机风洞侧壁和定子机座测点采集到的声音有效值对于机组的甩负荷具有良好的指示性,但是对于负荷稳定状态和升负荷没有区分性。
针对上述声音有效值趋势分析的结果,重点分析水车室侧壁测点的声音数据。对该测点的各种工作负荷状态所采集的数据进行傅里叶变换,得到频谱图。
图5为50%和75%负荷状态声音信号的波形图,所示频谱图中,该负荷下存在较稳定的400 Hz 及800 Hz。同时参考图1有效值趋势图可以看出,随着负荷增加,测点声音信号幅值开始逐步下降,甩负荷后幅值迅速增加。通过上述分析,得到如下的初步结论:在机组升负荷时,测点声音信号的波形图幅值会较为平缓的下降至一定的水平;当机组甩负荷时,机组测点声音信号波形图幅值通常会急剧增加至一定水平,原因是在甩负荷时刻随着水轮机组的负载突然减小,转速则突然增加,随后被控制到额定转速。
图5 水车室侧壁不同负荷状态声音信号波和形频谱图Fig.5 Time domain wave and spectrogram of the sound signal of the waterwheel sidewall under different loading states
通过对机组的信号频谱观察,由于不同负荷其频谱较接近,因此较难对负荷状态进行判断。此时需要借助声谱图进行辅助分析。
声谱图是基于短时傅里叶变换(STFT)计算得到的数据分析,使用公式(2)进行计算。其中通过窗函数w(n-m)对信号序列x(m)实现在m附近的开窗和平移,同时进行傅里叶变换。跟随m的变化,窗函数在时间轴上移动,使得时间序列进入”逐段”的分析状态。为了抑制频谱泄露带来的不利影响,通常会选择在时域加窗,常见的窗函数有矩形窗、Hanning 和Hamming等,本次数据处理选取Hamming 窗。声谱图中同时包含了声音能量在时间和频率两个维度上的细微变化。
通过观察声谱图,图6中可以看到,以75%负荷为例,升∕甩负荷前后其能量变化更为明显。此时需要借助神经网络方法对这种能量变化做出判断。
图6 75%升/甩负荷时段的波形图、声谱图和频域分析图Fig.6 Waveform,spectrogram and frequency domain analysis of the 75% load rejection period
目前流行的深度学习算法有卷积神经网络(CNN)、循环神经网络(RNN)、受限玻尔兹曼机(RBM)和自动编码器算法。选取CNN进行模型训练,网络输入层为短时傅里叶变换得到的声谱图。
对声谱图样本标注的状态为无负荷状态、25%负荷、50%负荷、75%负荷4 种工况。整个神经网络经过多次卷积和池化后得到一个固定维度的特征向量,称之为Embedding层特征,亦称为声纹特征。将声纹特征接入一个聚类模型或者softmax 层实现分类,该分类对应4种工况。
(1)输入二维图像。采用以二维卷积层为主要结构的神经网络结构,输入层接收一个二维图像作为模型输入。短时傅里叶变换(STFT)计算过程如图7所示。
图7 短时傅里叶变换计算示意图Fig.7 Schematic diagram of short-time Fourier transform
图7中利用短时傅里叶变换制作声谱图有两个重要的控制参数,帧长(图中的2n_fft)和帧移(图中的hop_size)。不同的帧长和帧移产生的声谱图差异很大,尤其是帧长的选择。
当采用较小的帧长时,声谱图具有很高的时间分辨率,但是频率分辨率低,在声谱图呈现为频率轴方向的竖条纹;当采用较大的帧长时,声谱图具有很高的频率分辨率,但是时间分辨率低,在声谱图呈现为频率轴方向的横条纹。在人声声纹识别领域研究人员根据人声发声机理的研究成果通常采用20~25 ms 的帧长制作语谱图。对于本方案要研究的机器声纹领域,同样需要根据机器的发声特点选择合适的帧长。
通过短时傅里叶变换得到的声谱图纵坐标是频率,单位为Hz。由于本方案采集的声音数据采样率很高,通常得到的频率维度的维数很高。以48 kHz 采样,帧长100 ms 为例,一帧采样点数为4 800,最高分析频率为24 kHz,得到的频率维度为2 048维。帧移选择256,帧数选择128,即构成了图7(c)中的红框部分,该红框部分为一个神经网络输入的一个测试样本。
上述算法实现需实验分析的谱图制作方法及需要试验选取的参数包括:帧长、帧移和帧数(时间context)。
(2)深度神经网络搭建。深度卷积网络设计需要考虑模型的层数、每层卷积核的尺寸、每层卷积核的个数等参数。深度卷积模型结构见表3。
表3 深度卷积模型结构参数表Tab.3 Structure parameters of depth convolution model
表3中c表示输出通道数,n表示重复次数,s表示步长。网络结构单元由Depthwise Conv、Piontwise Conv、Inverted residual block和Linear GD Conv组成。
(3)Embedding(声纹特征)。上述步骤的目的是得到Embedding,Embedding 就是用一个低维的向量表达一个高维数据的特征,也就是本方案中的声纹特征。在深度神经网络中,除最后一层非线性映射函数SoftMax,其余所有层对输入矩阵的操作都可以看作将高维空间中的样本点通过变换和映射投影的方式,或丢弃一部分无用信息(权重小的维度),或去除线性相关项,在尽可能保持原有信息的情况下投影到另一个空间,通常会让高维空间的点映射到低维空间,映射后的点通过SoftMax 或其他非线性映射函数输出分类结果。若移除SoftMax层,那么最后一层Linear Convolution 的输出的128 维向量可视为原始数据在低维空间的投影,这个128 维的向量就是模型提取的Embedding特征。因本次数据提取的是声音信号中蕴含的细微特征,故称之为声纹特征。
(4)输出类别。输出为4 类,分别对应不同的负荷工况,标签采用one-hot 编码方式进行编码。分类的类别由不同的负荷工况决定,由于采用经典的SoftMax 交叉熵损失函数,模型的分类训练将迅速收敛,而得到的Embedding 特征对多工况的状态的特异性表达不足。因此采用Large-Margin SoftMax,驱使不同类别的Embedding 在特征空间具有更大的距离,而同类别的Embedding 具有更小的距离,最终达到Embedding 表达和特异性状态特征的强相关。
图8为本测试训练得到的深度神经网络工况分析测试结果(以25%负荷为例)。一共测试了约6 000 条不同负荷时段的样本。对每一个样本进行类别打分,每个样本对4 种工况计算得到4个分数,分数越高表示属于该类别的概率越高,通常取最高分数对应的类别作为最终的分类结果。图中横坐标为样本编号,纵坐标为打分分数。其中的蓝色曲线表示的是测试样本所属类别(属于25%负荷工况)得到的打分分数,红色曲线为测试样本归属其他类别(属于其他负荷工况)得到的打分分数的最高分。由图8可见本试验训练的模型对工况分类的正确率达到了100%。
图8 深度神经网络工况分类测试结果Fig.8 Classification test results of deep neural network
尾水泄露试验通过采集正常声音信号和模拟打开尾水门进行。图9、图10中,通过声音信号的原始波形、频谱图和声谱图可以看到,两个状态下频率以及能量是有区分的。为了更准确判断事故状态,使用深度神经网络模型对正常状态样本和泄露状态样本分类。图11中横坐标为样本编号,纵坐标为打分分数。其中的蓝色曲线表示的是泄露时测试样本所属类别得到的打分分数,黄色曲线为泄露测试样本所属其他类别得到的打分分数。由图可见本试验训练的模型对泄露声音的正确率达到了100%。
图9 测点38C泄露试验波形对比Fig.9 Comparison of waveforms of leakage test at measuring point 38C
图10 测点38C泄露试验声谱图对比Fig.10 Comparison of spectrum of leakage test at measuring point 38C
图11 深度神经网络事故识别测试结果Fig.11 Classification test results of deep neural network
通过采集升负荷甩负荷等试验工况状态中声音信号,对波形、频谱、有效值、声谱图进行分析,得到不同工况声音的特征具有可分性的结论。试验用深度神经网络对声谱图进行分类,结果显示模型可完全实现不同负荷工况的分类。
(1)声音信号对于不同负荷工况状态具有良好的可分性。利用深度神经网络的细微特征提取能力,试验结果显示声谱图可以完全实现对不同负荷工况状态的正确分类。
(2)模拟尾水门泄露实验无法利用传统的信号处理方法进行识别。利用深度神经网络的细微特征提取能力对测点采集的数据进行分析,得到完全正确的分类结果。
上述结果只针对本次试验采集的数据,由于实际运行过程涉及更复杂的工况参数变化,本实验结论需要进一步认证。利用分类模型进行很好的负荷工况分类,只能说明良好标注分类模型的有效性,对于无标注工况的异常检测需要进一步研究和分析。