福建水口发电集团有限公司 李芳芳
作为大规模开发利用的可再生能源,水电在国家基础建设中受到高度重视。近年来,随着大型水利枢纽工程的兴建以及大中型水电厂的相继建成投产,水电装机容量越来越大,水电机组在电网中除了送出电能外,还承担着调峰、调频、调相和事故备用等作用。
水轮机作为水电机组的重要组成部件,其稳定性关乎水电站的安全生产。水轮机的过流部件和转动设备由于长期在水下运转,容易发生碰磨故障,如未能及时发现此类故障,极易造成顶盖漏水甚至水淹厂房的事故。但早期的碰磨故障特征难以在水、机、电以及噪声信号掺杂耦合的环境中提取出来,给水电机组稳定运行造成隐患[1]。鉴于这类故障的严重性,亟须一种可靠、高效的故障预警识别方法,提升水电站应急处置能力和安全运行水平。
水电机组不同运行工况产生的声音频谱特征就像人的指纹,不仅具有特定性,而且具有相对稳定性。本文针对水电站水轮机特定碰撞故障,提出一种水电厂水轮机碰撞故障声音识别方法与系统,满足水电厂安全稳定生产需求。
由于水电厂现场环境的复杂性,部署机组设备运行状态监测系统往往存在施工难度高、维护难度大等问题。基于经济性、可扩展性的需求,本文系统采用分层设计模式,将系统分为三层,包括数据感知层、网络传输层、应用管理层,系统分层结构图如图1所示。
2.1.1 数据感知层
部署在现场的前端采集设备采用双向通信方式,感知外界环境的声音信息通过网络进行传输,同时响应上层指令进行相应动作;本文在水电站机组水车室内安装具有声音信号处理能力的拾音设备,通过设置特定的频率与相关参数,采集水轮发电机组的声音样本。
2.1.2 网络传输层
通过有线接入方式接入水电站现有的通信网络,基于TCP/IP协议,确保数据传输可靠性与稳定性,实现系统网络的互联互通。
2.1.3 应用管理层
分析处理前端收集的数据和信息,生成水轮机故障声音诊断模型,为故障应急处置提供相关依据;构建应用管理操作平台,实现前端设备管理、用户信息管理、实时监听现场机组运行声音、告警信息黑白名单纠偏、声音信号回听等功能。
2.2.1 边缘计算
本文系统采用具有声音采集和数据处理功能的拾音器作为前端采集设备,基于边缘计算分布模式,将声音数据预处理转移至前端设备进行,再将预处理结果通过网络传输至后端进行分析处理,不仅可以节省传输网络带宽成本,同时还能减小网络拥堵,降低后端服务器出现单点故障的可能,具有延时低、响应速度快、安全性能高等特点。
2.2.2 拾音器硬件设计
对水电厂应急处置效率与系统整体性能进行考量,采用基于边缘计算的运算模式,对前端具有数据处理能力的拾音器性能提出了较高的要求。
本文拾音器采用nanopi2 h5芯片,内置64位四核处理器与六核GPU,集成512M DDR3主存,支持运行Ubuntu等嵌入式操作系统;在网络方面,支持接入百兆与千兆以太网;具有体积小、功耗低、算力高、低延时等特点,广泛适用于对设备体积要求高、数据吞吐量大、传输速度快的高性能应用。
基于上述特性,系统使用超六类网络屏蔽线,将部署在前端的拾音器接入到通信网络中,实现声音信号的高速采集与数据的高效处理,再将预处理的结果通过网络传送至后端,实现对水电站设备异常运行声音的实时监测与分析,具有低时延、响应快等优点,当监测到设备异常声时,可迅速发出警报,保障数据可靠性与高效性。
本文系统由音频采集单元、人工标记单元、预处理单元、卷积神经网络训练单元、端上识别与存储单元、人工纠偏单元、报警单元组成。系统总体流程如图3所示。通过拾音器采集水轮机的正常运行声音和故障碰撞声音,并预处理成语谱图样本集,利用样本集对卷积神经网络进行训练,得到能够识别故障碰撞声音的故障识别模型,通过故障识别模型对水轮机的实时转动声音进行实时监测,实现通过故障碰撞声音识别水轮机是否发生故障碰撞。系统设置有人工纠偏单元,通过人工介入提高系统的鲁棒性,能够根据纠偏结果进一步对故障识别模型进行优化,提高识别的准确性。
在水轮机故障碰撞故障音频识别过程中,不仅包含需要提取的故障信息,还存在干扰信息及环境噪声。为了更加有效提取水轮机碰撞故障音频数据信息,需要预先对采集的声音信息进行特征提取,从而结合深度学习神经网络,进行更加高效的模型训练。
语谱图可以实现将声音信号转换为能够动态展示时间和频谱变化关系的二维图像,以可视化方式展示频率与能量强度组成的空间特征信息,以及随时间变化的时序特征信息[2]。根据相关人员的研究成果,将MFCC特征、LPMCC特征及语谱图的相关识别能力进行比较,语谱图在泛化性、鲁棒性、实用性、识别率方面有较好的综合表现[3],所以本文在预处理单元采用语谱图对采集的声音数据进行特征提取。
预处理单元主要对水轮机正常运行声音和故障碰撞声音进行预处理,获取正常运行声音的语谱图和故障碰撞声音的语谱图作为深度神经网络的样本集。基于语谱图的预处理单元流程图如图4所示。
首先,分别对正常运行声音和故障碰撞声音进行分帧处理,设置每帧的数据长度为N,分帧步长为N/M,即重叠率为(M-1)/M进行数据分帧。本文中取N=1024,分帧步长为512,重叠率为50%进行数据分帧,对3600s时长的原始声音数据划分为16000×3600/512-1=112499帧数据。利用汉宁窗对每帧数据进行加窗处理,窗的长度为N=1024,数字形式如下式所示:
对加窗处理后的每个窗中的数据进行短时傅里叶变换(short-time Fourier transform,STFT),得到短时幅度谱估计值。傅里叶变换的数字形式如下式所示,其中xi(n)表示为每个帧经过加窗后的数据,k∈[0,N-1],m表示帧序号,N=1024。
对每帧短时幅度谱估计值|X(m,k)|取对数值,得到具有一一对应关系的语谱图,语谱图横坐标为时间,纵坐标为频率,每个窗格的颜色深浅表示相对应时间与频率处的能量值。
卷积神经网络(Convolutional Neural Network,CNN)属于一种前馈型深度学习模型,是由一个或多个卷积层与其他分类神经网络构成。卷积神经网络通过训练算法不断对每一层神经元对应的权重进行迭代更新,具有局部特征提取、区域共享权值以及数据池化等特点,相较于其他类型的神经网络,卷积神经网络计算所需的网络数更少,特征量提取更准确[4],所以本文采用卷积神经网络进行水轮机故障声音模型识别训练。
卷积神经网络的基本结构包括输入层、卷积层、池化层、全连接层和输出层。输入层主要用于输入经过预处理后的数据;卷积层使用卷积核与输入数据进行卷积计算,用于提取特征量,池化层对卷积层输出的特征进行池化处理,用于压缩数据和减少计算量,避免过拟合,卷积层和池化层交替分布可进一步提炼更高一级的特征;全连接层接收前端网络传递的特征向量,计算网络输出,再传递给输出层;输出层根据网络模型的目的进行设置,通常为一个多分类器[5]。
卷积神经网络训练单元用于搭建卷积神经网络,并将预处理后的样本集输入至卷积神经网络对其进行训练,得到故障识别模型。本单元主要包括样本划分模块、训练模块和测试模块。样本划分模块用于将样本集按照一定的比例划分为训练集和测试集。训练模块用于将训练集中的正常运行声音的语谱图和故障碰撞声音的语谱图,输入至卷积升降网络中进行训练,训练过程中使用损失函数调整卷积神经网络的参数。测试模块用于通过测试集对卷积神经网络的识别结果进行验证,当卷积神经网络的识别准确率达到目标值时,结束训练,保存当前参数,得到故障识别模型。
本文设计的卷积神经网络包含以下层级:
第一层为输入层,用于接收经过预处理后的语谱图数据;第二层为卷积层,根据预处理单元输出的语谱图数据,设置卷积核尺寸为16,卷积核数量为8,卷积步长为4,激活函数使用Leaky ReLU(带泄露线性整流函数),第二层网络结束,网络输出连接至第三层;激活函数Leaky ReLU的数学形式如下所示:
第三层为卷积池化层,卷积核尺寸为3,卷积核数量32,卷积步长为1,激活函数使用Leaky ReLU,随后进行池化,采用最大池化方式,池化尺寸4,步长2。第三层网络结束,网络输出进行展平操作,连接至第四层;第四层为全连接层;第五层为softmax层,输出维数为2,使用softmax函数,softmax函数的数学形式如下式所示,每个输出值P(i)的大小在0与1之间,总和为1;
第六层为输出层,输出维数与设定故障类型个数一致,使用softmax函数。
管理操作平台具有用户管理、音频管理、设备管理、数据统计、告警输出等功能模块。
鉴于平台操作安全性考虑,用户类型配置了管理员和一般用户,并分配不同的使用权限。在用户操作展示页面上,管理员用户可以对采集设备进行添加与删除、音频文件编辑、声音模型纠偏等,一般用户则配置了浏览、读取等功能。平台根据登录用户的属性,展示不同操作权限的页面,实现用户的分类管理。
展示内容包括绑定设备个数,前端设备的名称、版本、安装位置与当前工作状态。管理员用户在此页面可以对设备进行删除和添加:点击删除按钮实现删除当前选择的设备;绑定设备,需要输入设备的设备ID号等相关信息,便于平台将读取设备信息,通过网络与前端设备相连。
该页面内容包括两个组成部分,上半部分为正常音频,展示示例水轮机故障音频,下半部分为设备通过采集所捕获到的异常声。当专家用户听过音频后,确定当前音频为水轮机的碰撞异常声,可对将该段声音进行标记,若发现标记错误,仍可以取消原来标记内容,实现专家介入纠偏模型的功能。
在水车室内水轮机组主轴旁设置拾音器,采集水轮机转动声音,拾音器声音采样率为16000Hz,时长为3600s,根据奈奎斯特定律(Nyquist's law),可以复原不大于8000Hz频率大小的采集声音信号。对水轮机正常转动声标记为正常运行声音,在现场使用“击铁”声模拟水轮机碰撞声并标记为故障碰撞声音。经现场应用与测试,水轮机在正常运行情况下,采集到的声音频率极大值集中在4000~5000Hz,产生碰撞故障情况下,声音频率极大值集中在2500~3000Hz,结合富有经验的技术专家的判断辨别,以对水轮机声音类型进行标记,提高系统鲁棒性。
系统报警单元在故障识别模型主要功能是识别实时转动声音中是否为故障碰撞声音,同时计算输出的故障碰撞声音的帧长占实时转动声音的全帧长的比例,通过预设阈值P,当比例大于预设阈值P时,发出报警信号,起到预警效果。在测试中,实时采集水轮机60s的转动声音,经过预处理后分割为1874帧,重叠率为50%的数据,将1874帧数据输入到训练好的故障识别模型进行识别,设置阈值P为50%,当故障碰撞声音的帧长超过1874×50%时,向值班人员发出报警信号,报警单元可以安装在计算机的监控软件中,通过计算机的监控软件发出报警信号。
本文通过将语谱图与卷积神经网络相结合,提出了一种水轮机故障碰撞的识别方法与系统。通过语谱图实现声音样本特征向量的有效提取,结合卷积神经网络迭代训练,得到水轮机故障碰撞声音的故障识别模型,实现对水轮机实时转动声音的实时监测,通过故障碰撞声音识别水轮机是否发生故障碰撞。结合人工纠偏,通过人工介入对故障识别模型进行优化,提升系统鲁棒性。通过在水电站应用基于故障声音识别的水轮机碰撞故障识别系统,能够实现及时有效的故障预警,提升水电站应急处置效率,保障水电机组设备安全生产。