徐晶珺,郑源,2*,于洋,潘虹,唐魏
(1. 河海大学能源与电气学院,江苏 南京 211100; 2. 河海大学创新研究院,江苏 南京 210098; 3. 中水东北勘测设计研究有限责任公司,吉林 长春 130021; 4. 河海大学水利水电学院,江苏 南京 210098)
目前,随着互联网、物联网、云计算和大数据等信息技术的快速发展和演进,水电行业正朝着自动化、智慧化的方向前进,推动了水电站故障诊断技术快速发展与变革.水电机组的轴心轨迹研究是故障诊断的一个常用方法,人工识别轴心轨迹虽然十分准确,但当故障数据过多时,也会造成严重的人力浪费.根据轴心轨迹智能识别机组的故障状态,不仅可以及时有效地根据实际的故障严重程度对机组进行分类检修,还能对机组的状态进行监测以预防产生故障,这对水电站故障诊断的智能化有着重要的意义.
轴心轨迹识别可以看作是提取图像的特征和对特征分类处理的问题.现阶段有较多特征提取的方法和理论,例如特征矩理论[1]、傅里叶描述子理论[2-3]和高阶相关特征[4]等.
孙国栋等[5]结合了BP神经网络,提出了基于高度函数的轴心轨迹识别的算法,算法的识别率达到了94.2%,并且识别速度显著提高;郑慧娟等[6]结合大数据技术与算法理论对轴心轨迹信号进行了原始波形分布式存储、特征向量并行计算,最终用Mahout做轴心轨迹类型识别;付婧等[7]采用统计分析的方法定义了轴心轨迹的标准差、变异系数、归一化面积等参数,并对机组各个载负荷下的轴心轨迹进行了分类;陈征等[8]基于轴心轨迹信息熵和盒维数,提出并构建了一种新的直观评价转子运行状态指标及转子故障程度判别和故障状态预示方法,该方法可以识别转子正常模式与故障模式.
随着深度学习快速发展,在图像识别领域取得了一些突破性的进展,其中卷积神经网络已经成为研究热点之一.1984年,日本学者FUKUSHIMA[9]根据视觉皮层功能模型启发,提出了卷积神经网络的神经认知机,而卷积神经网络被看成是神经认知机的一种推广.SIMARD等[10]采用梯度下降法实现最早的卷积神经网络,设计LeNet-5[11]网络模型应用于识别手写文字并且达到商用的程度(错误率小于0.8%).KRIZHEVSKY等[12]在ImageNet数据识别中,使用卷积神经(convolutional neural networks,CNN)进行图像识别,取得了良好的效果,标志着CNN在图像识别领域逐渐占据主导地位.卷积神经网络在各方面有着很多应用.文献[13-16]分别在食品、机械、医学等领域应用了卷积神经网络,取得了很好的分类效果.
水电行业对卷积神经网络应用得较少,文中提出将该算法应用于水电机组轴心轨迹分类,从而达到判别机组运行故障的目的.
特征提取和分类是卷积神经网络的两大重要核心.特征提取是卷积层通过卷积核的运算提取关键信息,得到每个神经元输入的特征(features),并确定多个特征之间对应的相对位置随着卷积层数增加,则滤波器得到的特征就越复杂.分类是通过卷积运算得到的特征经全连接层进行分类识别.卷积神经网络中,权值矩阵表现像是一个过滤器,先对权值进行学习,然后最小化损失函数,通过对参数学习,从原始图像中获得特征并进行分类.网络结构愈深,矩阵提取的特征信息越复杂.
卷积神经网络不需要手工提取图像的各个特征,在图像识别表现上更加准确且智能,大大节省了人工劳动力.在图像处理中,卷积神经网络把图像表示为像素的向量,其权值共享结构大大减少了权值的数目,有效地降低了网络模型的复杂度,从而加快了计算速度,尤其在网络输入多维图像时表现更为突出,图像作为网络的输入有效地避免了传统算法中复杂的特征提取和数据重建的耗时过程.
特征提取对卷积神经网络有着至关重要的意义,是卷积网络的核心步骤.卷积神经网络从输入信号中提取到的有效特征信息的质量,决定了分类器是否能准确地实现分类.
传统的卷积神经网络由卷积层、采样层(池化层)、全连接层3层组成,每一层由多个二维平面组成,每一个平面由多个独立的神经元组成.图1为卷积神经网络的体系构成.
图1 卷积神经网络体系构成
通过卷积运算,可以提取出不同图像中的不同特征,同时加强输入的某些原始信号,并且起到了降噪的作用.
(1)
式中:f(·)为激活函数;mj为上层的一个输入特征图;k为卷积核;l为卷积层所在的层数;b为偏执.
卷积神经网络的采样方法相当多,代表性的方法有重叠采样(overlapping)、最大值采样(max pooling)、均值采样(mean pooling)等方法,采样目的是为了减少计算机的计算量和模型的参数,并保留图形的重要特征,提高模型的泛化能力,防止卷积神经网络的过度拟合.采样层的计算公式为
(2)
式中:β为子采样系数;down(·)为采样函数;f(·)为采样激活函数;b为采样偏执.
通过前面的运算得到了图像的特征,全连接层可以将最后的输出映射到线性可分空间内,将最后得到的长方体平摊成一个向量,并配合输出层进行分类识别.在实际操作中,卷积运算也可以实现分类的功能.
水电机组轴心轨迹包含着转子运行状态的丰富信息,是判断机组运行状态和故障征兆的重要依据,比振幅和幅频特性曲线等更能直观地反映转轴的运动情况.水电机组轴心轨迹形状随故障类型不同而变化,正常的轴心轨迹是一个长短轴相差很小的椭圆.故障图形主要包含4种类型,例如转子质量不平衡、大轴轴线不直、轴间隙过大对应形状为椭圆形;轴承油膜涡动不正常对应内8形;转子不对中对应的外8形;香蕉形.
随着水电站状态监测和故障诊断技术发展,对故障分类识别的要求越来越高.因此,引入细粒度模型对故障严重程度做进一步研究.细粒度模型是引入一系列变量以描述轴心轨迹图像,根据变量制定故障严重程度的标准并对其细化分类,形成更加科学的模型对象.
1) 细粒度C=l′/L,其中l′和L分别为椭圆的短轴和长轴(mm).C越小,图像越细长,轴心振动越剧烈,此时的故障越严重.
图2为椭圆形轴心轨迹故障严重程度分类,为细粒度C依次减小的椭圆形轴心轨迹.图中C,轻微为(0.8,1.0],中等为(0.5,0.8],严重为(0,0.5].
2) 弯曲度A:为质点P到2个顶点的夹角度数.A越小,弯曲程度越大,说明转子不对中程度越严重.
图3为香蕉形轴心轨迹故障严重程度分类,图中弯曲度A依次减小,故障严重程度依次加剧.图中A,轻微为(110°,180°],中等为(75°,110°],严重为(0,75°].
图3 香蕉形轴心轨迹故障严重程度分类
3) 圆环宽比度W=w1/w2,其中w1和w2分别为外8形小圆环和大圆环的宽度(mm).W越小,两圆环的差距越大,说明轴心在小圆环处变化剧烈,故障就越严重.
图4为外8形轴心轨迹故障严重程度分类.图中圆环宽比度W依次减小,故障严重程度依次加剧.其中W,轻微为(0.75,1.00],中等为(0.40,0.75],严重为(0,0.40].
图4 外8形轴心轨迹故障严重程度分类
4) 幅角跨度比F=α1/α2,其中α1和α2为图形交点处的2个夹角值.F越小,2个夹角值相差越大,说明轴心在交点处相位变化越剧烈,故障就越严重.
图5为内8形轴心轨迹故障严重程度分类,图中幅角跨度比F依次减小,故障严重程度依次加剧.其中F,轻微为(0.6,1.0],中等为(0.4,0.6],严重为(0,0.4].
图5 内8形轴心轨迹故障严重程度分类
针对水电机组常见的4种故障类型,按式(3)用Matlab R2018a对轴心轨迹图进行仿真模拟.
(3)
式中:A1,A2和B1,B2分别为x和y的一、二倍频变量;ω为角速度;α,β分别为x,y的初始相位.
模拟了椭圆形、外8形、内8形和香蕉形轴心轨迹图片各220张,其中200张用于训练,20张用于测试,该数据库称为数据库A,共880张图片.另按4种轴心轨迹的故障严重程度分为轻微、中等和严重3类,共模拟12种故障图片各40张,其中30张用于训练,10张用于测试,该数据库称为数据库B,共480张图片.库B建立的目的是验证卷积神经网络不仅能识别分类故障类型,还能准确判断机组故障的严重程度.样本库A和B中的图片由模拟独立且随机生成,具有一定的样本代表性.
采用卷积神经网络对水电机组轴心轨迹类型识别,首先构建轴心轨迹图像的模型,本模型中输入轴心轨迹灰度图像的大小为64×64(px).每层的具体参数见表1,表中K,s,G分别为卷积核大小、步长、输出特征图大小.图中共包含5层结构,不包含输入层.其中C1, C2层为卷积层;P1, P2层为池化层;F1为全连接层.卷积层C1, C2输出的特征图分别作为池化层P1, P2的输入图像.
表1 卷积神经网络结构参数
试验在Windows 10系统上进行,系统内存为16 Gbyte,使用Matlab R2018a平台,计算过程使用GPU加速.
试验从数据库A中选择椭圆形、外8形、内8形、香蕉形的图片各200张作为训练数据、20张作为测试数据,计算卷积神经网络对不同故障类型的识别结果.最后用数据库A中的全部类型图片800张为训练数据、80张为测试数据进行计算.
表2为故障类型识别结果对比,表中ECNN,EA分别为CNN的识别准确率、全连接网络的识别准确率.由表可知CNN对单独类型的故障有很好的识别效果.
表2 故障类型识别结果对比
图6为CNN提取椭圆形故障图片特征的过程,输入图像经卷积核1处理获得20个特征,再经池化层对特征进行加强,又经卷积核2提取出10个特征,然后池化层加强分类特征,最后根据特征进行分类处理.
图7为全部类型分类识别结果,其中n为测试集样本.由图可知在全部类型的分类中对第25张图识别错误,但对比全连接网络也有98.75%的高识别率.
图6 特征提取过程
图7 全部类型识别结果
由表2还可知,CNN卷积神经网络对单类轴心轨迹的识别率达到了100%,对4种类型混合的轴心轨迹的识别率也达到了98.75%,明显优于全连接网络的识别率,表明该算法对轴心轨迹故障类型有着很好的分类与识别效果.
试验从数据库B中选择4种类型的图片各90张作为训练数据、30张作为测试数据,计算卷积神经网络对不同故障类型的识别结果.最后用数据库B中的全部类型图片360张为训练图片、120张为测试数据进行计算.
表3为故障严重程度识别结果对比.由表可知CNN对单独类型的故障严重程度识别率到达了100%.
表3 故障严重程度识别结果对比
图8为全部类型严重程度识别结果.由图可知在全部类型的识别结果中,对第15和第80张图识别出现了错误,但也有98.33%的高识别率,表明卷积神经网络能有效识别轴心轨迹的故障严重程度,能满足故障识别的应用.
图8 全部类型严重程度识别结果
针对当前水电机组轴心轨迹识别率不高、未对故障严重程度进行区分的问题,进行了研究:首先引入细粒度模型,建立了故障严重程度的评判标准,建立了对应的2种水电机组轴心轨迹细粒度数据库;接着利用改进过卷积层与池化层参数以适应水力机组研究的卷积神经网络对轴心轨迹数据库进行对比试验.研究结果表明,该方法能有效地对轴心轨迹的类型进行识别,识别率达到了98.75%,同时对水电机组的故障严重程度也有着很好的识别效果,对严重程度的识别率达到了98.33%;该方法提出的关于细粒度分类的有量纲指标相比量纲一指标拥有更优的状态描述能力,从而能更加准确地判断机组的具体运行状态,为水电机组的状态评估及故障诊断等提供了有效的指导作用.