龚敬群,李 杰,黄冬明,周兴泽,马天雨
(1.宝武装备智能科技有限公司,上海 201999; 2.湖南师范大学,湖南 长沙 410083;3.湖南安存科技有限公司,湖南 长沙 410003)
热轧层流冷却工艺段包括层冷辊道和带钢层流冷却设备。层冷辊用于将带钢从精轧机运送到地下卷取机,辊子总成被夹固在主辊道框架上。层流冷却设备安装在输出辊道的上面和下面,用于冷却卷取前的带钢以控制带钢的机械性能。层冷辊道由电动机驱动辊子实现钢坯运输,1个辊子需要1台电动机带动。层冷辊电动机经常出现接地、尼龙接手脱落、润滑油劣化、不对中、不平衡、基础松动、接地故障、短路断路、轴承损坏等,故障类型多,且因电动机数量多导致故障频发。电动机故障导致的非计划停机给企业带来较大损失,为排除非计划停机损失,现场需要大量的巡检和维修人员,通过逐个电动机巡查、“五感”点检等方法排查故障电动机。人工巡查受工作人员责任心、工作经验、业务能力等因素的影响,常常效果并不理想,且人力资源浪费严重。为此,现场建立预防性的电动机批量更换制度,对于到了一定使用年限的电动机进行统一批量更换,这种做法导致大量的过度维修现象,给企业带来较大的经济损失。基于大数据分析的方法,通过电流、谐波等特征数据分析电动机运行情况,实现预测性运维,对降低非计划停机事故、提高企业经济效益具有重要意义。
国内外对电动机进行故障诊断的主要方法基于三大类:解析模型[1]、信号处理[2-3]、数据驱动[4]。解析模型方法建立机理模型需要深入研究电动机机理、构造,耗时长,难度大且机理模型难以适应时变的工业环境和工况。信号处理方法基于傅里叶变换、小波变换和经验模态分解方法提取特征,然后基于频域+时域特征混合进行故障诊断,实际生产中,决定故障类型的是特征之间的关联关系而不是特征数据本身,而特征之间的关系一般都是长时间经验积累且存在个体差异。随着人工智能和机器学习的快速发展,新型的数据驱动方法逐渐越来越多地在复杂工业设备故障诊断中应用。其中1DCNN[5]是用在电动机、风机、齿轮箱等旋转设备故障诊断的主要方法,但1DCNN无法识别故障时数据异常持续实际和空间幅值,而2DCNN[6]直接对异常数据形态进行识别,基于单特征形态识别的方法不能表征整个电动机的状态全部信息,导致诊断精度过低。多特征2DCNN[7]综合多特征电流信号数据可以充分利用多信号的故障补充信息,做出更加正确的诊断决策。然而,工业过程干扰多、异常工况频发,直接对电流数据及频谱值进行2DCNN识别会导致较大误报,需要对数据图形进行变换。
针对以上问题,本文提出一种基于CNN电流多特征异常形态识别的电动机故障诊断方法。该方法首先提取故障下出现异常的关键电流属性,对属性数据进行二次特征提取,计算关键属性的95分位数和05分位数,并提取分位数包络线,将包络线形态馈入CNN模型中进行形态识别,给出二次特征包络线异常形态;建立漏报率和误报率最低的优化目标,将各二次特征异常形态作为基因片段,基于遗传算法寻优电动机接地、轴承卡阻、螺栓松动、联轴器不良等不同故障类型的二次特征形态组合模式。本文的主要贡献如下:①采集电动机电流信号,通过频谱、统计分析方法进行特征提取,获得故障诊断关键电流特征;②提取二次特征95、05分位数包络线,通过CNN识别包络线形态,克服现场干扰引起的瞬时、单点数据异常;③建立(漏报率+误报率)最低的优化目标,将二次特征包络线形态作为基因片段,采用遗传算法挖掘不同故障类型的各特征形态组合模式。
层冷辊道是冶金企业热轧区域的重要设备之一,布置在热轧精轧机和卷取机之间,用于将带钢从精轧区域输送到卷取区域。如图1所示,层冷辊道由很多辊子平铺形成,每根辊子都由辊道电动机驱动旋转,带动钢板前进。热轧工艺中,层冷区域的主要作用是对带钢进行喷水冷却。因此,热轧层冷区域电动机工作在充满水蒸汽和喷溅水的恶劣环境中,电动机经常出现绝缘下降、密封损坏、尼龙接手脱落、钢渣黏连等故障。由于用户对于带钢的质量要求越来越高,因此一旦电动机发生故障,层冷辊行进不均匀会给带钢表面质量造成损伤,造成产线停机事故,影响生产的稳定运行,同时也造成大量不合格钢材,降低企业经济利润。
图1 宝钢热轧2 050 mm产线层冷辊道
基于当前以定修、年修为主的预防性维护导致大量的过度维修和人工巡检造成的重大事故漏报问题,提出一种基于电流数据特征形态识别的故障诊断方法。
图2是基于电流数据形态识别的电动机故障诊断框架图。
图2 基于电流数据的电动机故障诊断训练流程图
将采集到的电流数据通过频谱分析获取各次电流谐波和转频谐波,并计算最大电流和逆序电流。基于粗糙集等属性约简算法加人工经验提取电动机故障关键特征,形成{关键特征+日期+故障标签}的拼接表,考虑数据形态主要体现在边沿线的变化,对关键特征进行二次特征提取,获取各关键特征的95、05分位数,然后拟合各二次特征包络线,将包络线2D图像形态输入CNN实现形态识别。每个关键属性在故障时都存在不同的二次特征包络线形态,假设有n个关键属性,每个属性有m个二次特征形态,那么就存在mn种形态组合,而不同的故障类型对应不同的二次特征形态组合,因此,需要建立优化算法模型,寻优不同故障类型的二次特征形态组合模式。
电流采集器提供给云服务器的各类数据有480多个维度,经现场专家提炼出51维数据,过高的数据维度很难建立泛化能力高的模型,除去数值很小的高次谐波数据,剩余属性仍然有30多维。为此,需要对剩余30维数据进行属性约简,需要找出跟电动机各类故障相关的关键属性。基于现场记录故障表跟30维数据拼接表,综合专家经验和粗糙集分辨矩阵算法结果,挖掘出数据形态跟故障有比较明显关联变化的关键属性。首先将人工筛选剩余的30多维属性跟故障记录拼接成一张类似表1的数据表;然后对各属性根据公式δ=(xmax-xmin)/k离散化,k代表离散后的数值类别数,例如:如果ih2值的范围是0.2~3,那根据历史数据可将ih2离散为0,1两类值,[0.2,1]属于0,[1,3]属于1,即k=2。基于离散数据表计算粗糙集分辨矩阵,分辨矩阵给出故障发生时不同属性是否发生数值跃变的信息;根据分辨矩阵中属性出现频率和故障发生时同时发生数值跃变的属性个数对各属性进行重要度排名,取排名靠前且重要度值较大的属性作为关键属性。本文根据该方法提取出6个关键属性:电流二次谐波(ih2)、电流三次谐波(ih3)、转频二次谐波(mh2)、转频三次谐波(mh3)、最大电流(imax)、逆相序电流(ineg),6个属性的数据拼接表如表1,表中“故障类型”属性根据现场维修台账记录的故障日期为准。
表1 属性拼接表
考虑工业电动机数据干扰,直接识别关键属性形态容易导致误报,有必要对关键属性进行二次特征提取。同时,考虑数据边沿具有比较强的形态稳定性,可提取关键属性的边沿特征。分位数具有很好上下边沿特征提取能力,考虑更靠近边界的98分位数和02分位数对干扰数据比较敏感,而远离边界的92分位数和08分位数又不能很好地提取边沿形态,故采用1h 95分位数和1h 05分位数分别获取各个属性的幅值变化和底部变化特征,而试验验证结果也证明1h 95和05分位数能很好地提取边界形态且对现场干扰具有很好的鲁棒性。采用1h 95分位数和1h 05分位数,从而将6个关键属性扩展为12个二次特征:ih2_95、ih2_05、mh2_95、mh2_05、imax_95、imax_05、ineg_95、ineg_05等。
阈值报警方式无法识别现场干扰和真实电动机故障,会产生很多误报警,给现场巡检人员带来很大工作压力。卷积神经网络(CNN)是深度学习的一个重要分支,重点识别语音信号和图形图像,特别在图像识别领域具有独特的优势。电动机发生某些故障时,其电流数据及频谱特征会有明显形态异常。如图3所示,将各类异常形态输入CNN网络进行识别,给出某一属性的异常形态类型,综合考虑6个关键属性的异常形态,可以诊断电动机故障并给出故障分类类型。
图3 基于CNN数据异常形态识别
95分位数、05分位数代表数据形态的上下边沿,但边界线不够平滑,直接交给CNN效果不好,提取分位数的上下包络线并做平滑滤波处理,可以很好地提取故障形态的边界特征,分析整理包络线形态,发现现场的数据异常可归纳为几种代表性的包络线形态:双边上、下阶跃,幅值阶跃,双边劣化,幅值劣化,底部劣化,阶跃劣化,正常等不同波形,数据形态提取过程如图4所示。将滤波后的二次特征包络线交给CNN模型,识别出各属性的数据异常形态。故障发生时,不同属性会出现不同的数据形态,而故障类型不同,各属性的形态组合也会不同,这种组合非常多,单靠人力很难找到各类故障的优化组合。为精确定位故障分类,需要从历史故障记录中挖掘不同故障类型对应的属性形态组合模式。
图4 数据形态提取
图5 遗传算法挖掘分类故障形态组合
对6个关键属性以1 h滚动的方式截取24 h的数据片段得到共6个数据片段,计算二次特征并绘制其包络线图,通过CNN卷积神经网络模型识别6个属性的数据片段形态,每小时可得到6个属性的24 h波形形态。若6个形态都属于“正常”则丢弃本次形态组合,只要有一种形态出现异常则将该组合留在形态组合表,如表2,表中给出了“尼龙接手老化”故障发生时出现了二次电流谐波双劣化形态和转频三次谐波幅值劣化形态。
表2 形态识别表
以漏报率、误报率最低为优化目标,采用遗传算法挖掘分类故障的形态组合模式。首先初始化遗传算法种群,种群每个个体都由6个数字组成,每个数字代表不同形态组合,而数字所在位置代表6个关键属性。初始种群经交叉变异等操作产生新的子代种群,将子代种群跟形态识别表对应位置做差值,如式(1)。
(1)
建立漏报率、误报率和故障分类错误率最低为目标的综合优化指标,以基于历史数据计算的形态识别表为样本数据,以m个形态组合样本作为识别模型,计算式(2)最小值。
(2)
式(2)中(Findnum-Faultnum)表示模型报警故障除去跟台账记录对应的故障后的剩余报警,除以台账记录故障次数就是误报率;(Faultnum-Findnum)代表台账记录故障中除去模型正确报警故障后剩余故障,除以台账记录故障次数就代表漏报率;而式(2)第三项中(Faultl-Findl)代表模型报的l故障类型跟真实记录差异次数。对式(2)设置一个门槛值,若遗传算法优化所得形态组合模式能够保证式(2)值小于阈值则优化结束,否则选择种群中使得Kn/Tn值最大的前50%组合进入下一轮迭代,同时加入随机产生的50%新种群,重新进入新一轮优化。
选择热轧2 050 mm产线39台电动机2018年1月到2020年6月数据进行回测。截取各种正常数据提取边界线图像形成正样本图例2 000张,截取故障发生时的数据,提取边界线形态形成各类故障负样本图例。因分类故障样本比较稀缺,深度学习样本图例不够,把不同类型故障形态做斜率、幅值等参数微调,每种分类故障产生100张近似形态的形态图例。然后将正负样本放在一起,随机挑选30%形态样例作为测试集,其他70%作为训练集,训练CNN卷积神经网络识别异常形态。训练好的CNN模型离线识别历史数据中各属性异常形态,然后形成6个属性的异常形态组合,对应故障记录标签采用遗传算法寻优不同分类故障的形态组合模式,形成分类故障异常形态组合模式库。在线运行时,将各属性24h数据滚动数据提取边沿形态,输入CNN识别异常形态,然后在形态组合模式库里面匹配是否存在该模式,从而识别故障类别。
图6(a)是GF_11_26电动机2020年1月14号故障记录,可以看出ih2,mh2,mh3等3个属性出现了数据异常,模型在2019年11月18号发出了报警信号;图6(b)是GF_13_72电动机在2019年12月4日抢修换辊的故障记录,图中ih2,mh2,mh3等3个属性出现了数据异常,模型在2019年12月4日当天提前6 h报警;图6(c)是GF_13_58电动机在2019年8月1日点检换辊的故障记录,图中ih2,mh2出现了明显的数据异常,模型提前1个半月在2019年6月15号报警。统计2018年1月到2020年6月的所有具有明显数据劣化异常关键故障,模型报警漏报率为0,而误报率少于15%,完全满足现场对漏报率和误报率的要求。
图6 报警案例分析
本文提出了一种基于高频电流采集数据的电动机故障诊断方法。首先,从电流数据中提取谐波、转频、最大电流、逆序电流等高维属性,通过属性约简获取关键属性;然后提取关键属性的二次特征,采用CNN识别包络线形态的方式判断各属性在故障下的异常形态;最后通过遗传算法基于漏报、误报率最低的目标优化求解不同故障类型的异常形态组合模式。经热轧生产线现场验证,所提方法对具有明显劣化异常数据的故障报警准确率较高,完全满足现场实际需求。但本文方法还存在对黏铁、短时卡阻等异常工况的少量误报警,后续可考虑将异常工况纳入形态识别,进一步降低误报率。