王怀军,张鸿宇,李军怀,张思秦,张发存,冯连强
1(西安理工大学 计算机科学与工程学院,西安 710048)
2(中国重型机械研究院股份公司,西安 710032)
当前,工业生产体系伴随着数字化技术与移动互联网的蓬勃发展,掀起了一场万物互联智慧化的新兴革命,信息技术正在与工业生产中的基础设施和管理系统相融合,以将传统工业体系提升到更高水平.德国“工业 4.0”[1]、“中国制造 2025”[2],标志着工业生产制造从自动化时代全面转向信息化与智慧化时代,“智慧”体现了信息化所采取的方法和工具[3].物联网(Internet of Things,IoT)是工业信息化发展的基础技术,依托无线网络、移动设备、SOC、传感器等多种技术的进步,在集成度、灵敏性以及成本控制等方面愈发成熟[4].侯一鸣等研究了基于物联网和工业云的选矿设备状态监控系统[5],利用多传感器融合技术实现了视频数据与设备过程参数融合监控.相互连接的设备定期收集、分析数据,借助云与AI技术,为复杂重型装备的健康监测和工业生产的规划、管理、决策提供了智慧辅助支持.
而设备健康状态的准确评估对于复杂重型装备有着重要意义.目前,设备故障状态评估主要根据设备的监测数据和实际生产系统的信息,得出设备的健康状况,确定设备是否继续工作或进行维护.评估方法大多集中在系统建模与数据驱动建模两个方面.系统建模主要有故障树分析法、神经网络分析、隐马尔可夫模型等[6].随着工业物联网与大数据分析的发展,结合人工智能技术,相继出现了支持向量机[7]、神经网络[8]、深度学习[9]等健康评估方法,这些方法可以较好地检测设备故障,也存在着一些缺陷:① 各部件传感器收集的特征参数较多,直接输入到评估模型中会增加计算复杂度,导致评估结果不准确; ② 大多是针对已存在故障的状态分类识别,不能直观量化当前设备偏离正常状态的程度,不能全面描述设备的退化过程[10].为了解决该问题,马田系统(Mahalanobis-Taguchi System,MTS)被应用于滚动轴承初始故障检测和状态监测方法研究,可以准确地检测出轴承的初始故障和判断轴承的退化状态,但由于故障的复杂性和多变性,该方法还需进一步改进.针对上述问题,本文提出了一种结合马田系统与设备状态指数(Device Status Index,DSI)的状态评估方法.通过筛选多个设备特征参数,构建马田系统的基准空间,利用故障敏感度计算特征参数对应的加权马氏距离,之后结合设备状态指数,构建评估模型,利用设备状态指数的变化来判断设备的健康状态,最后基于轴承标准数据集进行模拟分析,验证方法的有效性.
设备从购买、安装、开始工作到故障报废的整个生命周期中,其内在部件的状态会随着时间推移发生一系列变化.因此,设备故障的变化趋势是从轻微故障征兆开始,逐渐发展到整个设备丧失工作能力的过程,如图1所示.其中,设备一开始的状态处于稳定阶段,A点是即将出现轻微故障的征兆点; B点表示出现故障征兆点,在A点与B点之间的阶段,设备处于亚稳定阶段,可以通过监测数据发现异常,不影响设备正常工作; C点表示设备出现明显故障,该故障可以直接通过观察或外在特征体现出来.
图1 设备生命周期曲线
在进行设备健康状况评估时,需要提取已采集的特征数据中与设备退化相关的特征数据集,构建评估矩阵.假设一台设备有m个特征值与设备退化相关,在单位时间段内共有n个数据,可定义评估矩阵:
其中,xij表示设备第i次采集时第j个特征值的数据.
距离是体现不同样本之间差异性的常用工具,其值的大小与样本间的差异性成正比.因此,可以通过合适的距离度量设备正常状态与故障状态的差异度.马氏距离(Mahalanobis Distance,MD)是由印度统计学家马哈拉诺比斯(P.C.Mahalanobis)提出,用于表示数据的协方差距离,有效计算两个样本集之间的相似度[11],有µ=(µ1,µ2,···,µp)T,协方差矩阵为Z的多变量向量x=(x1,x2,···,xp)T,其马氏距离定义为:
相比于欧式距离,马氏距离在考虑特征值的前提下,排除了特征相关性的干扰,在多维特征尺度下可以较好量化设备状态.从图1可知,运行时间增加,设备运行性能会逐渐下降,而用于量化设备退化状态的MD会加速增长.可以通过映射函数阈值直观地评价设备的健康状态,将MD映射到指定范围内.映射过程可表述如式(2):
其中,x可表达为特征对应的MD范围,映射函数F的函数值称为设备状态指数.
从设备运行的历史数据中提取多种特征参数构建稳定基准空间,将特征按照故障敏感度进行筛选,求得对应的加权马氏距离.然后利用Box-Cox变换获得设备状态指数阈值,构建健康状态模型,实现评估分析.如图2所示.
图2 设备状态评估流程
根据图2可知评估基本流程主要有以下4个过程:
(2)计算加权马氏距离.将X作为输入,通过特征参数的故障敏感性筛选中评估重要特征,并计算出相应的加权马氏距离(Weighted Mahalanobis Distance,WMD);
(3)构建设备状态指数模型.根据WMD构建DSI模型,利用Box-Cox变换和准则确定DSI模型中的阈值;
(4)评估设备健康状态.根据确定的阈值与特征参数的DSI,对设备的健康状态进行评估.
田口玄一博士提出的马田系统将马氏距离与田口方法有效集成,广泛应用于疾病诊断、数据分类、模式识别以及样本的诊断、预测分析[12].利用MTS进行设备状态识别,需要收集正常的样本数据集,并将其定义为基准空间; 随后以基准空间为基点,求得样本参数对应的MD作为度量尺度,测度未知样本与基准空间的距离; 最后通过设定阈值进行状态识别.
通过收集设备特征数据构建正常样本集,并计算相应MD,详细步骤如下:
(1)构建初始特征集:识别设备的m个重要特征参数xj(j=1,2,3,···,m)以此构建初始特征集 X=(xij)n×m.
(2)剔除异常点,构建稳定基准空间:第一步构建的初始特征集中,可能存在部分异常数据,会导致最后计算的样本MD不稳定.根据Rousseeuw提出的改进最大分类器差异(Maximum Classifier Discrepancy,MCD)算法[13],该方法大致步骤为:先找到一个样本量为h的子集,使得在所有大小为h的子集中,该子集的协方差矩阵的行列式是最小的.根据MCD计算协方差估计量,计算公式如下,获取均值和协方差估计量后,最后可以通过计算得到每个样本与中心之间的马氏距离,如果马氏距离大于某个临界值,则该点视为离群点.
该方法是一种高鲁棒性的估计方法,它的目标就是找出协方差矩阵具有最低行列式的观测值,改进的MCD算法,其基本思想是一个包含顺序统计和行列式的不等式,以及我们称之为“选择性迭代”和“嵌套扩展”的技术,该方法对数据中的异常值进行有效识别,剔除初始特征集中的异常点,构建稳定的基准空间.
(3)正常特征参数标准化:
标准化后的稳定基准空间表示为:
(4)计算MD:在MTS中,MD平方后被用作标准度量尺度(即:将得到的MD进行平方计算再赋值给MD).通过式(6)处理后,正常样本的MD期望值在1附近分布,利于区分异常样本[14].其计算公式被定义为:
式(7)是正常样本中m个特征的相关系数矩阵.为避免出现式(4)中S矩阵不可逆问题,采用田口玄一博士提出的GSP方法来计算MD,计算公式为:
在基准空间优化前需要对其进行有效性验证.使用正常样本的期望和标准差对异常样本进行标准化处理,获取异常样本的MD.如果正常样本的MD小于异常样本,证明度量尺度良好,建立的基准空间是有效的,反之,则需要重新选择特征变量定义基准空间.
设备状态评估的过程中,并非所有的特征变量都有助于提高计算精度,有些特征变量可能对最终数据没有影响,而有些甚至存在干扰.因此,有必要对经验证后的基准空间进行特征优化,选择对构建MTS基准空间有正收益的特征变量.在MTS中,使用正交表OA和信噪比SNR相结合来筛选有效特征.根据特征参数的个数设计正交表,假设样本空间有p个特征,安排在正交表的前p列上,用两个标量分别表示该特征是否参与构建基准空间.对于每次试验(正交表的行数),使用被选择特征计算异常样本的马氏距离MDi,i=1,2,···,m并计算SNR:
对于每一个特征,分别用t1和t2表示特征xj参与实验的SNR均值与未参与的SNR均值.
如果Δ>0,则表明该特征可以保留,反之,删除该特征.
优化后的特征变量可以作为评估的重要特征参数,之后可以根据特征的重要性赋予特征参数不同的权重,以体现其贡献程度[15].经过GSP处理后的加权马氏距离可定义如下:
由式(12)可知权重会影响到基准空间的有效性.特征的权重应当与该特征对故障的敏感性有关.特征对异常样本越敏感,标明该特征包含的变化信息越多,更利于分类和预测.在设备运行生命周期中,不同的特征参数在经过A点到B点的时间间隔中,数据表现是不同的.根据不同特征对故障的敏感性不同,本文通过线性变化函数将所有的正常样本归一化,计算其对应的敏感性.归一化计算公式如下:
上述由于故障的敏感性主要由设备运行生命周期的AB段体现,故对特征参数的AB段进行提取,获得峰值p与时间t,通过式(14)求得其敏感性:
算法特征对故障的敏感性来确定的权重被定义为:
至此,通过基准空间中的特征参数获得了WMD,以此确定故障的可能性.
由基准空间求得的WMD与设备的运行状态密切相关,其关系可通过映射函数体现.当函数值接近范围上限b时,意味着设备工作正常,生命周期处于稳定阶段; 当设备退化到一定程度时,函数值处于(a,b)范围内,设备工作存在隐患,生命周期可能处于亚稳定阶段;当函数值接近范围下限a时,设备故障可能性极高,甚至停工.加权后的马氏距离,其期望值分布在[0,1]附近,利用ex数可以在保持原函数单调性的前提下增加敏感性的特点,构造DSI函数:
设备健康置信度可由同类设备的历史运行数据统计得出.从式(17)可知,设备健康运行,WMD在1附近波动,DSI值略低于1; 设备轻微故障时,WMD会超过某阈值,DSI会逐渐减小,与WMD成反比; 设备严重故障时,WMD远大于1,DSI急速减小并趋于0.
DSI阈值可以准确区分设备生命周期的正常和异常状态,小于DSI阈值表明正常; 超过DSI阈值表明异常.利用设备特征参数的MD计算DSI阈值.考虑到特征参数经过剔除异常点后仍可能存在错误,影响判断的准确率.Kumar等[16]提出一种Box-Cox变换方法,Box-Cox变换的一般形式如下.
故而可以将不服从正态分布的WMD值转化为近似正态分布的数据,具体转换参照式(20).
然后基于3σ准则(拉伊达准则)确定DSI阈值,满足正态分布或近似正态分布的样本数据处理,如表1所示.
表1 3σ数值分布
根据确定的t2σ、t3σ与γ得到变换前正常特征样本的WMD阈值,通过式(16)计算DSI的阈值,2σ阈值对应的是设备生命周期的故障征兆点,3σ阈值对应故障点.
利用此方法确定评估模型的阈值,在不同情况下DSI值映射范围内的置信度达到99%以上,说明构建的设备健康状态识别模型具备良好的准确率.
滚动轴承是复杂重型装备的关键部件,其健康状态关乎复杂重型装备运行情况.本文选择采用滚动轴承作为实验研究对象来验证方法有效性,其结果对复杂重型装备具有较大的适用性.使用由西安交大与昇阳科技联合实验室发布轴承加速寿命实验数据XJTUSY Bearing Dataset[17],实验平台如图3所示.数据采集由固定在测试轴承的水平和竖直方向上的两个单向加速度传感器获得.采样频率为25.6 kHz,采样间隔为1 min,每次采样时长为1.28 s,每份样本包含32 768个数据点,实验选用1号工况数据集.
图3 轴承加速退化测试平台
(1)数据预处理
振动信号在采集的过程中会因为外界诸多因素的干扰导致其内部存在噪声,这些噪声会使得真实数据出现非平滑,非线性等特点,从而导致后续分析存在误差甚至错误[18].因此,信号在进行分析前进行预处理是非常必要的.通过对Storm中的模型Bolt进行自定义,可以在信号数据被后续数据分析服务消费前进行预处理.本文采用小波变换的方法[19]对振动信号进行预处理.
图4 信号分解流程
图5 处理前后的振动信号对比
(2)特征选择
在滚动轴承的振动信号分析中,常在时域与频域上选取特征参数.设共有m份样本数据,每份数据的长度为n,第i份样本数据的第j个数据点用Zij表示.本文选用的特征参数表如表2所示[20].其中,频域特征参数中的k,d,D,a分别代表轴承中滚珠个数、滚珠直径、轴承中径与接触角,其幅值根据样本时域信号的快速傅立叶变换计算得到.本文选择数据集中一组轴承从完好到失效的全生命周期的数据构建初始特征集,共123个样本.
表2 特征参数表
(3)结果分析
图6 正常样本与异常样本的WMD分布图
从图7可以看到,随着时间增加,在80 min附近状态指数开始超过故障阈值,由此说明阈值模型可以匹配实际信号,体现了设备状态的变化趋势.此外,通过阈值可以对设备的运行状态提供标准,准确识别异常状态,判断设备何时出现故障征兆,为设备的维修与管理提供数据支持.
图7 工况1轴承的状态指数图
为了及时发现设备故障,本文结合马氏距离和设备状态指数研究了复杂重型装备健康状态模型.基于小波变换进行数据预处理,根据通过正交表与SNR进行特征筛选出与故障相关的特征,构建基准空间.通过改进的马田系统算法,计算加权马氏距离,利用设备健康置信度和设备状态指数对设备健康状态进行评估.最后通过实验,验证了方法的可用性,该方法适用于工厂设备的健康状态的检查,根据其检测结果,来判断设备处于是否处于健康状态,若设备健康,只需定期进行维护即可,若是设备处于故障状态,则需要立即停止使用,进行维护,然后再投入生产,对于处于故障较小的设备,则需要经常进行维护和保养,使其在保证设备的性能情况下,延长其使用寿命.