白同元,黄瀚宇,林琳淳,钟晓莹,赵志红
(北京理工大学珠海学院,广东 珠海519088)
压力传感器在生产线上大量应用,实现了压力闭环伺服控制,而工作环境高温,存在水汽、多粉尘现象,使其造成经济损失。因而工厂希望达到对传感器健康工作状态进行实时自检的目的,做到及时提前预报,方能有效预防和解决故障问题,防患于未然,有效节省工厂原材料和设备采购费用。进一步提高生产能效比,降低成本,保障良好的经济效益。
目前我国把设备寿命预测技术作为我国未来发展的主要方向,通过文献查阅,从20世纪以来,国内外学者针对工厂设备寿命预测问题分别从传统统计角度和机器学习角度进行深入研究。传统统计方法通过大量的数据选择合适的模型进行训练,根据阈值理论,对数据进行诊断,相对于其他类型的方法,相对简单,工作量较少。文献[1]采用时间序列的预报算法,对传感器的输出数据进行预处理,得到具有故障特征的有用信息,达到对序列预测的目的;文献[2]采用时间序列对温室传感器节点数据进行建模,提取数据特征,据此用遗传BP神经网络寻找最优的网络连接权值,实现故障诊断;文献[3]利用AR模型对测取的信号进行估计和分析,得到故障发生的范围,并从其中提取参数作为特征向量,以此作为BP神经网络的训练样本,进而实现故障诊断。
另外,目前国内外研究学者主要研究基于机器学习的方法,提出灰色模型、LSTM时间序列预测模型及马尔科夫模型等对设备寿命进行预测,目前的研究结果模型精度较高,预测较准确。文献[4]基于LSTM网络的时间序列异常检测算法,利用重建值与原始值之间的误差对序列进行异常概率估计,并通过异常报警阈值实现异常检测;文献[5]基于数据维度高、规模大的特点,提出LSTM时间序列对单一传感器进行时间序列预测。
本文基于时间序列分析方法和机器学习LSTM的压力传感器故障预测方法,可分为故障选取、模型优化和模型预测3个过程:
步骤1:基于大量样本数据集,考虑到压力传感器随机产生故障,且故障频率逐渐升高的特点,对研究样本进行选取。
步骤2:将样本数据集按照7:3的比例进行分类,将70%的数据利用时间序列模型和LSTM模型对数据进行分析,通过对比模型的精度值及预测准确率,对模型优化,进而确定所选模型,便于提取模型的参数,以选定的模型参数对测试集数据进行反复检验。
步骤3:将数据集中剩余30%的数据集输入到模型中,基于数据分类原则对压力传感器的设备运行状态进行识别。
步骤4:根据选取的模型,建立寿命预测模型,采取实时预测,结合判断准则,推断设备运行时长。
研究数据集来源于某厂钢铁轧制过程中压力传感器真实运行数据集,分别选取5个时间段的数据集,每个数据集72000条观测值和2个变量,根据数据集1s内有10条观测值的特性,为进一步提高预测的精度与周期,提取压力传感器的运行特性,对数据进行预处理,以秒为单位,分别计算每个单位的测定值的平均值,将每个数据集的观测值数量由72000条转为7200条。整理得到的数据集如表1。
表1 预处理后数据集说明表
当压力传感器存在故障时,所测得的压力值会不断变化,通过已得的模型预测未来的工作状态,得到压力传感器的未来的运行状态数据,由此需要引入阈值以此判定该点是否为故障点。引入阈值判定方法[6],降低故障的误报率。
参数阈值的设定对算法的灵敏度和可靠性的影响很大,如果阈值设定过低,则易出现误报警;如果阈值范围太大,又会降低算法的灵敏度。函数表达式如公式(1)。
其中:Pt为阈值,为偏差率的平均值,σ为偏差率的标准偏差。和σ由样本数据求得,通过设定的阈值对预测的数据点进行判别。若n取0.05,且观测点在区间内则为正常点;若n取3,且观测点在0.05倍的区间之外、3倍的区间之内则为偏移点;若观测点偏移程度高于3σ,则为异常点。
结合判别标准,采用无放回随机抽样的方式,以06:00-08:00时段为例,以7:3的比例拆分成训练集和测试集并对数据点进行分类,如表2。
表2 训练集和测试集数据概况
本模型为提高模型的预测周期及预测精度,结合压力传感器测量计数间隔为0.1s的特点,引入偏离率的概念,即:测定值与设定值之间的偏离误差,函数表达式如公式(2)。
其中,αm为测定值,βm为设定值,为偏离率。根据文献[7]可知,AR模型结构如公式(3)。
其中,xt为压力传感器的偏离率数据序列,εt为白噪声的误差项,为模型自回归系数,对于模型阶次的确定,采用赤池信息准则(AIC)进行确定。
为达到提前预测压力传感器运行状态的目的,需对压力传感器的运行状态进行预测,根据文献[1]可知,AR(n)模型为预测公式如公式(4)。
以06:00-08:00时段为例,绘制数据序列图像,如图1。
图1 06:00-08:00时段时间序列图像
通过图1观测,数据无周期性变化,并且无明显的趋势性,说明序列平稳,满足AR模型建模要求。对数据进行自相关系数和偏自相关系数检验,得到各个时段的自相关系数和偏自相关系数图像,如图2。
图2 自相关系数和偏自相关系数图像
由图2可知,自相关系数图像拖尾,偏自相关系数图像随周期数的增大,偏自相关系数逐渐趋近于0,由此按照AR模型进行建模与预测。
针对自相关系数的拖尾性,偏自相关系数的p值确定为5、7和9。因此我们初步得到AR(5,0,0)、AR(7,0,0)和AR(9,0,0)三组模型,以06:00-08:00时段为例,利用AIC准则,计算这3个模型所对应AIC值,如表3。
表3 模型拟合结果表
同理,通过计算5个时间段的模型AIC值,根据AIC准则,最终确定模型为AR(7,0,0)模型。3时间序列模型预测及精度分析
采取AR(7)模型对测试集进行预测,在测试集中,正常点数为1256个,偏移点数为99个,异常点数为85个;在预测结果中,正常点数为1211个,偏移点数为125个,异常点数为104个。模型准确率为96.42%。
对5组数据利用AR(7)进行预测,平均准确率为96.14%,表明模型预测准确率较高,可以对压力传感器运行状态进行较准确的预测。
计算模型的均方误差作为模型精度指标的判断标准,分别得到训练集和测试集的均方误差值,如表4。
表4 模型的均方误差值
由表4计算结果可知,模型的均方误差值接近于零,说明模型的精度较高,可以准确预测压力传感器的运行状态。
LSTM模型是一种RNN的变型,最早由Juergen Schmidhuber提出的。通过调节阀门的开关可以实现早期序列对最终结果的影响。
通过设定LSTM模型学习率lr为0.006对测试集进行预测,在测试集中,正常点数为1256个,偏移点数为99个,异常点数为85个;在预测结果中,正常点数为1198个,偏移点数为130个,异常点数为112个。模型准确率为95.38%。
对5组数据利用LSTM进行预测,平均准确率为95.49%,表明模型预测准确率较高,可以对压力传感器运行状态进行较准确的预测。
将压力传感器全寿命发展历程可以划分为3个阶段,通过提取相同间隔的压力传感器数据,并以偏差率作为研究变量,由图3正常期阶段设备运行时长为240h;根据所设定的数据类别准则,利用公式(1)设置报警阈值,定义若连续5h内均为异常点则下一时间为退化起始点,当运行时长约为264h时,轴承开始退化,随着退化系数逐渐增大,当偏差率超过失效阈值时,此时轴承已不能继续工作,此时工作时长为412h。压力传感器的寿命如图3。
图3 压力传感器寿命预测图
本文通过对压力传感器的运行状态利用时间序列分析和机器学习LSTM模型进行建模,根据模型结合数据分类准则对数据类别进行区分,计算模型的精度,通过对比结果,时间序列分析AR(7)模型结果更加可靠、精确,充分利用时间序列分析的优越性挖掘数据之间的关联性,尽可能准确预测数据类别,并对剩余寿命进行判断,在实际生产中,可以充分挖掘数据之间的有关信息,为工业生产提供了更加准确的参考意见。
采用多组数据对模型进行训练,并计算各个阶数的模型误差值,提高模型预测的准确率,是学术知识直接指导实际生产,实现科技转化的项目;采用模型对压力传感器进行预测,解决工厂传感器无法预知工作寿命的问题,更好地指导工厂生产。