基于改进XGBoost的注塑机液压系统故障诊断研究

2023-08-21 01:50欧阳琦张倍培刘晋康黄昌隆
机械设计与制造工程 2023年7期
关键词:注塑机麻雀故障诊断

欧阳琦,张倍培,刘晋康,袁 栋,黄昌隆

(河海大学机电工程学院,江苏 常州 213022)

随着工业技术日益成熟,液压和电子控制等技术结合更加紧密,设备出现故障的原因越来越复杂,发生的故障更难以诊断和排除,而液压系统较机械、电气系统出现的故障更为隐蔽,当采用传统技术诊断时,会占用大量的维修时间,造成巨大的经济损失[1]。注塑机作为将高分子材料制成各类塑料制品的主要成型设备,在塑料工业发展中占有重要地位。液压系统作为注塑机的核心部件,其能否稳定运行直接关系到注塑机性能的优劣。调研某注塑机维修厂的维修数据[2]发现,其253条液压系统历史维修记录中,阀门滞后故障为70次,冷却效率降低故障为63次,泵泄漏故障为55次,液压储能器降压故障为50次,其他故障共15次。分析以上数据可知,液压系统阀门切换故障发生的频次较高,其一旦发生故障将影响注塑机液压系统的稳定性,导致达不到正常工作的注塑压力,而且排查液压系统阀门故障需要花费大量的人工检修时间,严重影响企业的生产效率,因此实现对液压系统故障的快速诊断显得尤其重要。

针对液压系统故障隐蔽难以准确诊断等问题的研究,王杰等[3]提出了一种基于PID控制的注塑机液压系统故障诊断方法,通过快速调节伺服控制器的PID参数完成了对注塑机液压系统振荡的消除;张鑫[4]提出了一种基于改进径向基函数(RBF)神经网络的故障诊断方法实现了对液压系统泵源故障和管道故障的准确分类与预测;李明骏等[5]提出的一种基于PSO-SVM模型的液压系统诊断方法有效增强了对故障信号特征的提取,实现了故障类型的精准识别;杨玲[6]通过利用XGBoost诊断算法对注塑机液压系统进行故障诊断,克服了传统诊断模型泛化能力弱的缺点。但许多学者在实际应用中发现,XGBoost算法受超参数的约束导致其在故障诊断方面的性能不能得到最大化。因此,本文以注塑机液压系统阀门故障诊断为例,利用麻雀搜索算法(sparrow search algorithm,SSA)优化XGBoost的相关超参数,将参数优化后的XGBoost应用于注塑机液压系统故障诊断,以验证SSA优化XGBoost算法具有一定的可行性,可以实现对液压系统故障的准确诊断。

1 基于改进SSA优化的XGBoost

1.1 XGBoost算法

XGBoost[7]是基于决策树模型的梯度提升算法,它被广泛应用在滚动轴承故障诊断、发动机故障预测等领域[8-9]。

假设注塑机液压系统的故障数据集为E={(xi,yi):xi∈Rm,yi∈R},其中Rm为特征空间,数据子集xi对应的标签为yi,则T棵回归树最终的故障预测结果为:

(1)

(2)

通过加入二阶泰勒展开式,进行k次迭代训练,可改写目标函数如式(3)所示:

(3)

式中:gi为损失函数的一阶导函数,Ij表示属于第j个叶子节点的所有样本xi划入到一个叶子节点中的样本集合,hi为损失函数的二阶导函数。

对式(3)求偏导,将等于0时的wj值代入得到式(4),以该式判断树的结构好坏。

(4)

式中Obj的值越小代表树的拟合精度越好。

1.2 麻雀搜索算法

SSA[10]是一种受到麻雀种群捕食机制启发而提出的群智能优化算法。基本SSA可描述为具有预警机制的探索者和追随者模型。在整个麻雀种群中拥有较高能量储备(适应度)的个体被定义为发现者,发现者所占比例通常取为20%,其位置更新公式如式(5)所示:

(5)

除发现者外,剩下个体均为加入者,其位置更新如式(6)所示:

(6)

除加入者和发现者外,在种群中随机选择10%~20%的麻雀作为预警者,预警者位置更新描述如下:

(7)

式中:β为步长控制参数,服从N(0,1)正态分布;K为一个介于-1和1之间的随机数;σ为一个确保分母不是0的极小常数;fi为第i只麻雀的适应度值;fb、fw分别为当前最优适应度值、当前最差适应度值。

1.3 改进Tent混沌初始化种群

Tent混沌映射是一种分段线性的一维映射,其产生的伪随机序列具有运算速度快、序列分布均匀的特点,更适合大数据集的运算处理[11]。

Tent混沌映射定义如式(8)所示:

(8)

式中:xn为第n次映射的函数值,n为当前映射次数。

针对Tent混沌映射的范围较小、涉及参数少,同时会有小周期和不稳定周期点等问题[12],张娜等[13]提出利用随机函数rand(0,1)改进Tent混沌映射,改进后的Tent映射特性如图1所示。受此启发,本文利用改进Tent混沌映射对SSA中的种群进行初始化,以弥补SSA易陷入局部最优的缺点。改进后的麻雀初始种群计算式为:

图1 Tent混沌序列分布

(9)

式中:zn+1为第(n+1)个粒子的初始位置,rand(0,1)为[0,1]中的随机数,N为混沌序列中的粒子个数,lb和ub分别为搜索空间的下限和上限。

1.4 SSA优化XGBoost模型

鉴于XGBoost的超参数繁多,全部优化既会对计算机造成较大的运算负荷又会导致过长的参数寻优时间,本文最终选取4个对XGBoost模型性能影响较大的超参数进行优化,XGBoost各超参数拟定的参数寻优空间见表1。

表1 XGBoost超参数寻优空间

SSA优化XGBoost的故障诊断模型流程图如图2所示。具体步骤如下:

图2 SSA优化XGBoost的故障诊断模型

1)利用改进Tent混沌初始化麻雀种群数量,设置搜索空间维度N、最大迭代次数P等。

2)对XGBoost的4个超参数进行初始化并给定寻优范围。

3)对分别代表XGBoost超参数的4只麻雀的适应度进行计算并记录此刻的位置。

4)在迭代过程中更新发现者、加入者以及侦察者的位置。

5)对麻雀新位置的适应度值进行计算,若为最优则更新到此位置。

6)更新整个麻雀种群的适应度值及其位置。

7)判断是否完成迭代,若不满足返回步骤4)继续迭代。

8)迭代完成最终得到XGBoost最优超参数组合,更新超参数建立最佳XGBoost故障诊断模型。

2 实验验证及分析

2.1 模型实验数据

本文所用数据集来源于Kaggle机器学习平台,该数据集是由专业的企业工程师在注塑机液压系统真实生产场景下通过搭建实验平台所获得,总计2 205组数据。每组数据包含17个属性列1个标签列。属性列包含6个压力传感器(PS1~PS6),4个温度传感器(TS1~TS4),2个体积流量传感器(FS1、FS2)和电机功率传感器(EPS1)、振动传感器(VS1)、效率系数传感器(SE)、冷却效率传感器(CE)以及虚拟冷却功率传感器(CP)各1个;1个标签列为2号三位四通电磁换向阀门故障类型。各传感器在实验平台中的布局如图3所示。

图3 传感器实验平台示意图

为了获得更好的基分类器,在这里将2 205组故障数据随机划分成训练集(1 764组故障数据)和测试集(441组故障数据)。注塑机液压系统液压阀门故障类型标签分别为阀门正常、阀芯磨损、阀芯泄漏和阀芯卡死4种情况,依次编号为0、1、2、3。训练集和测试集样本分布见表2。

表2 样本数据的分布

2.2 特征选择

对于模式识别系统, 一个好的学习样本能让分类器得到更好的训练效果。由于样本中是否存在不相关或冗余信息直接关系到分类器的性能,因此进行特征选择尤其重要[14]。在XGBoost集成算法中,如果一个特征被评选为分割点的次数越多,则可以认为这个特征越重要。将预处理之后的17个传感器数据作为XGBoost模型的特征输入,对每个传感器的重要性进行评分并筛选,结果如图4所示。

图4 故障特征重要性排序

根据信息价值相关性理论可知,Score值低于100的特征影响力可以忽略不计,所以将样本中的TS4、TS3、PS6、PS4为4个特征剔除,以便提高模型训练速度与诊断精度。

2.3 XGBoost故障模型优化前后对比与分析

通过Python对XGBoost编程,将441组测试样本分别输入到优化前后的XGBoost模型中,得到图5所示的注塑机液压系统阀门故障诊断准确率对比图。从图5可知,改进XGBoost故障诊断模型在4种故障类型上的诊断准确率均优于XGBoost故障诊断模型,其中“阀芯磨损”故障诊断准确率改善最为明显,提高了2.9%。

图5 XGBoost优化前后诊断准确率对比

从图6可以看出,改进XGBoost模型经过7次迭代后,其训练误差趋向收敛;未经过优化的XGBoost模型经过60次迭代误差才趋向收敛,即经过参数优化之后的XGBoost故障诊断模型具有更快的收敛速度。由于只凭借准确率的高低与收敛速度的快慢无法判定出算法的性能,因此需要绘制算法的受试者工作特征曲线(ROC),通过对比曲线并计算显现区域面积(AUC),从而综合判定出算法的性能优劣,AUC数值越大,诊断模型性能越好[15]。通过比对图7中XGBoost改进前后的ROC,可以看出改进XGBoost的AUC值高达0.997 7,相比于XGBoost有所提高,说明改进XGBoost模型在对注塑机液压系统进行诊断分析方面具有更好的性能。

图6 XGBoost优化前后损失函数对比

图7 XGBoost改进前后的ROC对比

3 结束语

本文给出的机器学习参数优化方案普适性较强,为提高SSA的寻优性能、优化XGBoost的超参数提供了一种新的解决方法。经实验论证得出以下结论:1)改进Tent混沌映射可以有效提高麻雀个体和算法整体的搜索能力;2)经过参数优化之后的XGBoost故障诊断模型具有更好的诊断性能。但是,目前的研究工作仅通过较为简单的实例来验证方案的可行性,要真正地体现实践应用价值,还需要尽可能和相关企业联合做些试验进行验证。

猜你喜欢
注塑机麻雀故障诊断
注塑机料筒温度控制系统的设计与实现
拯救受伤的小麻雀
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
1958年的麻雀
麻雀
紧盯着窗外的麻雀
因果图定性分析法及其在故障诊断中的应用
基于单神经元自适应PID控制的注塑机合模机构
液压注塑机伺服控制系统设计
基于LCD和排列熵的滚动轴承故障诊断