基于RF-EL融合算法的施工升降机可靠性模型研究

2022-09-14 09:12王莉静赵海盟戴远东乐亮
中国工程机械学报 2022年4期
关键词:升降机决策树准确率

王莉静,赵海盟,戴远东,乐亮

(天津城建大学控制与机械工程学院,天津 300384)

施工升降机是建筑行业中通用的载人、载货施工机械,主要应用于城市高层、超高层建筑施工现场[1]。随着我国高层、超高层建筑施工作业的持续增加,每年由升降机引起的安全生产事故也呈上升趋势[2]。为进一步提高施工升降机的作业安全性,国内外学者在施工设备可靠性分析[3]方面进行了大量研究。Moller和Beer运用模糊集合理论,即根据模糊数学的隶属度理论把定性评价转化为定量评价,实现了可靠性的定量化评价[4];沈建荣[5]通过分析影响施工升降机的运行质量的因素,提出了一种改善运行质量的措施来提高可靠性;邓铮强等[6]建立了一套安全管理综合评价指标体系,利用改进的BP神经网络进行评价预测;程跃等[7]提出了一种基于支持向量机的非概率可靠性分析方法;翟胜等[8]提出了一种基于贝叶斯网络的多态系统可靠性分析方法,利用贝叶斯网络的多态变量节点来描述故障模式的多态性。这些可靠性分析方法虽然在其研究领域取得了有较好的应用,但由于施工升降机的设备劣化程度受运行工况、作业环境和人为操作规范性等多种主客观因素的共同制约,仅通过单一类型算法模型进行可靠性分析,其准确度较低。

因此,在2020年1月开始实施的《施工升降机安全监控系统》的国家标准规定下[9],通过采集、分析施工升降机“人-机-管理”多因素的融合数据,提出了一种基于随机森林(random forest,RF)算法及集成学习(ensemble learning,EL)融合的施工升降机可靠性分析模型,并进行相关实例分析,验证其准确性和适用性。

1 建立施工升降机可靠性指标体系

施工升降机的作业环境一般较恶劣,其运行是否可靠直接影响着施工人员的生命安全和建筑效率[10]。因此,基于专家调查法,综合分析人-机-管理3个方面因素,选取28个指标建立施工升降机可靠性指标体系,如图1所示。

图1 施工升降机可靠性指标体系Fig.1 Construction lift reliability index system

2 基于模糊理论的可靠性等级量化

施工升降机的可靠性等级引用梯形隶属函数[11]进行描述,梯形隶属函数可由4个参数确定,分别为a1、a2、a3、a4。设 模 糊 集 为Y=(a1,a2,a3,a4),且a1≤a2≤a3≤a4,则梯形隶属函数表示为

根据5名资深施工升降机专家的经验,将施工升降机的可靠性评价等级划分为5个级别,则可靠性评价等级与对应的模糊系数关系见表1。

表1 可靠性等级与模糊系数Tab.1 Reliability grade and fuzzy coefficient

3 实例分析

通过与某工程施工单位合作,采集了SCD200型号施工升降机在2020年10月—2021年10月期间的200组历史数据样本,每组样本中包含28个可靠性相关因素。首先利用RF算法对28个可靠性分析指标进行特征重要度计算,约减不重要因素,再利用基于EL的可靠性模型进行分析。

3.1 可靠性指标的选取

为避免“维数灾难”,首先利用RF算法对28个指标进行预处理,对训练样本按照随机有放回的方式进行抽取,并生成新子集进行迭代;再按照3∶5的比例对样本划分,将袋外数据作为测试集,并计算各指标重要度;最后利用平均准确率下降(mean decrease accuracy,MDA)法对每个指标的重要度进行排序,以达到降维的目的。设定参数决策树个数M为200,特征属性为log2(M+1),决策树的迭代过程如图2所示,不难发现出袋错误量在决策树数量为35后趋于稳定,此时可决系数R2为0.88,如图3所示。

图2 决策树迭代过程Fig.2 Decision tree iterative process

图3 拟合优度散点图Fig.3 Goodness of fit scatter diagram

其次,利用袋外数据对28个可靠性分析指标进行重要度计算,属性重要度结果如图4所示,其中各个指标的重要度值见表2。

图4 指标重要度分析Fig.4 Index importance analysis

表2 重要度系数表Tab.2 Importance coefficient table

根据各指标重要度系数排序,选取V19、V14、V26、V10、V9、V15、V25、V13共8个可靠性因素,故将此8个相关因素作为EL算法进行可靠性模型的输入数据,约减其余重要度低的相关因素。

最后,将筛选的8个因素数值乘以对应重要度系数,组成新的样本,并设定参数决策树个数为200,特征属性为log2(M+1),则新样本的决策树的迭代过程如图5所示,出袋错误量在决策树数量为12后趋于稳定,此时R2为0.94,相比较旧样本的R2有所提升,如图6所示,说明经过筛选后的新样本拟合优度更好,准确率更高。

图5 新样本决策树迭代过程Fig.5 New sample decision tree iteration process

图6 新样本拟合度散点图Fig.6 Scatter plot of new sample fit degree

3.2 可靠性分析模型的构建

根据RF算法得出的重要度分析结果,得到8个可靠性相关因素。在200组历史样本数据中随机选取120组数据作为训练样本,完成遗传算法优化BP神经网络(genetic algorithm-back propagation neural network,GA-BP)、粒子群算法优化支持向量机(particle swarm optimization-support vector machine,PSO-SVM)以及朴素贝叶斯(Bayesian network,BN)基学习器的训练数据,其余80组数据作为测试样本完成对算法模型的检测,数据分布如图7所示。

图7 样本数据分布图Fig.7 Sample data distribution diagram

GA-BP神经网络:引用遗传算法优化BP神经网络,将8个可靠性相关因素作为训练样本数据归一化后输入网络,可靠性等级作为输出,根据文献[12]设定GA算法相关参数。利用GA算法优化后的BP神经网络的训练集准确率为96.67%,测试集准确率为88.75%。

PSO-SVM:一般地,在SVM模型中惩罚函数C与gamma值两个参数非常重要[13],根据文献[14]的优化流程利用PSO优化SVM算法进行最优求解。设置PSO参数局部搜索能力c1为1.5,c2为1.7,最大进化数量为200,种群最大数量为20。可以得出SVM最优的惩罚函数C为64.6241,gamma值为0.20315,最佳分类准确率为93.3333%。再利用最优参数对SVM模型进行训练,训练集准确率为93.33%,测试集准确率为92.50%。

BN:贝叶斯网络实际上是一种利用对图形的推理表示变量与变量之间因果关系的模型。根据文献[15]采用故障树建模的方法来建立BN模型,对可靠性指标进行分析,首先采用交叉验证选取训练集和测试集,将测试集在总数据集的占比设为40,将分类标签转化为数据,并计算条件概率,最后对每个特征的每个取值进行数量统计,再使用测试集进行数据测试;训练集准确率为94.17%,测试集准确率为90.83%。

集成学习模型算法:将GA-BP神经网络、PSOSVM和BN进行集成使用,采用并行集成方式及学习法结合策略,使得模型可以自适应的针对多种数据做出更加准确的分类。集成学习模型训练集和检测集上训练测试结果分别如图8、图9所示。

图8 EL训练集的实际分类和预测分类Fig.8 Actual classification and predictive classification diagram of EL training set

图9 EL测试集的实际分类和预测分类Fig.9 The actual and predicted classification diagram of the EL test set

由图8、图9可知,利用EL训练的训练集准确率为99.20%,检测集准确率为97.50%。表明了EL具有较好的分类能力,不论是在训练集还是测试集中都有较高的分类准确率,避免了“维数灾难”,且具有较高的泛化能力,运算速度快,集成学习模型具有良好的鲁棒性。各学习器的数据集分类准确率结果对比见表3。

表3 各学习器的数据集分类准确率结果对比Tab.3 Comparison of data set classification accuracy of each learner %

4 结论

针对施工升降机的可靠性评价问题,提出了一种基于RF-EL算法的施工升降机可靠性分析模型,得到的主要结论为:

(1)利用RF算法对远程监控平台采集的施工升降机28个可靠性相关因素进行了量化和重要度分析,最终确定超负荷运行时间、载重量、风速、当前速度、吊笼倾角、输入电压、作业环境、故障报警次数8个相关因素,通过对8个相关因素的RF算法二次分析,R2从0.88提升至0.94,证明经过约减后的8个相关因素组成的新样本拟合更好,准确率更高。

(2)分别利用BP神经网络、SVM和BN基学习器对120组训练样本进行训练,并通过80组测试样本进行验证,在训练集中表现最好的是利用GA算法优化的BP神经网络算法,其分类准确率为96.67%;在测试集中表现最好的是利用PSO算法优化的SVM算法,其分类准确率为92.50%;再将3个基学习器集成后利用EL进行训练及验证,可得出EL在训练集中准确率为99.20%,测试集中准确率为97.50%。

(3)经过实例验证分析,证明RF-EL算法对施工升降机可靠性分析具有良好的准确性、稳定性。该模型的建立以及实际应用对保障施工升降机的高效、安全、可靠运行具有重要的现实意义。

猜你喜欢
升降机决策树准确率
简易升降机承重部件的检验案例分析
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
升降机
决策树和随机森林方法在管理决策中的应用
决策树学习的剪枝方法
决策树多元分类模型预测森林植被覆盖
浅谈建筑施工升降机的使用管理及事故预防