基于SVM的EPC项目安全风险评价研究

2023-05-18 08:08徐红玉邓跃彦谢定坤
关键词:样本函数评价

方 俊,徐红玉,邓跃彦,胡 军,谢定坤

(1.武汉理工大学 土木工程与建筑学院,湖北 武汉 430070;2.宁夏建设投资集团有限公司,宁夏 银川750003)

经济全球化背景下,EPC(engineering procurement construction)工程总承包模式作为一种低时耗、低资源消耗、高度集成化的工程管理模式,可集成管理设计、采购与施工三大业务,被各国建筑业发展大力推广。然而一直以来,建筑业安全事故发生率高居不下,尤其EPC工程总承包模式下的工程项目往往涉及更大的建设规模和更为复杂的建设情况,使得安全事故造成的后果和损失更为严重,各国每年因建筑安全事故所导致的巨大的人员伤亡数和经济损失额引起了人们的关注与重视。根据我国住房和城乡建设部公开数据,2017—2019年全国建筑施工安全生产事故共2 199起,死亡2 551人,且事故起数和死亡人数呈现逐年递增趋势。可见当前工程建筑安全生产管控现状仍然较为严峻,降低建筑业安全事故率、提高工程项目安全管理水平是世界各国都迫切需要解决的问题。对此,美国学者BRAGATTO等[1]基于Bowtie模型研究了如何为小企业建立安全管理系统的问题;TOUTOUNCHIAN等[2]提出一个初步的概念模型确定了EPC项目不同阶段的安全管理成本及其权重因素;国内学者林涛[3]对建筑工程项目安全评价技术体系的总体框架进行了设计;张梦雨等[4]建立了施工工种安全评价模型,按工种的不同对工程安全特性进行分解;夏杨等[5]应用云计算和BIM技术研究了建筑工人高空作业安全管理;方俊等[6]对建筑工地高空坠落的人因安全风险关键因素作了识别研究;曹洋等[7]集成BIM与AR技术构建出一套施工安全管理系统;齐锡晶等[8]针对EPC模式下的工程项目设计了整套的安全生产管理系统。上述研究在EPC项目安全风险评价方面还不完善,无论是安全因素识别或安全管控系统构建方面,学者们多集中于工程施工阶段的研究,鲜有系统、全面地对工程项目的设计、采购、施工3个阶段作贯通性的安全评价与管控研究,且现有工程项目风险评价研究中大多采用层次分析法、模糊综合评价法,以及BP神经网络、贝叶斯等评价方法[9-12]。笔者将支持向量机(SVM)算法引入到EPC项目的安全风险评价研究,拟在建立EPC项目安全风险评价指标体系的基础上,构建基于SVM的EPC项目安全风险评价模型,并结合具体案例验证其有效性,以期提高EPC项目施工安全风险水平的预测能力,减少建筑业工程安全事故。

1 EPC项目安全风险评价指标体系

为科学客观地选取EPC项目安全风险因素,首先,通过CNKI检索主题“EPC项目安全风险”,得到44篇相关高质量文献(中文核心期刊),而其中属于建筑科学与工程领域的相关文献仅6篇。其次,由于可供参考EPC项目安全风险主题相关文献较少,不足以支撑主题分析,笔者将主题范围扩大至“工程安全风险”与“项目施工安全”,得到近5年相关文献74篇,发现目前关于工程项目安全方面的研究多集中于施工阶段,而设计、采购阶段的相关研究不足。最后,利用Citespace主题和关键词聚类功能对这些文献进行统计分析,通过词频排序和中心度聚类得到排序结果和聚类结果,并按照“4M+1E”事故要素理论,人工初步筛选出27个EPC项目施工安全风险因素。通常情况下,EPC施工项目安全风险类似于一般工程项目,即人为和机械设备的因素是工程安全事故发生的直接致因,技术、管理和环境因素是间接致因,EPC项目施工阶段安全风险因素汇总如图1所示。

图1 EPC项目施工安全风险因素

通过搜集EPC项目历史资料并对历史EPC项目安全风险事件的表现形势和形成原因等进行分析整理,提取出一套包含设计、采购、施工3个阶段共37个指标在内的比较完整的EPC项目安全风险评价指标体系。邀请10位EPC领域和工程安全管理研究领域的专家对上述EPC项目安全风险评价指标重要性进行排序,其中包括项目经理2名、技术负责人3名、安全负责人3名、教授2名,各专家的基本信息调查如表1所示。基于10位权威专家的建议,结合EPC项目安全管理特点,对EPC项目安全风险因素进行进一步的筛选和修正,按照科学性、突出性和可操作性原则最终确定了EPC项目安全风险核心评价指标共有30项,评价指标体系如表2所示。

表1 打分专家基本信息

表2 EPC项目安全风险评价指标体系

2 基于SVM的安全风险评价

2.1 支持向量机理论基础

支持向量机(support vector machine,SVM)是一种基于统计学习理论的机器学习方法,属于靠实际数据驱动的二分类数学模型,其基本模型是定义在特征空间上的间隔最大的线性分类器。其基本原理是求解出能够正确划分训练样本集并使不同类别的样本点几何间隔最大的分离超平面,如图2所示。使两类样本中最近的点离其距离最大化的面w·x+b=0即为最优超平面,而那些距最优超平面w·x+b=0最近的点就是支持向量。

图2 SVM最优分类面示意图

根据最优超平面的不同,支持向量机可分为线性支持向量分类机和非线性支持向量机。线性可分样本构成的特征向量集合T={(x1,y1),(x2,y2),…,(xn,yn)}。其中,xi∈T为第i个特征向量;yi∈{-1,1}为类别标签,当yi=1时为正例,yi=-1时为负例,i=1,2,…,n。此时,SVM线性判别函数的一般形式为H(x)=ax+b,则分类面为ax+b=0。最优分类决策函数为:

(1)

式中:sgn为符号函数;ξi为每个样本的拉格朗日乘数;b为分类阈值。

若最优超平面非线性可分,则可通过核空间理论将目标问题转化为高维空间的线性问题来寻找最优超平面。高斯核函数可以将数据映射到无限维,是解决高维度问题的一种常用核函数,也称径向基函数(RBF)。此时,向量内积可以用核函数K(xi,xj)代替,则相应的最优决策函数为:

(2)

式中:K(xi,xj)=(xix),即非线性核函数。

2.2 SVM在EPC项目安全风险评价中的适用性分析

基于SVM的安全风险评价模型能够较全面地考虑所有的EPC项目风险因素,且能够挖掘出相关因素之间存在的显性或隐含的数量关系。同时,SVM模型相对于BP神经网络等其他模型需要的学习样本更少,这很大程度上减轻了研究者收集项目样本数据的工作量和难度。而且SVM算法具有自学习、自适应的优点,对于非线性关联小样本问题有较强的泛化能力,能较好地克服各个EPC项目安全风险因素之间非线性的关联关系,使评价结果更加准确和客观。从已有研究来看,学者们将SVM方法应用于建设项目施工安全风险评价和预警[13-14]、化工企业安全预警模型研究[15],以及交通安全预测研究[16],均取得了良好的研究效果。因此,笔者合理认为SVM对于EPC项目安全风险评价研究而言是一种较为合理且适用的方法,通过在SVM中引入指标体系中的安全因素,进行SVM训练,最终输入待评价数据得出相应的预测结果,如此能够有效地对EPC项目的安全问题进行全面、科学的评价,为工程总承包单位提供有效的决策借鉴。

2.3 基于SVM的EPC项目安全风险评价模型构建

SVM模型建立于一定的样本基础之上,先以一部分样本作为训练学习样本,另一部分作为检验样本,当训练样本达到所要求的精度时即构建出了目标模型。将SVM算法应用于EPC项目安全风险评价的流程如图3所示。

图3 SVM模型学习与评价流程图

由图3可知,风险评价基本思路是:①基于EPC项目安全风险评价指标体系,将各安全风险指标特征值作为SVM的输入向量,再利用已经训练好的目标模型输出EPC项目安全风险的评价标准值即可。在进行SVM模型训练之前,首先邀请相关专家根据EPC项目数据样本,结合评价指标体系对每一个指标进行打分;②利用Matlab中的LIBSVM工具箱对指标评分值做归一化处理,即把指标线性拉伸至[0,1];③定义核函数K(xi,xj)、不敏感损失函数ε以及相应的误差检验标准,对归一化处理后的一部分样本进行训练学习,当达到既定的训练精度要求时,SVM自适应性能得到不断优化使得不同的输入向量可以得到不同的输出值,达到稳定状态,该模型即可作为EPC项目安全风险评价模型;④将训练样本以外的指标特征值即检验样本输入到已训练好的SVM模型中,即可得到评价结果。

3 案例应用

3.1 数据描述

为检验SVM算法小样本学习和泛化能力,一般提取训练样本10~50个不等、检验样本5~10个不等[17],笔者选取武汉市近10年EPC工程总承包项目中具有代表性的20例进行安全风险情况分析。依据构建的评价指标体系,再次邀请筛选指标的10位行业内权威专家根据这20个EPC工程的项目建议书、可研报告以及项目后评价报告等实际项目资料并结合自己的专业经验,对30个安全风险指标进行打分(百分制),以保证数据的客观性和可靠性。为量化项目安全风险指标,将EPC工程总承包项目划分为5个等级,分别为低风险、较低风险、中等风险、较高风险和高风险,对应数值分别为1、2、3、4、5。所选项目的安全风险指标经专家打分后的原始数据如表3所示。

表3 EPC项目安全因素专家评分数据

由于EPC项目安全风险评价指标量纲不同且各指标值之间存在差异,因此采用Matlab软件运用比例转换法将原始数据进行标准化处理,即将其缩至区间[0,1],结果如表4所示。

表4 对表2数据进行归一化处理后的结果

3.2 核函数及参数选择

按照SVM模型训练与安全风险评价流程,对选取的20个EPC工程项目进行安全风险评价。首先是核函数的选择,高斯核函数即RBF函数是LIBSVM工具箱所提供的4种核函数中唯一具备平滑性的函数,可以将数据映射到更高维空间中,有效解决高维度非线性关系问题,且RBF相关参数较少,计算难度相对其他函数较小。因此,笔者将RBF选作SVM的核函数:

(3)

式中:σ为RBF的均方差。σ值越小表示RBF核函数拟合性能越好,反之则越差,但当σ值过小时,会弱化RBF核函数的泛化能力,影响模型检验结果。

选定核函数RBF后,利用RBF函数对学习参数C和g的数值进行确定。根据LIBSVM的输出结果,最终得到最优学习参数C=75,g=0.8。

3.3 模型训练

选取样本组前12个样本数据作为SVM训练集,其余8个作为测试集,运用Matlab7.0软件实现核函数的选取、SVM训练以及决策函数的构建。通过对12个学习样本的训练,代入测试样本即可输出其安全风险识别的结果,预测效果如图4所示,可以看出经学习样本数据训练好的SVM模型,预测8个测试样本,其中有7个预测准确,得到基于SVM的EPC项目安全风险评价模型准确率为87.5%。由此表明,将SVM算法应用于EPC项目的安全风险评价具有良好的可行性和有效性。

图4 训练集与测试集样本

4 结论

(1)基于文献分析和历史项目资料分析,在咨询相关专家意见的基础上确定了涵盖30个安全风险因素的EPC项目安全风险评价指标体系,接着分析了SVM算法应用于EPC项目安全风险评价的适用性,阐述了应用SVM进行安全评价的具体流程,并构建了SVM评价模型,把对安全事故的“事后管理”变为风险“事前预控”为主。

(2)选取武汉市20个具有代表性的EPC项目作为模型样本,并将RBF函数选作SVM的核函数,运用Matlab7.0程序对该SVM模型进行训练。结果表明:经训练好的SVM模型预测准确率可达到87.5%,能够较好地预测测试集样本的安全风险程度。

(3)应用SVM对EPC项目安全风险进行全方面、多阶段的评价研究,一定程度上突破了建设工程项目安全风险研究仅存在于施工阶段的局限,同时验证了将SVM应用到EPC项目安全风险评价研究的可行性和有效性。

(4)研究是对20个EPC项目的小样本数据进行采集,未来的研究中可适当增加SVM训练样本数量,以提升模型预测的准确率和稳健性;同时,结合当代先进的信息技术,建立项目安全数据库,进一步构建EPC项目安全事故预警系统,以提升安全预警效果。

猜你喜欢
样本函数评价
二次函数
第3讲 “函数”复习精讲
用样本估计总体复习点拨
中药治疗室性早搏系统评价再评价
二次函数
函数备考精讲
推动医改的“直销样本”
随机微分方程的样本Lyapunov二次型估计
村企共赢的样本
基于Moodle的学习评价