基于岭回归的电力生产严重违章产生因素的影响程度分析

2022-06-17 08:39缪通李捷和振芳刘争明锁帅
云南电力技术 2022年2期
关键词:回归系数违章承包商

缪通,李捷,和振芳,刘争明,锁帅

(云南电网有限责任公司红河供电局,云南 红河 661000)

0 前言

随着新《安全生产法》《刑法修正案(十一)》实施,依法治安迅速推进,国家对电力企业安全生产提出了更高要求,安全生产需要更严格的全面监管。目前,电力生产过程中的严重违章是作业人员最有可能直接发生伤亡的行为,YN电力公司结合传统的违章人员驻点监督以及可视化监督,加强了对严重违章的监督手段和力度,并配置了相应的监督资源。但目前根据作业风险等级倾斜监督资源的做法存在弊端,一是作业现场人员监督管控重叠,浪费监督资源;二是缺乏对严重违章产生根源的合理性判别依据,以致不能合理调配有限的监督资源,造成舍本逐末。为了缓解监督资源短缺和监督资源调配不当的问题,减少随机式、样本式抽查监督的弊端,需要研究严重违章产生因素的影响程度,为合理调配监督资源提供依据。研究多个自变量对因变量影响程度通常使用线性回归进行分析,回归分析中一般采用最小二乘法估计模型的参数,但实际分析过程中,由于施工人员类别、资质及作业风险量化的数据间存在共线关系,如果运用最小二乘法估计模型的参数,可能部分参数会存在异常,不能反映客观实际。岭回归可以较好地解决这一问题,回归的系数可以客观反映自变量与因变量的关系,符合客观现实,在许多领域得到了广泛应用。因此,本文采用岭回归分析承包商作业、无三种人资质作业及高中风险作业对YN电力公司发生严重违章的影响程度,并利用回归结果提出监督资源的调配依据。

1 岭回归分析原理

岭回归是一种专用于共线性数据分析的有偏估计回归方法,是对最小二乘估计法的优化,它通过放弃最小二乘法的无偏性优势,以损失部分信息、降低拟合精度为代价,换来回归系数的稳定性,回归系数更符合客观实际,更为有效可靠,对病态数据的拟合要优于最小二乘法。

多元线性回归模型可表示为:

式中:Y表示因变量;X是自变量;β是回归系数;ε是误差。

回归系数β的值采用最小二乘法可表示为:

当自变量之间的线性相关性比较大时,XTX的行列式接近于0,即XTX接近于奇异,此时,计算(XTX)-1时误差会很大,传统的最小二乘法缺乏稳定性与可靠性。也就是样本数据存在个别病态数据,就可能导致回归系数β产生很大的偏差,此时,回归系数无法客观的反映自变量对因变量的影响。岭回归优化的具体方法就是让残差的平方加上一个正则化项,即 ||Xβ-Y||2+||kIβ||2,使矩阵的特征值变大,提高回归系数β的稳定性。使得分析结果能更贴近于实际。于是回归系数β求解的表达式为:

式中:I为单位矩阵;k为岭回归系数,随着k值的增大,共线性对因变量的影响逐渐减小,但k值的不断增大也会使预测的偏差逐渐变大,因此选择恰当的k值极为重要,β随着k值的改变而变化的轨迹,就称为岭迹。实际计算中可选非常多的k值,做出一个岭迹图,看看该图在取哪个值的时候变稳定了,那就确定k值了。岭回归是对最小二乘回归的一种补充,它损失了无偏性,来换取高的数值稳定性,从而得到较高的计算精度。

2 严重违章产生因素影响程度分析

电力生产中发生严重违章的因素大致为员工安全意识差、员工安全技能水平低、监管力度薄弱,此外,较高风险的作业也容易发生严重违章行为。其中合理调配监管力度是本研究的目的,所以选取员工安全意识低、员工技能水平差、和作业风险三个方面开展分析。秉着可量化分析的原则,本文选取YN电力公司2021年度发生严重违章的346天里共58179起违章数据进行分析。考虑到承包商员工流动性较高,安全教育时长少且人员不稳定,安全意识总体而言较之员工队伍稳定的系统内员工低,员工安全意识差用每天承包商违章数量来表征;电力生产施工作业资质有很多,其中体现安全技能水平的三种人资质尤为重要,安全技能水平低用每天无三种人资质违章数量来表征;在YN电力公司里作业风险分为高、中、低、可接受风险,此处较高风险的作业用每天高、中风险作业违章数量来表征。

设每天承包商违章数量、每天无三种人资质违章数量、每天高中风险作业违章数量分别为X1、X2、X3,每天严重违章数量为Y,建立X和Y的线性回归方程,即:

2.1 最小二乘法回归分析

以YN电力公司2021年度发生严重违章的346天里违章数据为样本,通过最小二乘法计算回归系数β值,运用SPSS数据分析工具,计算得出β1、β2和β3,如表1所示。

表1 最小二乘法线性回归分析结果

从表1分析模型的显著性,如果呈现显著性(P值小于0.05,严格需小于0.01),结果中F=166.957,显著性P值为0.000,模型呈现显著性,表明自变量承包商违章数、无三种人资质违章数、高中风险作业违章数与严重违章数之间存在着明显的线性关系。同时模型的拟合度R2(代表曲线回归的拟合程度,越接近1效果越好)为0.594,模型表现较好。但β3为负值,说明高中风险作业违章数与严重违章数负相关,与实际情况不符,风险越高的作业现场越容易发生严重违章,因此,高中风险作业违章数与严重违章数应该呈现正相关。此种情况的出现,主要是三个自变量数据之间存在共线性,表1中VIF值代表多重共线性严重程度,用于检验自变量之间是否存在高度相关的关系(VIF应小于10或者5,严格为5),上表分析结果中承包商违章数、无三种人资质违章数、高中风险作业违章数的VIF分别为23.8、7.3、12.3,均大于5,说明3个自变量间存在明显的相关性。此时,用最小二乘法计算回归参数进行分析,就无法客观的反映3个自变量对发生严重违章的影响程度。

2.2 岭回归分析

首先将样本数据按式(4)进行标准转化,然后按照岭回归算法计算回归系数。设定迭代步长取0.01,以确定最恰当的岭回归系数k值。运用SPSS分析工具,得到岭迹图,如图1所示。

从图1可得,当k逐渐增大时,各自变量岭回归系数趋于稳定,根据方差扩大因子法,确定k值为0.101,即最佳岭回归系数。岭回归分析结果如表2所示。结果中显著性P值为0.000***,模型呈现显著性,表明自变量承包商违章数、无三种人资质违章数、高中风险作业违章数与严重违章数之间存在着明显的线性回归关系。同时模型的拟合度R2为0.585,模型表现较好。3个自变量的回归标准化系数分别为β1=0.367、β2=0.257、β3=0.132,岭回归估计的标准化系数值客观反映了各自变量对因变量的影响程度,由于β1>β2>β3,说明导致严重违章发生因素的影响程度从大到小依次为承包商违章数、无三种人资质违章数、高中风险作业违章数,这一结果与YN电力公司的实际情况相符。对排序结果分析,①承包商作业,大部分承包商对下属员工安全培训不足、监管不严,该类员工违章频发多发,是发生严重违章的主要群体;②无三种人资质作业,未取得三种人资质的员工普遍安全技能水平较低,实际施工中均是在具有三种人资质的人员带领下开展作业,大部分安全经验不足;③高中风险作业,值得注意的是高中风险作业对发生严重违章的影响程度最低,一是表明高中风险作业监督力度大,发生严重违章的可能性不高,二是YN公司高中风险的定级可能存在不够准确的情况,由于风险定级存在很大的主观性,数据难以客观量化,本文暂不做讨论。

图1 岭迹图

表2 最小二乘法线性回归分析结果

3 结束语

研究了YN电力公司违章中承包商作业、无三种人资质作业及高中风险作业对发生严重违章的影响程度,研究表明对发生严重违章影响程度最大的是承包商作业,影响程度最小的是高中风险作业。因此,在进行监督资源调配时要增大对承包商作业的监督力度,在确保风险定级准确的情况下适当减少对高中风险作业的监督力度,从而实现监督资源的合理分配,提升对各种作业现场的监督效能。

猜你喜欢
回归系数违章承包商
打 车
基于CONS的项目各阶段承包商风险研究
国内外企业承包商管理与实践
拷问 涂改号牌扣12分,重吗? 它可能是违章、违法的前提!
基于生产函数模型的地区经济发展影响因素分析
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
广州交警使用无人机抓拍违章车辆
城镇居民收入差距主要因素回归分析