邵啸峰
(深圳市消防支队,广东 深圳 518028)
基于海恩法则的大数据分析在火灾预防领域的应用
邵啸峰
(深圳市消防支队,广东 深圳518028)
基于海恩法则,应用关联规则数据挖掘理论,构建了一个在大数据基础上,轻微事故、事前征兆、事故隐患、火灾发生4个因子之间相互关系的分析与计算模式。计算结果形成分析表格,当以上4个因子中有1个被发现时,安全人员即可以按照关联度大小迅速查找与之相关的其他因素并加以整改,提高安全检查效率,增强火灾预防的针对性。
消防员;海恩法则;关联规则;火灾预防
近年来我国危险化学品与石油化工火灾频发,消防安全形势面临前所未有的挑战。2015年以来,福建古雷腾龙芳烃PX项目火灾,南京扬子石化火灾等重大化工火灾接连发生,特别是2015年天津港“8·12”瑞海危险品仓库特别重大火灾爆炸事故,惨烈的人员牺牲刺痛了全国人民的神经。每次火灾过后,都会开展各种专项整顿活动,但效果却越来越不明显,这说明,在新的形势下,危险化学品与石油化工火灾的预防需要新的科学理论的指导。
在海恩法则的启发下,本文依托关联规则理论和大数据分析方法,构建了一个可以应用于危险化学品与石油化工火灾预防的数据挖掘模式,深入分析危险化学品场所与石油化工场所的火灾关键因素及其背后的关联关系,为预防危险化学品与石油化工火灾提供理论参考。
1.1海恩法则
在安全领域,有一个重要的理论叫“海恩法则”。海恩法则认为,每一起严重事故的背后,必然有29次轻微事故和300起未遂先兆以及1 000起事故隐患。海恩法则还认为,任何不安全的事故都是可以预防的。虽然社会发展到今天,事故与隐患的比例早已不能套用当初的统计结果,但海恩法则的基本精神仍然得到了安全领域各界的高度认可,即事故与隐患存在着必然的关系。
海恩法则对安全预防来说是一种警示,它说明任何一起事故都是有原因的,并且是有征兆的。它同时说明安全生产是可以控制的,安全事故是可以避免的。它也给了安全管理者一种方法,即发现并控制征兆。
当前火灾调查往往只调查直接原因,但是海恩法则告诉我们,任何火灾事故都不是某个单独因素导致的,而往往是一连串的失误所造成。只重视对事故本身进行总结,按照总结得出的结论“有针对性”地开展安全大检查,却往往忽视了对事故征兆和事故苗头进行排查;而那些未被发现的征兆与苗头,就成为下一次火灾事故的隐患。所以在进行火灾事故原因调查时,还应该调查相关联的一些因素,包括事前发生的轻微事故、事前征兆和事故隐患。
1.2关联规则
关联规则是一种起源于购物篮分析的现代化的大数据挖掘技术,意在寻找表面上不相干的各种因素背后的关联关系。关联规则挖掘技术最初被应用在西方金融行业中,帮助银行家准确地预测客户的需求,后来逐步广泛应用在众多领域。电子购物网站使用关联规则进行挖掘,然后设置用户有意要一起购买的捆绑包,也有一些购物网站使用它们设置相应的交叉销售,也就是购买某种商品的顾客会看到相关的另外一种商品的广告。近年来,关联规则已经成功地在安全领域发挥了重要的作用。
根据韩家炜的观点,关联规则定义为:假设I={I1,I2,…,Im}是项的集合。给定一个交易数据库D,其中每个事务(Transaction)T是I的非空子集,即每一个交易都与一个唯一的标识符TID(Transaction ID)对应。关联规则在D中的支持度(Support)是D中事务同时包含X、Y的百分比,即概率;置信度(Confidence)是D中事务已经包含X的情况下,包含Y的百分比,即条件概率。提升度(Lift)表示含有X的条件下同时含有Y的概率与Y的概率的比,即Lift(X-Y)=Confidence(X-Y)/Support(Y)。如果满足最小支持度阈值和最小置信度阈值且提升度大于1,则认为关联规则是有效的。阈值根据挖掘需要人为设定。
关联规则挖掘过程主要包含两个阶段:第一阶段必须先从资料集合中找出所有的高频项目组(Frequent Itemsets),第二阶段再由这些高频项目组中产生关联规则(Association Rules)。在最小置信度(Minimum Confidence)的条件门槛下,若一规则所求得的置信度满足最小置信度,称此规则为关联规则。
1.3Apriori算法
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法,其核心是基于两阶段频集思想的递推算法,从而产生只包含集合的项的所有规则。
1.4德尔菲法
德尔菲法(Delphi Method),又称专家规定程序调查法。该方法主要是由调查者拟定调查表,然后按照既定程序,以函件的方式分别向专家组成员进行征询;而专家组成员又以匿名的方式(函件)提交意见。经过几次反复征询和反馈,专家组成员的意见逐步趋于集中,最后获得具有很高准确率的集体判断结果。
德尔菲法是20世纪40年代由O·赫尔姆和N·达尔克首创,经过T·J·戈登和兰德公司进一步发展而成的一种高效率分析方法。德尔菲法克服了在专家会议法中经常发生的专家们不能充分发表意见、权威人物的意见左右其他人的意见等弊病,使各位专家能真正充分地发表自己的意见,形成较为科学的研究成果。德尔菲法的具体实施步骤一般有7步:(1)确定调查内容和纲要;(2)组成专家小组;(3)向专家提出问题和要求;(4)收集专家意见;(5)汇总专家意见,进行对比,再将意见以匿名方式分送给专家,以便他们参考后修改自己的意见;(6)重复第5步的收集意见和反馈程序,一般进行3到4轮,直到每个专家不再修改自己的意见为止;(7)对专家的意见进行综合处理。
通过海恩法则,我们知道通过发现并控制征兆和消除隐患,可以实现事故的预防,所以,第一步要查找出可能导致事故的征兆和隐患因素。如果把“隐患和事故征兆”无限扩大化,不仅会导致安全管理者疲于应付,抓不住重点,更会导致企业成本的几何级上升。当安全成本高到正常的生产活动无法进行时,安全工作也就失去了存在的基础。显然,火灾隐患和事前征兆因素的查找越精确,安全管理的成本越低,效率越高,也越具有可持续性。
2.1运用德尔菲法获取专家意见
要正确合理地查找出所有轻微事故、事前征兆、事故隐患因素,可以组成一个专家小组,运用德尔菲法获取专家意见并形成一个表格,分析各种火灾原因在导致火灾前可能会出现的轻微事故、事前征兆和存在的事故隐患。这个表格的作用在于,在下一步进行事故调查时,有一个指导性的调查方向,方便调查开展,避免调查中产生遗漏。
假设将轻微事故用Ai表示,事前征兆为Bi,事故隐患为Ci,则构建的对应表格如表1所示。为方便分析,可以将表格和所对应的火灾原因,火灾发生时所处的生产环节、所处的生产区域等也建立起对应的关系。
表1 火灾发生前相关事故与相关征兆因素对应表
2.2收集调查数据构建表格
利用上一步形成的表格,对需要研究的危险化学品火灾或者石油化工火灾进行调查。如果在调查中发现某些重要因素没有在表格中体现,可以随时对表格内容进行补充和完善。表格建立后,将表格与每次发生的火灾建立联系,火灾用F表示,见表2。
表2 火灾事故与火灾发生前相关事故及相关征兆因素对应表
2.3利用关联规则对调查数据进行分析
通过前面介绍的方法,使用IBM公司SPSS Modeler软件建模,分析F、A、B、C之间的关系。下面以A、C间的关系为例,进行分析。
2.3.1找出高频项目组
首先利用现场记录中的信息构建布尔矩阵,矩阵中行代表项目,包括轻微事故A1|A2|…|An|和事故隐患C1|C2|…|Cn|。矩阵中列代表所对应的因素,即历次调查所记录的信息,根据每条信息记录,矩阵中的数字1表示项目出现,0表示项目不出现,每行中均包含数字1的项目代表其同时出现。假设布尔矩阵如表3所示。
表3 轻微事故与事故隐患关联规则布尔矩阵
2.3.2产生关联规则
支持度可以反映项目间的强/中/弱链接。强中弱链接的数据标准由研究人员依据工作经验和实际需要进行设定。设置轻微事故为先导项,事故隐患为后继项,假设支持度0.08(含)以上为强链接,支持度0.05(不含)以下为弱链接,支持度小于0.08并大于等于0.05为中链接(支持度划分可以根据需要进行调整)。在软件中导入已构建的布尔矩阵,通过关联关系网络模型,计算得到在不同轻微事故中各种异常征兆因素的支持度大小,并反映出强/中/弱链接,如表4所示。
设定频繁项集后,在软件中通过Aprori算法,分别求出置信度和支持度。
表4 不同轻微事故中异常征兆因素的
当Lift(Ai-Ci)=Confidence(Ai-Ci)/Support(Ci)>1,且置信度和支持度达到预设值时,则认为该链接是有效的强规则项。根据相关经验和专家意见,一般将最小置信度值设置为0.2。
通过关联规则分析,可以得到与火灾发生关系最紧密的轻微事故类型数据;轻微事故发生前,最常见的征兆数据;事前征兆发生时,最可能的潜在隐患数据。通过关联规则还可以直接分析事故隐患与火灾发生之间的关系、事前征兆与火灾发生之间的关系。按照概率从大到小的顺序,逐一进行治理整顿,彻底消除火灾隐患,步骤如下:(1)与火灾发生具有强链接的因素(轻微事故、征兆、隐患)作为最优先整顿治理对象,在生产中发现此类因素时,应立即进行整改和查找原因;(2)与火灾发生具有中链接的因素(轻微事故、征兆、隐患)作为次优先整顿治理对象,在生产中发现此类因素时,应限期进行整改和查找原因,并在整改前做好防火工作;(3)轻微事故发生时,可以根据分析结果,按照从强链接到弱链接的顺序分析查找事前征兆,提高调查效率,并分析与征兆有关联的隐患,加以整改;(4)当发现事故征兆时,按照从强链接到弱链接的顺序分析查找事故隐患,提高调查效率,并限期整改。
本文构建了一个具有极高精确度的危险化学品与石油化工火灾的事前防范项目分析方法,其操作难点在于数据的获取具有较大困难,需要在较大范围、较长时间跨度上收集数据进行大数据分析,数据样本越多,则分析结果越具有指导价值。当前信息技术飞速发展,各种视频、图像、记录、分析等原始数据的获取成本越来越低,也越来越便捷。若各个涉事单位、监管部门能打破各种顾虑,特别是监督管理和调查部门能打破行政壁垒,以高度的责任感和紧迫感主动分享数据,则只要能够积累到数十次相关火灾事故的调研数据,本文所叙方法就能够发挥重要作用。通过关联规则分析,揭示火灾前的轻微事故、事前征兆、事故隐患相互关系及其与火灾的关系,有利于企业精确化查找火灾危险因素并进行火灾预防,也可以为安全生产和消防部门的消防安全监督管理提供理论参考依据。
[1] 万小林.海恩法则的启示[J].中国城市金融,2011(1):72.
[2] 陆丽娜,陈亚萍,魏恒义,等.挖掘关联规则中Apriori算法的研究[J].小型微型计算机系统,2000,21(9):940-943.
[3] 蔡伟杰,张晓辉,朱建秋,等.关联规则挖掘综述[J].计算机工程,2001,27(5):31-33.
[4] 范茂魁,杨千红,冯时进,等.我国消防员灭火救援中伤亡情况研究[J].工业安全与环保,2015,41(2):82-85.
[5] 王志亮.灭火救援中消防员安全措施的研究[J].中国新技术新产品,2015(9):162-163.
[6] 郭聖煜,骆汉宾,滕哲,等.地铁施工工人不安全行为关联规则研究[J].中国安全生产科学技术,2015,11(10):185-190.
[7] 贾明涛.行为安全管理在施工中的应用分析[J].中国安全生产科学技术,2012,8(7):169-173.
[8] 田军,张朋柱,王刊良,等.基于德尔菲法的专家意见集成模型研究[J].系统工程理论与实践,2004,24(1):57-62.
(责任编辑李蕾)
On the Application of Big-data Analysis to Fire Fighting Prediction Based on Hine Law
SHAO Xiaofeng
(ShenzhenMunicipalFireBrigade,GuangdongProvince518028,China)
In this paper, a computing and analyzing model of a small fire, foreboding signs, fire causes and fire occurrences is formulated based on Hine Law and Mining Association Rules. An analysis table is formed in which an association degree between these elements can be known and the improvement can be done accordingly to enhance fire safety.
firemen; Hine Law; Association Rules; fire prevention
2016-05-11
邵啸峰(1979—),男,江西都昌人,工程师,硕士。
●火灾预防
D631.6
A
1008-2077(2016)08-0048-04