李 聪,徐子烜,王雨情,许文博,杨 锐
(1.中国矿业大学(北京) 应急管理与安全工程学院,北京 100083;2.清华大学 工程物理系公共安全研究院,北京 100084)
目前,城市燃气管网普遍面临着使用年限长、老化严重、线路不清晰、管理混乱等问题。根据中国城市燃气协会安全管理工作委员会发布的《全国燃气事故分析报告(2021年·第二季度报告暨半年综述)》可知,管网事故占所有燃气事故的75%,其中因第3方破坏及腐蚀导致的泄漏事故占管网事故的82.1%[1]。随着燃气管网使用年限的不断增加,燃气管网泄漏事故在未来一段时间仍将具有较大的发生可能性。在这种背景下,如何在事故发生后最短时间内对燃气管网泄漏事故进行快速准确地分析研判,对于及时有效采取应急处置策略,尽可能减少事故损失以及保障社会稳定发展有着重要意义。
国内外学者已经采取多种方法对燃气管网事故进行研究。黄忠宏等[2]提出燃气管道完整性评价指标体系,对管道现状全面评价并提出改进建议;刘海云等[3]利用复杂网络理论研究燃气管线破裂灾害链,探究灾害传播实际情况;Alibek等[4]通过卷积网络对天然气管道泄漏进行建模和预测。此外,相关研究利用事故树、安全评价等方法分析燃气管网事故。王文和等[5]通过建立燃气管网泄漏火灾耦合度模型,分析其致灾因子及耦合过程;Shailesh等[6]对公路地下燃气管道的危险指数进行分析。但是上述研究方法尚不能有效揭示燃气管网灾害事故发生发展规律,厘清灾害事故链要素特征属性和要素关系逻辑层次等问题。
知识图谱能够显著提升事故分析效率,提高事故标准化、规范化处理水平。该方法已应用于电力[7]、文学[8]、铁路[9]等方面,但在燃气事故方面仍存在较大空缺。
本文利用知识图谱方法对城市燃气管网泄漏事故进行研究。搜集93份国内各省市区(不包括港澳台,下同)的应急管理局事故调查报告,总结出各案例的高频关键词。其次,分析事故链的发生发展机理,概括出事故实体、属性及关系,并绘制燃气管网泄漏事故的知识图谱。最后,基于知识图谱的网状结构,结合BP神经网络对燃气管网泄漏事故进行预测。研究结果有助于加深对燃气管网泄漏事故发生发展机理的认识,并为事故分析和预防提供新的思路和方法。
数据库根据存储方式不同,可以分为关系型数据库和非关系型数据库[10]。其中,关系型数据库主要以二维的关系数据模型来呈现,因其具有便于理解和结构性强的特点而得到广泛使用。非关系型数据库没有固定模式,更具灵活性,弥补关系型数据库扩展能力的不足,更适应互联网环境。非关系型数据库中以Neo4j应用最为广泛,它支持大部分图算法以及不同数据库之间的转换,具有高度适用性。因此,本文选取Neo4j为平台建立燃气管道事故知识图谱。
Neo4j的数据存储主要为节点、关系和属性的形式,通过对三者的建立来表达事故各要素之间的相互作用关系。其中,节点为事故的主要数据要素,节点可具有1个或多个标签,具有多个属性;关系连接2个节点,具有方向性;属性一般不会呈现在图中,但是可被检索和编辑。标签可用于不同节点的分组,方便对节点进行索引。本文对燃气管网泄漏事故中的常见要素、关系、属性进行分类整理,转化为数据库中的节点、关系、属性,实现由知识向数据库的转变。
知识图谱构建按构建方法分为自上而下的模式层构建与自下而上的数据层构建。模式层构建主要以行业标准、概念定义、专家经验为主,通过预先提出要素概念、实体、关系、属性的类型,搭建事故知识要素框架,形成初步的知识体系;数据层构建主要从事故案例、文献资料、新闻报道等途径知识抽取,所依赖的数据源数据量庞大。
模式层作为最初的框架构建,为数据层构建提供模板;数据层的更新为模式层提供反馈和修正。安全类型的知识图谱专业性需求高,要求数据全面,重视数据间的关联,因此需要人为对其进行不断调整优化,以使知识图谱更好地表达事故链以及事故潜在内容。
针对上述分析,本文采用模式层构建法,通过专家分析法分析若干事故调查报告、行业标准以及法律法规,概括提取出容易导致事故发生的若干要素及其相互作用的关系,作为模式层构建的关键要素。分别从实体类型、关系类型、属性类型3部分入手,构建知识图谱,具体流程如图1所示。
图1 基于模式层方法的知识图谱构建流程Fig.1 Construction process of knowledge graph based on schema-level method
本文语料提取自国内各省市区应急管理局官网发布的针对燃气泄漏事故的调查报告、《城镇燃气设计规范(2020年版)》(GB 50028—2006)、《城镇燃气埋地钢质管道腐蚀控制技术规程》(CJJ 95—2013)等技术规范,具备权威性。通过分析汇总所涉及的基础语料,对其进行语义消歧和分类,形成最终的实体、关系、属性及其分类。
2.1.1 燃气管网泄漏事故实体类型构建
燃气泄漏事故的实体构建围绕事故发生机理展开,依据“人-物-环-管”理论,将事故划分为4个部分分别研究,进一步将“物”分为泄漏事故、管道、异常指标,各部分相互影响关系如图2所示。人在事故中的角色主要为工作人员、救援人员及受害人员;泄漏事故按泄漏部位可分为管体泄漏和零部件泄漏2个类型,常发生的事故种类作为实体部分;管道包含管体自身和安全防护2个部分,对管体自身缺陷,包括管道质量、设计安装、运输燃气等进行全方位实体构建,防护缺陷依据管道常用的防护设施,分为管沟、防腐、防应力、人机工程4个方面,分别进行实体构建;指标的异常通常能反映出管道泄漏的状态,将泄漏事故中常见的指标划分为静态和动态2个类型。根据燃气部门出具的数据显示,管网泄漏事故常见原因包含第三方破坏、腐蚀、自然灾害、应力破坏等,环境实体的划分围绕上述原因展开。燃气管网的安全管理实体划分围绕组织结构、安全程序及安全文件展开。
图2 泄漏事故发生机理示意Fig.2 Schematic diagram for occurrence mechanism of leakage accidents
根据6类一级实体分类,对燃气泄漏事故关键词进行梳理归纳。在6个一级指标范畴内,进一步形成二、三级分类。最终根据要素的不同特点,罗列出燃气泄漏事故中所涉及的全部实体共130个,如表1所示。
表1 泄漏事故实体类型划分Table 1 Classification on entity types of leakage accidents
表1(续)
2.1.2 由泄漏引起的火灾爆炸事故实体类型构建
燃气泄漏后可能导致火灾、爆炸、窒息、气云燃烧等多种次生事故,其中以火灾、爆炸最为常见,且两者常常伴随发生,造成更严重的事故。对由燃气泄漏引发的火灾爆炸事故进行实体类型构建。
泄漏的燃气与空气中的氧气混合形成预混气体,达到爆炸极限后,在点火源的作用下造成火灾或爆炸事故[12],火灾爆炸产生的热量、冲击波等会引发一系列后续伤害,造成严重后果。
根据气体燃烧3要素理论,分别从可燃物、点火源、环境的角度对燃气泄漏引起的次生衍生灾害的实体进行分析,形成可燃物、能量源、人为制造火源、燃气积聚4类实体一级分类。环境中常见的可燃物可分为固、液、气、金属、带电可燃物5类;能量源是指使燃气预混气体达到燃点致使其燃烧爆炸的热源,根据热源的来源不同,分为管道外部的火源、管道内部的自热着火以及高温环境;人为制造火源根据发生方式不同,分为明火、能产生热量的高温物体、坚固物体碰撞产生的机械点火源、电气设备使用过程中产生的电火花、利用凹凸镜原理管线聚集生火5类;燃气积聚是燃气达到爆炸极限产生爆炸的必要条件,根据其场所的不同分为相对密闭环境和开放环境2大类。通风不良场所均有机会形成相对密闭环境,泄漏的燃气进入相对密闭环境,积聚达到爆炸极限。4类实体相互关系如图3所示,并提取和整理共60个燃气管网火灾爆炸事故相关实体如表2所示。
图3 火灾爆炸事故发生机理示意Fig.3 Schematic diagram for occurrence mechanism of fire and explosion accidents
在上文实体类型分析的基础上,将关系类型分为逻辑关系词和非逻辑关系词2个部分进行分析。
2.2.1 逻辑关系词类型构建
逻辑关系表示2个实体中1个实体的变更将会影响到另1个实体的关系,包含2个实体在概念、定义、时间、空间中存在的逻辑关系[13]。将事故中逻辑关系词分为6类。因果关系多指危险源和事故之间以及危险源和危险源之间的连锁关系;条件关系指事故发生的条件或实体需要符合的规定;从属关系一般用于企业和个人、企业和企业之间的结构关系;包含关系主要包括管道零件、文件、场所中的父集子集之间的关系。表3展示不同关系类型及常用关系词,共16个。
2.2.2 非逻辑关系词类型构建
非逻辑关系与逻辑关系相对,即2个实体间没有明
表2 火灾爆炸事故实体类型划分Table 2 Classification on entity types of fire and explosion accidents
表2(续)
显的逻辑关系如动作词、说明解释词等。燃气事故非逻辑关系词的划分围绕实体类型进行分类,不同实体类型的常用关系词具有较大差别,表4展示了80个在燃气管网事故分析中常出现的非逻辑关系词。
在燃气管网泄漏事故知识图谱中,属性是对实体的关键描述和补充。本文选取文件、气体、管道及零部件、事故等8类实体,对其常见属性进行分类构建。其中,文件属性的划分主要从相关规章制度入手;气体属性主要为常见指标的变化;管道及零部件的属性分为静态指标和动态指标;事故属性主要包含事故的性质及严重程度[14]。根据分类汇总101个燃气管网泄漏事故常见属性,如表5所示。
表3 逻辑关系类型划分Table 3 Classification of logical relationship types
表4 非逻辑关系类型划分Table 4 Classification of non-logical relationship types
表4(续)
表5 实体相关属性Table 5 Classification of entity related attributes
表5(续)
结合上述对实体、属性、关系的描述,构建模式层知识图谱,部分如图4所示。图谱共包含180个节点,296个关系以及135个属性,其中包含部分重复关系及属性。依据实体的一级、二级分类,共建立10个标签,分别用深浅程度不同的圆圈表现。图4涵盖表1~5中全部内容。
图4 燃气管网知识图谱模式层(部分)Fig.4 Schema-levels of knowledge graph for gas pipeline network (partial)
本文结合前馈型BP神经网络进行应用,理论上将某1段危险管道与图谱中实体对应,建立神经网络模型,即可实现对下一个实体节点的预测[16]。以管沟缺陷为例,分别对其子类别,即回填土质、土层疏松、边坡角度、管沟施工、埋深5个方面进行分析,通过对其危险性评分预测出下一个最可能发生的实体类型。
3.1.1 输入输出层设置
将管道缺陷的5个子类别作为神经网络的输入层,管道缺陷的指向(防腐缺陷、应力破坏)为输出层,如图5所示。分析60份与管沟缺陷相关的燃气管网泄漏事故案例,其中45份作为训练组数据,15份作为预测组数据。将管沟缺陷子类别按其危险性大小依次进行评分,评分范围0~9,作为输入层数据来源。根据管沟缺陷所引起的下一步事故记录为输出层数据,若主要引起防腐缺陷,则记为1;若引起应力破坏,记为2。
图5 管道缺陷相关实体Fig.5 Related entities of pipeline defect
3.1.2 节点设置
节点数一般是指输入层、隐含层以及输出层的不同类型数据的个数[17]。根据输入层的5类参数,将输入层节点数设置为5,输出层节点数为1。隐含层节点数取值范围由式(1)计算得出:
(1)
式中:l为隐含层节点个数;m,n分别为输入、输出层节点个数;a为0~10的任意实数。
根据计算,隐含层的节点数在3~12之间,通过替换各个节点数并寻找方差值最小的节点个数,发现节点数为11的隐含层节点数预测效果最好。因此确定网络结构为5-11-1的3层模型,数据在各层级之间的传输途径如图6所示,其中X表示管沟缺陷5个子类别的输入参数,Y表示防腐缺陷和应力破坏的输出值。
图6 BP神经网络结构Fig.6 Structure of BP neural network
3.1.3 函数及训练条件设置
默认的trainlm函数具有快速收敛的特点,但其迭代次数和精度并不理想。因此,本文将trainlm函数转换为traingd函数进行训练。为获得更高的准确度,将训练精度设置为0.01。根据多次实验,在该训练精度下实际迭代次数最高100 000级,因此将最高训练次数设置为150 000。
将所有数据导入Matlab中,进行网络训练以及预测,经过106 870次迭代,输出对15个预测组数据的预测值,并将其与实际应得的真实值相比较,结果如图7所示。输出层预测值和真实值数据差值均在0.5以内,该模型实际训练精度为0.01,最终拟合值R达到0.98较符合模拟前的预期值,表明预测结果较为准确。可以实现通过燃气管网泄漏事故知识图谱中某一层级实体的情况,来预测相关联的其他实体或属性的状态。
图7 预测组输出结果Fig.7 Output results of prediction group
1)在分析大量城市燃气管网泄漏事故案例的基础上,进行知识图谱语料分析。针对燃气泄漏过程以及次生衍生灾害事故,从人-机-环-管角度分别归纳梳理出相关实体,共总结燃气泄漏相关实体类型130个,火灾爆炸事故实体类型60个。
2)将实体间关系分成逻辑关系和非逻辑关系,归纳非逻辑性关系词80个,逻辑性关系词16个;针对燃气管网泄漏事故实体,归纳梳理属性共101个。采用模式层方法构建了包含全部实体、关系和属性语料的燃气管网泄漏事故知识图谱。
3)基于燃气管网泄漏事故知识图谱,构建BP神经网络模型,在已知燃气管网泄漏事故某一层级实体具体状态的基础上,对相关联的其他实体状态进行预测,经验证准确率较高。表明知识图谱可用于预测燃气管网泄漏事故的发展态势,为燃气管网泄漏事故分析和预测提供新的思路。