周义棋,刘 畅,,龙 增,李丹煜,陈鹏冲,刘 彬,钟茂华
(1.清华大学工程物理系公共安全研究院,北京 100084;2.中国电力科学研究院有限公司,北京 100192)
电网是保障城市安全运行和能源经济健康的命脉,面临突发事件时,及时有效地启动电网事故应急响应是保障电网和城市正常运行的关键。随着电力系统发展日趋庞大,电网事故的应急处置难度、内容和流程日益复杂。目前,电网事故的应急决策往往基于决策人员对应急预案的理解与经验进行主观决定。此外,电网事故处置需要多个部门协同,因此在应急过程中,难免出现职责划分不清、应急处置任务覆盖不全、协同效率低等情况。电网应急预案中包含突发事件下各职责部门的应急工作内容,然而人工查阅的方式耗时较长,难以满足应急处置的时效性需求。因此电网系统需要借助智能化手段,将电网应急知识转换为结构化、可视化的形式,辅助决策人员检索应急知识和应急任务,协调各部门采取应急措施,提高电网事故的处置效率。
知识图谱(knowledge graph)作为智能化知识表示方法,以图形式将三元组知识(头实体,关系,尾实体)进行存储和关联表示。目前,知识图谱在电力和公共安全领域已有初步探索。在电力领域,闪鑫等[1]分析人工智能在电网调控中的应用,表明知识图谱可作为1 种有效的智能辅助决策手段;蒲天骄等[2]概述知识工程在电力系统中的发展历程,提出1 种电力领域知识图谱应用框架设计。目前电力领域针对知识图谱的研究主要应用于故障处置方面,乔骥等[3]基于知识图谱针对电网故障处理业务场景的应用思路进行初探;郭榕等[4]提出1 种电网故障处置知识图谱构建方法,分析知识图谱在故障处置中的应用;王骏东等[5]基于知识图谱实现电网故障的辅助知识问答、案例匹配和业务推荐。在公共安全领域,杜志强等[6]和陶坤旺等[7]分别通过洪涝和地震灾害验证知识图谱在应急管理中的可行性;卢颖等[8]针对踩踏事故预防监控领域的发展趋势进行知识图谱可视化研究;林穿等[9]构建电力事故事理知识图谱,为预控电力事故发展提供知识服务。知识图谱构建的关键技术为实体抽取和关系抽取,Danilo等[10]利用自然语言处理技术抽取文本中的实体和关系;Phuc等[11]基于深度学习的分类模型生成三元组知识并构建知识图谱用于智能问答系统;廖佳路[12]结合电网领域专业词典和深度学习模型从电网故障案例文本中抽取故障信息。综上可知,电力领域知识图谱的相关研究多数聚焦于电网故障处置,在电网突发事故应急管理方面的相关研究较少且研究不深。
因此,本文根据电网自然灾害和大面积停电事件应急预案,梳理电网应急预案知识内容体系,提出基于规则与深度学习的电网应急知识图谱构建方法并通过Neo4j图数据库进行可视化分析,通过大面积停电实际案例验证构建方法的有效性,以期通过构建电网应急知识图谱提高电网突发事故的处置效率。
应急预案是电网应急管理体系建设的核心内容之一,在突发事件处置等方面起着重要作用[13]。针对自然灾害、事故灾难、公共卫生和社会安全4 类突发事件,我国均已制定相关应急预案。电力系统事故中,除运行设备故障和人为操作失误外,自然灾害是大部分事故的原因,且自然灾害对电网的影响较为严重,例如2008年中国南方冰冻雨雪灾害和汶川地震,导致电网设施大面积毁损,造成重大社会经济损失[14]。各类自然灾害导致的大面积停电可能会引发巨大经济影响,甚至引发社会混乱[15]。因此,本文针对电网自然灾害及其引发的大面积停电事件进行研究,通过中国部分省市(不包括港澳台,下同)政府官方网站搜集各层级大面积停电事件应急预案共57 份,同时通过省级电力公司安全管理部门搜集涵盖台风、地震等自然灾害应急预案共7 份,如表1所示。
表1 电网应急预案数据来源Table 1 Data sources of power grid emergency plans
电网应急预案具有下述特点,导致应急知识抽取存在一定困难:1)预案内容根据发布部门层级不同有所差异,知识提取时可能造成各级实体混淆;2)灾害的多样性导致各类应急预案涉及的专业词汇不同;3)涉及部门较多导致实体边界容易混淆。尽管如此,各预案的应急组织架构和应急处置流程具有共通模式[16]。本文结合搜集的各类电网自然灾害以及大面积停电事故应急预案,分析电网灾害事故应急组织架构和应急处置流程。
1.2.1 电网灾害事故应急组织架构
为应对电网突发灾害事故,政府部门和电力企业均需建立应急组织架构,并在灾害事故发生时密切协作。根据我国大面积停电事件应急预案,由国务院或国务院授权发展改革委成立应急指挥部,统一领导指挥大面积停电事件应对工作,其组织框架如图1(a)所示[17]。电力企业建立健全应急指挥机构,在政府应急指挥部领导下开展电网灾害事件应对工作。根据某省级电力公司提供的电网自然灾害应急预案,分析电力企业应急组织架构如图1(b)所示。
图1 电网灾害事故应急组织架构Fig.1 Emergency organization framework for power grid disasters and accidents
1.2.2 电网灾害事故应急处置流程
电网应急管理指灾害事故的预防与应急准备、监测与预警、应急处置与救援、事后恢复与重建等应对活动[18]。在应急预案体系中,电网灾害事故应急处置流程包括日常保障、监测预警、应急响应和后期处置4 个阶段,如图2所示。日常保障阶段的主要内容包括应急队伍保障,装备物资保障,通信、交通与运输保障,技术保障和资金保障;监测预警的流程包括信息监测,风险研判,提出预警信息发布建议,预警发布,预警行动以及预警解除;应急响应阶段包括发布响应,采取响应措施以及响应终止,各响应措施均由相应的职责部门执行;后期处置阶段包括总结评估,事件调查,善后处置以及恢复重建。
图2 电网灾害事故应急处置流程Fig.2 Emergency disposal pr ocess of power grid disasters and accidents
电网应急知识图谱的构建包括模式层构建和数据层构建。模式层是对实体概念、属性以及实体间关系进行描述的组织框架。数据层构建即选择合适方法对电网应急知识进行实体、关系抽取。数据层中的实体和关系按照模式层预设方式进行关联映射,从而得到电网应急知识图谱。模式层和数据层分别采用自顶向下和自底向上的方式构建,总体流程如图3所示。
图3 电网应急知识图谱构建流程Fig.3 Construction process of power grid emer gency knowledge graph
以图2中电网灾害事故应急处置流程的4 个阶段为主要线索,分析各阶段所关注的实体概念和属性,构建电网应急预案知识图谱模式层如图4所示。在应急处置各阶段中,本文重点关注各职责部门及其职责内容,因此需抽取职责部门实体和职责内容实体。应急响应启动后,还需关注所成立的应急工作组及其职责内
容。在实体属性方面,构建“级别”属性以避免不同级别部门实体间的混淆。按照如图4所示模式层预设方式,从电网应急预案文本中提取对应的实体和属性,从而实现电网应急预案知识图谱的构建。
图4 电网应急知识图谱模式层Fig.4 Mode layer of power gr id emergency knowledge graph
电网应急知识图谱可用G=(E,R,S)表示,其中E为知识库中的实体集合,R为关系集合,S 为“节点—关系—节点”三元组知识集合。数据层构建即在模式层组织框架指导下,从应急预案文本中提取所需实体及关系。数据层构建的关键技术包括实体抽取、关系抽取、知识融合和知识更新。
2.2.1 实体抽取
电网应急知识图谱中,每个实体(entity)对应1 个节点(node),节点具有标签(label)和属性(property),可用式(1)表示:
式中:Name表示该实体名称;Property1,Property2 表示该实体的多个属性,用来区分不同类型、级别和阶段的实体。
本文主要关注职责部门、工作组、人员物资和职责内容4 类实体。知识抽取方法分为基于规则的抽取方法和基于深度学习的抽取方法。根据实体和属性的特点,分别采用2 种方法对电网应急知识进行抽取,所需提取的实体类型和提取方式如表2所示。
表2 电网应急知识类别及提取方式Table 2 Categor ies and extraction methods of power grid emergency knowledge
1)基于深度学习的知识抽取
“职责部门”、“工作组”及“人员物资”实体概念均为名词词组且具有规律性,可通过命名实体识别进行提取。本文采用基于BERT(bidirectional encoder representation from transformers)模型的命名实体识别方法对应急预案文本中的实体进行抽取。首先,标注文本语料构成训练集来训练深度学习模型,采用的标注模式为BIO模式,其中B表示实体开始部分,I表示实体中间部分,O表示非实体部分,如表3所示。选取部分应急预案文本,进行长句切分后对1 130 个句子进行人工标注,以9 :1 的比例划分训练集和验证集。训练所得模型可对文本中的“职责部门”、“工作组”和“人员物资”类实体进行抽取。
表3 电网应急预案实体标注方法Table 3 Entity labeling method for power grid emergency plans
2)基于规则的知识抽取
根据文本中的关系词人工总结匹配模板对电网应急知识进行抽取。例如,部门的“级别”属性,根据文本中的关键字进行识别,如实体名称包含“省”,则其属性为{level=省级}。实体的“阶段”属性则根据其文本在应急预案中的位置决定。应急预案文本中部门的职责内容多样,不单由词组来构成且多为动宾结构,如“加强监测电力设备运行情况”等,因此针对职责内容使用深度学习方式进行抽取的难度较大。然而,应急预案文本中职责内容的描述相对固定,动宾搭配组合均为常规用法,如:“负责…工作”、“加强…”等。因此采用基于规则的方式对应急预案文本中的职责内容进行抽取。职责内容的提取规则如式(2)所示:
式中:<Strstart>表示起始符;<Strend>表示终止符。起始符和终止符界定职责内容的实体边界,其间内容便为职责内容duty。对电网应急预案文本职责内容进行提取的部分规则如表4所示,若某起始符不存在对应的终止符(记为None),则以句号、逗号等标点作为该条规则的天然终止符。
表4 电网应急预案文本职责内容提取规则(部分)Table 4 Extraction rules for responsibility contents in text of power grid emergency plans(partial)
2.2.2 关系抽取
电网应急知识图谱中的关系如式(3)所示:
式中:nodestart,nodeend分别表示头实体,尾实体,箭头表明关系具有方向性;rel表示关系名称;Property3 表示关系属性。实体间的关系通过基于规则的方式抽取,根据电网应急预案文本特点制定的抽取规则如表5所示。
表5 电网应急知识实体关系抽取规则(部分)Table 5 Extraction rules for entity relationship of power grid emergency knowledge(partial)
2.2.3 知识融合
知识融合将含义相同的多个实体用单一实体进行表示,即A={a1,a2,…,am},其中a1~am表示含义相同的m个实体,A为融合后的实体。电网应急知识融合流程如图5所示。在电网应急预案文本中,需要进行知识融合的情况为以下2 种。
图5 电网应急知识融合流程Fig.5 Fusion process of power grid emergency knowledge
1)全称和简称的混合使用。在应急预案文本中,部分职责部门和工作组因名称过长需要对名称作简化处理,如“某省大面积停电应急指挥部”和“省电力应急指挥部”应为同一实体;“某省大面积停电事件应急指挥部办公室”和“省电力应急办”应为同一实体。此类情况采用基于规则的方式进行知识融合,例如:名称包含“指挥部”的实体归为“电力应急指挥部”;同时包含“办公室”的实体归为“电力应急办”。
2)文本表示的多样性,指由字词差异导致误识为多个实体。如“现场指挥机构”和“现场指挥部”应为同一实体;“北京人民政府”和“北京市人民政府”应为同一实体。此类情况难以制定完备的知识融合规则,因此采用文本聚类算法进行知识融合,即遍历每个实体,计算该实体与其余实体的文本相似度,将相似度高于阈值的实体合并。实体语义相似度S 的计算公式如式(4)所示:
式中:A,B分别为2 个实体名称经过分词后得到的词频向量;n 为分词个数。语义相似度S 越高,2 个实体相似度越高。
2.2.4 知识更新
目前,电力领域发展迅速,电网相关应急文件也在不断增加。因此,电网应急知识图谱需要持续更新以保证应急知识的有效性,确保知识图谱能在突发事故发生时为电网应急决策提供参考。电网应急预案的主要内容形式相对固定,因此模式层相对固定。在将来新增应急预案或完善当前预案时,会增加新的电网应急知识,因此需要对知识图谱数据层进行更新。新增电网应急知识需通过知识融合后方可加入原有知识图谱中,同时应考虑:对于新增的实体或关系,在已有图谱中是否已存在相同实体或关系,若存在则进行去重;知识更新后是否存在失效实体或关系,若存在则应剔除。
采用图数据库Neo4j展示可视化电网应急预案知识图谱,所构建知识图谱可储存所抽取的实体和关系,并可视化表示“节点—关系—节点”三元组知识,具有可视化效果佳和搜索高效的特点。电网应急预案知识图谱可通过查询语句查找电网突发事故应急处置中的各个节点和关系,帮助电网事故应急决策人员在事故处置的各个阶段,迅速确定所需执行的工作及其负责部门,大幅度提高电网事故的应对效率。
基于所提出的电网应急预案知识图谱构建方法,以电网大面积停电事故为例,搜集我国各级单位电网大面积停电应急预案文件共57 份,经过长句切分后共得到数据6 442 条,对其文本进行实体抽取、关系抽取和知识融合后,通过图数据库Neo4j进行电网应急预案知识图谱可视化展示,部分结果如图6所示,所构建知识图谱中关键节点和边的类型及数量如表6所示。
表6 电网大面积停电应急预案知识图谱关键节点与关系统计数据Table 6 Statistical data of key nodes and relationship in knowledge graph of emergency plan for large-area blackout in power grid
以电网大面积停电事故为例,所构建电网大面积停电应急预案知识图谱可为电网事故应急管理处置提供建议。2006年4月25日,广东省中山市500 kV香山站#1 主变由于设备发生故障,导致中山地区出现大面积停电[19]。中山市应对该起事故流程如下:25日,紧急成立系统故障应急领导组和生产保障、客户服务、故障修复、安全监察4 个工作组;26日,求助地方政府和上级供电部门并首次召开新闻发布会;28日,启动用电户轮休方案,保障重要单位供电工作,启动新闻危机应急方案,统一对外宣传口径;后续抢修工作直到5月21日才恢复正常供电。总结中山市此次事故中应对的不足:与上级部门沟通不及时,无法及时获取上级部门帮助;舆情引导工作开展不及时;未及时考虑重要用电单位的供电工作。由此可知,中山市采用传统的决策方法,决策耗时过长,采取应对措施在时间上具有滞后性,大面积停电事故的应急处置效率仍有很大提升空间。
基于本文构建的大面积停电应急预案知识图谱,通过Cypher查询语句获取应急处置流程中各职责部门所应采取的措施。以应急响应阶段为例,采用的Cypher语句为“MATCH(n{stage:‘应急响应’})--(m:‘职责内容’) return n,m”,可获取应急响应阶段涉及的所有职责部门和职责内容如图7所示。
根据图7所示查询结果,可在事故发生后第一时间安排职责部门执行相关措施。对比由知识图谱生成的处置方案和中山市实际采取的处置措施,如表7所示。中山市所采用的应对措施均可在所构建知识图谱中体现,且知识图谱中的应急处置方案更为详细。综上所述,所构建的电网应急预案知识图谱可用于辅助决策,大幅度缩短传统人工决策所需的时间;同时,知识图谱提供所有可能的事故应对措施,避免人工决策可能造成的遗漏,有利于帮助决策人员充分考虑多方面因素,提高电网事故应急处置效率,加快电网系统恢复,减少由事故带来的损失。
表7 基于知识图谱生成的大面积停电应急处置方案Table 7 Emergency disposal scheme of large-area blackout gener ated based on knowledge graph
图7 应急响应阶段各部门职责内容查询结果Fig.7 Query results of responsibility contents of each depar tment in emergency response stage
1)本文以电网自然灾害及大面积停电事故应急预案为数据源,分析并梳理电网灾害事故应急组织架构和应急处置流程,研究电网应急预案知识图谱构建方法。
2)以电网灾害事故应急处置流程为线索构建电网应急预案知识图谱模式层,结合基于规则与基于深度学习的方法对电网应急预案文本中的知识进行结构化抽取。
3)采用Neo4j图数据库对电网应急预案知识图谱进行可视化分析,实现知识图谱中的节点与关系的高效检索,减少人工检索应急知识所消耗的时间。
4)以大面积停电事故为例,构建电网应急预案知识图谱并生成应急处置方案。结果表明,电网应急预案知识图谱能够提供应急决策支持,缩短应急决策所需时间,帮助决策人员充分考虑多方面因素,提高电网灾害事故应急处置效率。