HAZOP知识图谱构建方法

2021-08-21 07:34李芳国张贝克高东
化工进展 2021年8期
关键词:命名图谱偏差

李芳国,张贝克,高东

(北京化工大学信息科学与技术学院,北京 100029)

危险与可操作性分析(HAZOP)是一种广泛应用于石油化工行业的危险分析方法。该方法通过专家小组以“头脑风暴”形式,查明石油化工生产系统中潜在危险的偏差,针对这些偏差,找出原因,分析后果,并提出相应的解决方案与措施,最终将讨论的结果记录在HAZOP分析表中[1-2]。然而HAZOP分析是一个耗时、昂贵且以人为中心的分析过程,HAZOP分析过程本质上是主观的,依赖于专家小组的专业经验与创造力。针对HAZOP分析方法存在耗时、昂贵、依赖专家经验、完备性等问题,国内外学者先后开展了自动化与半自动化HAZOP分析以及相关改进HAZOP研究[3-4],借助计算机来辅助或代替人工进行HAZOP分析。这些研究一定程度上提高了HAZOP分析的效率以及HAZOP分析结果的完备性与准确性[5]。

随着HAZOP分析项目的开展,大量HAZOP分析文档以纸质文件形式留存下来,无论是人工HAZOP分析还是基于计算机的半自动化或自动化HAZOP分析方法都没有将这些HAZOP信息进行合理的利用,实现共享与复用。

基于人工的HAZOP分析,在开展不同HAZOP分析项目时,不同分析团队会根据自己的专业经验以及标准进行HAZOP分析,最终形成具有各自标准的纸质HAZOP分析文档。基于人工的HAZOP分析过程并没有借鉴或利用已有的HAZOP信息且以纸质文档的形式存储HAZOP分析结果,不利于不同项目、不同团队在设计、施工、维护等各个阶段的信息共享与复用。

基于计算机的HAZOP分析方法,利用现有的HAZOP信息或者专家经验等浅层知识建立专家知识库,从而减少HAZOP分析过程中的重复工作,以实现半自动化或自动化HAZOP分析,这种方法一定程度上利用了现有HAZOP信息,然而该方法形成的专家知识库一般只是将HAZOP信息简单存储在数据库中,没有建立起知识之间的联系且采用的标准不一,难以在不同项目、不同团队中进行复用。因此,如何按照现有标准表示现有HAZOP信息、实现HAZOP信息的共享与复用成为一个重要的研究课题。

知识图谱起源于20世纪60年代J.R.Quillian提出的的语义网络,90年代“知识本体”被引入用于知识表示[6-7]。随着互联网信息数据的增长,Google于2012年5月17日提出了知识图谱的概念[8]。知识图谱是一种揭示知识之间关系的语义网络,以结构化的形式描述现实世界的概念、事物之间的关系[9],它将信息表达成更易于理解的形式,能够更好地组织、管理和理解信息,使得知识更加易于共享与复用。

知识图谱语义表达能力丰富,采用实体-关系-实体的描述形式,使得不同来源、不同类型的知识都能以统一的形式表达与融合,易于计算机解析处理。目前,知识图谱主要分为通用知识图谱和行业知识图谱。在通用领域,德国莱比锡大学和曼海姆大学的科研人员从多种语言的维基百科中抽取结构化信息,构建了百科类知识图谱DBpedia[10]。复旦大学知识工厂实验室通过抽取、清洗、融合中文百科知识中的文本数据,构建了CN-DBpedia中文通用知识图谱[11],供机器和人使用。除此之外,百度、阿里等国内互联网公司也纷纷构建自己的通用知识图谱,这些通用知识图谱的出现,提升了搜索引擎的搜索速度以及搜索质量,并广泛应用于问答和聊天机器人领域。在金融、医疗、制造业[12-14]等行业领域,各行各业基于本行业知识构建了行业知识图谱,提高了专业知识的利用能力,打破了行业内信息共享与复用的壁垒。

在化工安全领域,Mao等[15]将知识图谱应用于化工过程安全,提出了一个包括本体定义、数据采集、导入和存储的综合半自动构建框架,并以延迟焦化工艺为例,通过构建知识图谱有效提高了工艺安全。Zheng等[16]构建了危险化学品管理知识图谱来克服分散数据库之间的信息孤立问题,从而改善危险化学品管理问题,便于企业掌握危险化学品生产、运输、储存等全生命周期问题。知识图谱的应用有利于化工安全专业知识的共享与复用,为化工安全生产、管理提供了一定的助力。

目前,在化工安全分析领域,对于HAZOP信息的共享与复用的相关研究主要集中于利用HAZOP信息建立专家知识库来实现信息复用[17-18]以及基于ISO 15926标准的HAZOP信息标准化研究实现信息共享[19-21],基于规则的浅层知识专家数据库没有研究HAZOP信息之间的关系,同时专家数据库一般只供特有的系统使用,不利于HAZOP信息的共享。基于ISO 15926标准的HAZOP信息标准化研究,其主要工作是基于ISO 15926标准定义HAZOP中的元素,如行为、事件、原因、后果等,从而建立HAZOP信息标准化模型实现HAZOP信息的共享,这种HAZOP信息标准化过程依赖手工建模,建模过程复杂,同时建立的标准化模型需结合图形化工具才能应用到实际HAZOP分析项目中,不利于HAZOP信息的复用。综合来看,这两种研究虽然都使得HAZOP信息能够在一定程度上进行共享与复用,但也各有一定的局限性。

为了解决HAZOP信息难以共享、复用问题,本文提出结合自顶向下和自底向上的HAZOP知识图谱半自动构建方法,以结构化的形式统一描述HAZOP信息以及信息之间的关系,便于计算机处理,并以图形式存储展示,从而实现HAZOP信息的有效共享与复用。本文介绍了HAZOP信息复用与共享存在的问题以及当前知识图谱的发展状况,设计了HAZOP知识图谱的构建流程,分析了基于危险事件的HAZOP信息的元素组成并完成了HAZOP知识图谱模式层的构建,然后介绍了知识图谱数据层的构建流程并完成HAZOP数据标注,命名实体识别模型的构建、训练以及HAZOP知识图谱数据层的构建,将构建方法应用于某煤炭间接液化项目油品合成装置HAZOP分析报告,构建了该项目知识图谱,验证了方法的有效性,展示了知识图谱的应用效果。

1 HAZOP知识图谱的构建流程

1.1 HAZOP知识图谱

知识图谱本质上是由实体-关系-实体组成的语义知识库,通过有向图的形式描述现实世界中的概念以及概念之间的关系。无论是人工HAZOP还是自动化与半自动化HAZOP方法,其实质都是通过“偏差”来展开分析,即通过找到系统中所有偏离正常状态的异常状态,找到所有可能的导致其的原因以及这些异常状态会导致的不利后果,并提出相应防护措施与建议,最后记录在HAZOP分析文档中。HAZOP信息中包含了大量的由原因、偏差、后果、防护措施及建议组成的危险事件描述。HAZOP知识图谱以危险事件的角度解析HAZOP信息,将HAZOP信息以实体-关系-实体的结构连接成有向网络图,从而直观有效地展示HAZOP信息之间的关系以及系统中潜在危险的传播路径,便于HAZOP信息共享与复用。

1.2 构建流程

通用知识图谱由于其数据大多来源于网络、百科全书等,数据量大,大多采用自底向上的方式构建;行业知识图谱由于其数据具有一定的领域性,容易被专家提取出来,一般采用自顶向下的方式构建。HAZOP信息中蕴含大量化工安全领域的专业名词,具有一定的领域性,然而由于标准不一,描述不统一,HAZOP信息中又有大量的不规范数据。因此,HAZOP知识图谱采用自顶向下和自底向上相结合的构建方法,具体流程如图1所示。采用自顶向下的方法构建知识图谱的模式层,首先进行本体体系划分,搭建知识图谱的框架,然后将划分好的类别体系进行概念、类属关系定义,定义HAZOP信息中每个类的属性、结构等,从而形成定义准确、结构清晰的HAZOP概念框架。自底向上构建知识图谱的数据层,针对已有的HAZOP分析文档,设计数据标注策略以满足后续流程需求,基于深度学习构建命名实体识别模型,利用已标注数据完成模型的训练,进而实现实体抽取,将抽取出来的实体映射到之前构建好的HAZOP知识本体概念节点当中,从而建立起实体之间关系关联,实现模式层与数据层之间的映射,最后利用图数据库,将数据进行存储,实现HAZOP知识图谱的构建。

图1 HAZOP知识图谱构建流程

2 模式层构建

2.1 基于危险事件的HAZOP元素解析

HAZOP分析方法的主要目标就是识别化工系统中的潜在危险因素,即“偏差”,找出造成此偏差的原因以及后果,并提出相应防护措施及建议,从而提高化工系统的安全性。因此,HAZOP信息就是由大量危险事件构成的,即危险事件是构成HAZOP信息的基本结构。一般危险事件的基本元素包括原因、中间事件、后果、防护措施、建议等。国际标准IEC 61882详细规定了HAZOP分析的基本定义、基本原理、分析步骤、流程等[21]。由于HAZOP分析的特性,结合国际标准IEC 61882,HAZOP信息中危险事件的元素包括偏差、初始原因、中间事件、后果、保护措施、建议。HAZOP信息中各元素的定义如下。

(1)危险事件 构成HAZOP信息的基本结构,由偏差、初始原因、中间事件、后果、防护措施、建议等构成。HAZOP信息由一个或者多个危险事件构成。

(2)偏差 引导词结合工艺参数构成。国际标准IEC 61882规定了常见的引导词如无、多、少、反向、早、晚等。工艺参数主要包括温度、压力、液位、流量、反应速率等。偏差是识别危险事件的起点,HAZOP分析的出发点。

(3)初始原因 引起偏差发生的原因。初始原因可以是容器失效、设备故障、人员失误、外部事件、天气变化、洪水、地震等。

(4)中间事件 由偏差引起的系统或者设备的某些不正常变化。在一个危险事件中,中间事件可以是一个或者多个,也可能不存在。例如反应器入口流量阀人工误操作,阀门开度减小,反应器液位降低,反应器温度升高,反应器爆炸。反应器液位降低、温度升高都是中间事件。

(5)后果 偏差经过中间事件后或直接导致的不利结果。如发生火灾、人员死亡、有害物质释放等。同一个偏差的不同原因可能导致不同的后果。

(6)防护措施 现有的调节控制系统或设备,用以避免或减轻偏差发生时所造成的后果。如报警、联锁等。

(7)建议 修改系统设计、操作规程或进一步进行分析研究的建议。如增加压力报警等。

2.2 HAZOP本体规则设计

本体规则是构建HAZOP知识图谱模式层的核心工作。HAZOP本体的构建主要有概念类别层次定义、概念属性关系定义等步骤。类是本体的基本概念,由上述基于危险事件的HAZOP元素分析可知,HAZOP本体H由一个或多个危险事件类E构成,因此,HAZOP本体的构建主要是针对危险事件进行类别划分及其相关属性的定义。一个完整的危险事件类E包括初始原因类R、偏差类P、中间事件类M、后果类C、防护措施类A、建议类S六要素。

2.2.1 概念类别划分与定义

HAZOP本体概念类别划分主要是对危险事件类进行类别划分与定义。危险事件类E是组成HAZOP本体H的基本单元,按照其内部元素构成可分为以下几类。

(1)单串型危险事件Ec这类危险事件构成比较简单,由单个原因引发,经j个中间事件传播,导致同一后果,其结构信息可描述为式(1)。

(2)反向树型危险事件Etr这类危险事件指由i个原因引发,经j个中间事件传播,导致同一后果的危险事件,其结构信息可描述为式(2)。

(3)正向树型危险事件Etl这类危险事件指由同一原因引发,经j个中间事件传播,导致k个后果的危险事件,其结构信息可描述为式(3)。

(4)领结树型危险事件Ebt这类危险事件构成复杂,由i个原因引发,经j个中间事件传播,导致k个后果,其结构信息可描述为式(4)。

HAZOP信息其实就是危险事件的集合,其结构信息可描述为式(5)。

2.2.2 概念属性关系定义

概念属性关系定义能够使得本体更加细化,进而形成具有良好结构的分类层次体系。每个危险事件类由初始原因类、偏差类、中间事件类、后果类、防护措施、建议构成,而初始原因类、偏差类、中间事件类、后果类以及防护措施类都能被抽象成单体+单体状态形式描述,单体为本体概念中的某个实体,单体状态为该实体的状态。初始原因类:过滤器堵塞,可分为单体-过滤器,状态-堵塞。偏差类:R-5611101液位过高,可分为单体-R-5611101,状态-液位过高。中间事件类:反应器超温,可分为单体-反应器,状态-超温。后果类:反应器爆炸,可分为单体-反应器,状态-爆炸。防护措施类:TI0108-0113高报警,可分为单体-TI0108-0113,状态-高报警。查询HAZOP信息一般以原因类、后果或者防护措施作为查询起点,建议类没必要进行过分细化,因此没有将建议类进行属性划分,直接将其归为一个整体类。

经过以上HAZOP概念类别划分以及属性定义,最终HAZOP知识图谱模式层如图2所示。

图2 HAZOP知识图谱模式层概念体系

3 数据层构建

知识图谱模式层构建了HAZOP知识图谱的骨架,数据层的构建则是填充HAZOP知识图谱的血肉。HAZOP知识图谱的数据层由实体-关系-实体三元组知识构成,首先对已有的HAZOP信息进行数据标注,然后通过构建命名实体识别模型训练并识别出HAZOP信息中的关键实体以及实体状态构成三元组知识,最后按照模式层定义好的概念框架,将三元组知识联结起来,并存储到图数据库中,最终形成HAZOP知识图谱。HAZOP知识图谱数据层构建的主要工作就是训练命名实体识别模型并将关键实体提取出来,其主要步骤有:数据标注,命名实体模型构建、训练,模型评估,知识存储等。

3.1 数据获取及数据标注

HAZOP知识图谱的数据来源主要来自于已有的HAZOP分析文档、领域行业网站等半结构数据,专业文献资料等非结构化数据。本文共提取了8655条HAZOP分析语句进行命名实体识别模型训练,并将语料集以8∶1∶1的比例划分成训练集、测试集和验证集。数据标注是命名实体识别的基础,将数据标记成模型能够识别的格式,进而开展模型训练、评估等工作。命名实体识别任务中常采用BIO、BIEO、BISEO三种标注方式,其中,B表示实体的第一个字,I表示实体的中间部分,S表示单个实体,E表示实体最后一个字,O表示非实体。一般来说,标注得越精确,识别的效果就越好。结合HAZOP信息中实体的结构,本文采用BIO形式的标注方式,即定义3种实体范围标签。由HAZOP知识图谱模式层可知,需要提取的实体有设备(EQU)、物料(MAT)、状态(STA)三类实体,具体的标注策略见表1。

表1 HAZOP信息实体标注BIO标签

3.2 BiLSTM-Attention-CRF命名实体识别模型

HAZOP命名实体识别与提取是构建HAZOP知识图谱数据层的关键步骤之一。相对于英文命名实体识别任务,中文命名实体识别的词语界限划分模糊。现阶段,中文命名实体识别研究一般采用BiLSTM-CRF模型,首先将中文字符经过字符编码得到字符级别的词向量,然后利用BiLSTM(bi-directional long short-term memory)神经网络模型获取具有上下文关系的表示向量,最后通过CRF层(conditional random fields)预测出命名实体分类结果。HAZOP文本中的命名实体具有其独有的领域命名规则,具有上下文敏感性,针对这些特点,在命名实体识别任务中,本文提出了BiLSTMAttention-CRF命名实体识别模型,在BiLSTM-CRF模型的基础上引入注意力机制,增强模型获取上下文特征的能力,充分挖掘文本的特征,提高模型识别准确率。该模型结构如图3所示。模型由Char Embedding层、BiLSTM网络层、Attention层和CRF层四部分组成。Char Embedding层将输入的句子转化为向量的形式,BiLSTM网络层从输入的向量中学习获取具有上下文特征的表示向量,Attention层利用注意力机制得到更加精准的特征向量,最终通过CRF层输出概率最大的标签序列,从而得到HAZOP命名实体。

图3 BiLSTM-Attention-CRF模型

3.2.1 BiLSTM网络层

LSTM[22](long short-term memory)是RNN[23](recurrent neural network)的一种,指一类具有记忆单元的循环神经网络,由于其设计的特点,非常适合用于对时序数据的建模。每个LSTM单元由当前时刻的输入词、细胞状态、临时细胞状态、隐层状态、遗忘门、记忆门、输出门组成。它通过遗忘门遗忘不需要的信息,利用记忆门需要记忆的信息,从而将有用的信息保留,无用的信息被丢弃。因此,LSTM可以很好地捕捉到较长距离的依赖关系,然而LSTM只能编码从前到后的信息,无法得到从后到前的信息。在序列标注等任务中每个字的标签与上下文联系都很紧密,因此本文采用BiLSTM模型进一步提升模型利用上下文信息的能力。

BiLSTM模型由Graves等提出,模型包括输入层、前向LSTM层、后向LSTM层以及输出层[24]。每一个训练序列通过双向LSTM为输出层提供训练序列中每一个点的过去与未来信息,其模型结构如图4所示。

图4 BiLSTM模型结构

在BiLSTM网络层中,当输入为xt、输出为yt时的概率用式(6)表示。

3.2.2 Attention层

当HAZOP信息序列过长时,HAZOP信息会被弱化,信息可能被丢失。针对此问题,本文引入注意力机制。Attention机制[25]就像人在看图片时会快速定位关键信息,把握重要的信息,将有限的注意力集中在重点信息上从而防止信息丢失,快速获得有效信息。注意力机制主要包含查询(query)、键(key)、值(value)三要素,其本质可描述为查询(query)到一系列键值对(key-value)的映射。Self-Attention就是寻找序列内部的联系,也即Attention(X1,X2,X3),X1、X2、X3为输入序列X的三部分。

图5 放缩点积注意力机制

式中,Q、K、V均为向量形式,大小分别为n×dk、m×dk、m×dv。

考虑到自建的HAZOP语料规模较少,使用一个Attention机制无法从多维度、多层次提取重要特征,特征提取效果弱。本文采用多头自注意力机制(multi-head attention)进行特征提取,以使得模型能够提取更加丰富的表达向量。

多头注意力机制[26]相当于多个不同的selfattention的集成,其在参数不共享的前提下,将Q、K、V分别经过参数矩阵映射,进行放缩点积注意力计算,最后将该过程重复h次后拼接,从而得到多维度、多层次的特征信息。其计算方式如图6所示,计算公式如式(8)、式(9)。

图6 多头注意力机制

3.2.3 CRF层

BiLSTM和Attention层关注更多的是求出每一个输入对应的最大概率标签,将每一个标签看成独立的存在,没有考虑标签之间的依赖关系,这样有可能会导致不合理标签的出现。如命名实体开始标签应该为B,而识别出来以I开头的标签序列。为了避免类似情况出现,在Attention层后增加条件随机场CRF层(conditional random field),CRF层能够考虑到相邻标签之间的关系,从而获得全局最优标签序列。

CRF模型是Lafferty等[27]基于最大熵模型和隐马尔科夫模型,提出的一种判别式概率无向图学习模型。一般地,输入序列X={x1,x2,…,xn}对应的标签序列为Y={y1,y2,…,yn}的评分如式(10)。

式中,A为转移矩阵;n为序列长度。

在输入序列x的条件下产生标记序列y的概率如式(11)。

训练过程中,p(y|x)的最大后验概率如式(12)。

式中,YX为输入序列X对应的所有可能的标签序列。

预测时,一般使用维特比算法计算整体最大概率的一组标签序列,预测结果记为y*,如式(13)。

3.2.4 模型评估与对比

本文的试验环境为:Intel Core i7-4710MQ 2.5GHz处理器,8GB内存,Python-3.6.2,Tensorflow-1.14.0, Keras-2.2.4。 BiLSTM-Multi-Head Attention-CRF模型主要参数设置如下:LSTM隐含层单元个数为128,层数为2,Self-attention中的dk为4,Multi-Head Attention中的num-heads为8,Dropout为0.5,优化器采用Adam,学习率为0.001。试验采用的模型评价指标有精确度P、召回率R和F1值,其计算如式(14)~式(16)。

式中,TP(true positive)为模型识别正确的HAZOP实体个数;FP(false positive)为模型识别到的不相关HAZOP实体个数;FN(false negative)为未识别到相关HAZOP实体的个数。

为了验证模型的有效性,本文进行了4组对比试验,使用的模型分别为CRF、BiLSTM-CRF、BiLSTM-Self-Attention-CRF、BiLSTM-Multi-Head Attention-CRF,其中BiLSTM-Self-Attention-CRF为引入自注意力机制的BiLSTM-CRF模型,BiLSTM-Multi-Head Attention-CRF为引入多头自注意力机制的模型。

各模型的命名实体识别结果见表2。由表可见,BiLSTM可以很好地提取上下文特征,与基准模型比较,F1提高了5.29%。模型引入Attention机制后,识别效果显著提升,模型的精确率、召回率和F1值分别为88.7%、90.48%、89.58%。结果表明,BiLSTM-Multi-Head Attention-CRF模型可以很好地完成命名实体识别任务。

表2 各个模型的命名实体识别结果

3.3 知识存储

通过上述流程,将HAZOP信息转化为结构化的三元组数据。三元组数据可以很好地表示HAZOP信息,Neo4j图数据库可以将结构化数据以图的形式存储,更加直观准确地反映HAZOP信息之间的联系,将实体-关系-实体、实体-属性-属性值的HAZOP三元组数据中的首尾数据存储为Neo4j中的节点类型,关系及属性关系存储为边,从而完成HAZOP数据的存储。同时利用图查询语言,可以快速查出需要的数据,辅助人工HAZOP开展,便于后续知识图谱的应用开发。

4 实例分析

以某煤炭间接液化项目油品合成装置HAZOP分析报告为例,分析了项目中的9个单元,共102个节点、834条分析记录。按照本文提出的知识图谱构建方法,利用命名实体识别模型提取分析报告中的设备、物料、状态等实体,再与模式层进行映射,以实体和状态为节点构成危险事件中的原因类,中间事件类,后果类以及偏差并存储与Neo4j中,最终完成HAZOP知识图谱的构建。该项目知识图谱如图7所示。

图7 某煤炭间接液化项目油品合成装置HAZOP知识图谱(部分)

以HAZOP分析报告节点1为例,其具体分析记录见表3。

表3 HAZOP分析记录

利用命名实体识别模型,将HAZOP记录表中的命名实体提取出来,提取结果见表4。

表4 HAZOP命名实体提取结果

得到每一个危险事件中对应类的组成之后,将提取出来的实体以节点形式存储,同时建立对应关系。如表4中的序号4对应的危险事件,在节点“EQU:R-5611101”与节点“液位过低”之间建立偏差关系,节点“反应器”与节点“超温”之间建立中间事件关系,以此类推建立后果、原因关系以及防护措施,从而完成危险事件的偏差类、中间事件类、后果类、原因类、防护措施类的构建,建议类则直接保存成节点,并将建议的内容以节点属性保存起来,由于每个危险事件都是以偏差为起点分析得到,也就意味着每个偏差都是唯一的,通过将偏差关系设置为其他关系和对应建议节点的原始关系,从而建立危险事件中每一个类之间的关系,最终完成知识图谱的构建。节点1的知识图谱如图8所示。

如图8所示,HAZOP知识图谱以节点-关系-节点的形式存储HAZOP分析记录,可以直观明了地展示出节点1的HAZOP分析记录中的每一条记录对应的偏差、原因、中间事件、后果、防护措施以及建议等相关知识,以图谱的形式构建HAZOP信息中的一个个危险事件,图形化展现了危险事件中知识之间的关系。HAZOP知识图谱可以以偏差、原因、中间事件、后果、防护措施等一个或多个组合作为搜索条件,提供已有的相关HAZOP记录,从而实现辅助人工HAZOP以及为后续项目维护提供知识支持。如当专家进行HAZOP分析时,分析“R-5611101压力过高”这个偏差导致的危险事件时,通过HAZOP知识图谱可以将已有的相似分析记录如图9(a)提供给专家作为参考,从而减少人工与时间成本,提高分析结果的完备性。在项目的后期维护中,当出现某个报警器报警或者某个反应器异常时,HAZOP知识图谱也能以此为条件,快速定位故障原因如图9(b)、(c),从而解决问题。

图8 节点1对应的知识图谱

图9 HAZOP知识图谱以不同条件检索的相关危险事件

5 结论

针对大量现有的HAZOP信息以纸质文档为载体记录,难以共享、复用等问题,结合HAZOP分析数据的领域性以及描述标准不统一等特点,提出了结合自顶向下和自底向上的半自动构建HAZOP知识图谱方法。从危险事件的角度剖析了HAZOP信息的元素组成,自顶向下构建了HAZOP知识图谱的模式层;在BiLSTM-CRF模型的基础上引入多头自注意力机制,提高了命名实体识别准确度,实现了自动提取HAZOP信息中的关键实体,自底向上构建了知识图谱的数据层。HAZOP知识图谱以结构化的形式统一描述HAZOP信息以及信息之间的关系,便于计算机理解,以图谱的形式存储展示HAZOP信息,便于信息的共享与复用。通过案例分析,验证了HAZOP知识图谱构建方法的有效性,同时表明以知识图谱的形式表示HAZOP信息可以较为清晰、完整地表述出HAZOP信息以及知识之间的联系,能够快速提供HAZOP参考信息有效辅助人工HAZOP的开展,提高HAZOP分析效率,也可以为后续项目的维护提供保障,为HAZOP信息的复用与共享提供了一种新的方法。

总体来说,本研究为HAZOP信息的复用与共享提供了新的实现方法,为知识的表达提供了新的应用视角。此外,本研究还有一些不足,如HAZOP数据不够充足,这影响了HAZOP知识图谱的完整度,在后续研究中,将扩展数据来源,丰富HAZOP数据,同时将研究HAZOP知识图谱在搜索问答领域的应用。

猜你喜欢
命名图谱偏差
高清大脑皮层发育新图谱绘成
基于图对比注意力网络的知识图谱补全
50种认知性偏差
命名——助力有机化学的学习
绘一张成长图谱
如何走出文章立意偏差的误区
有一种男人以“暖”命名
真相
为一条河命名——在白河源
主动对接你思维的知识图谱