凡天娣,景旭文,肖志建,李 磊,徐建新
(1.江苏科技大学 机械工程学院,江苏 镇江 212003;2.广州广船国际股份有限公司,广东广州 510000)
船舶焊接工艺知识层次较多,涉及工艺内容繁多且复杂异构。目前,船厂大多通过查阅相关国家标准及船厂历史资料,并结合工程师经验实现船舶焊接工艺知识的管理[1],导致焊接工艺知识的可重用性不足。因此,有必要研究有效的焊接工艺知识建模及管理手段,以提高知识利用率,优化知识存储模式,实现船舶焊接工艺知识的有效重用。
在焊接工艺知识管理方面,学者们大多采用数据库技术,设计开发焊接知识管理系统[2-6]。但在知识模型建立的过程中并未充分考虑到焊接工艺知识的结构关联性,故焊接工艺知识的可重用性并未得到较大的提升。因此构造语义明确、关系清晰且具有良好可重用性的结构化模型成为一个亟待解决的问题。结合船舶焊接工艺知识的特点,本文提出了一种基于本体的船舶焊接工艺知识图谱构建方法。凝练船舶焊接工艺知识并提取实体及语义关系以构建知识图谱,建立船舶焊接工艺知识本体与知识图谱的映射机制,并采用类型表模型完成知识存储。设计开发船舶焊接工艺知识管理系统,验证了知识图谱的本体建模技术对船舶焊接工艺知识管理中语义检索的可行性。
知识图谱采用图数据结构作为知识载体,描述客观存在的各种概念或实体,以及实体、概念之间的关系,是大数据时代下一种表达知识的重要方式。知识图谱能够将不同种类的信息连接在一起形成关系网络,提供从“关系”的角度分析问题的功能[7]。
本体是一种知识表示方法,表达领域中实体的固有特征,包括概念结构、概念之间的关系等,侧重于概念及概念间关联关系的表达。而知识图谱在本体的基础上进行了扩展和延伸[8]:在实体概念的基础上,添加了实体的内在信息,着重体现了实体与实体间的推理关系。因此,本体主要是对知识进行概括性、抽象性表示,约束着知识图谱数据的组织方式;知识图谱主要融合了实体间的关系,并联系语义网以组成知识的可拓网络[9]。
本文提出知识图谱的焊接工艺知识本体建模方法,具体包括:
(1)本体模型构建层。基于船舶焊接工艺内容凝练工艺知识,并进行整理及分类;分析焊接工艺知识内部具有的关系类型,并以本体语义关系的形式表达。
(2)知识图谱构建层。将知识图谱划分为概念层级关系图与实体层级关系图,采用三元组表达概念、实体间关系,基于船舶焊接工艺知识架构完成知识图谱的构建,利用本体与知识图谱之间的树与图关系建立并分析焊接工艺知识本体与图谱间的映射机制。
(3)知识图谱存储层。基于表结构存储方式将图谱存储入知识库中,以便于焊接工艺知识的管理及重用。
船舶焊接工艺知识包括大量工艺资源知识、工艺装备知识以及现场焊接工艺人员的经验知识等。同时,焊接工艺设计过程中涉及大量的规则知识,例如坡口形式的选择依据是母材厚度、焊接方法等参数。将焊接工艺知识划分为6类,具体如表1所示。
表1 焊接工艺知识Table 1 Welding process knowledge
为便于焊接工艺知识的关系抽取,采用三阶张量三元组(头实体、属性关系、尾实体)的表示方法,定义实体和关系的向量表示。
知识图谱三阶张量Y(ei,rk,ej)中,两个维度“ith entity”和“j-th entity”分别代表焊接工艺知识图谱中的第i个实体和第j个实体,第三个维度“k-th relation”代表知识图谱中第k个关系。若三元组Y(ei,rk,ej)存在于知识图谱中,对应三元组关系成立,否则不成立[10]。
对Y进行张量分解得到实体和关系的表示形式,函数表达为
式中 wh,wt∈Rn分别表示焊接工艺知识的头实体和尾实体在n维空间中的向量;Rk∈Rn为关系rk的权重矩阵;Rabrk为第a个向量元素与第b个向量元素在关系rk下的关联程度。
在本体模型中,概念及实体之间的基本关系有四种:Part_of、Kind_of、Instance_of、Attribute_of。为健全焊接工艺知识图谱,进一步定义概念及实体间的关系如表2所示。
焊接工艺知识图谱的基本结构由概念层次关系图和实体关系图组成,如图1所示。其中,概念层次关系图表示焊接工艺中本体概念层级,实体关系图表示焊接工艺实体及其之间的关系。概念层级关系图由概念节点及两个概念之间的关系边组成,实体关系图由实体节点及连接两个实体之间的关系边组成。
表2 概念及实体间关系Table 2 Concepts and relationships between entities
图1 焊接工艺知识图谱部分数据Fig.1 Welding process knowledge graph part of the data map
在焊接工艺知识概念及实体关系体系中,父子关系、决定关系及整体与部分关系占主体部分。因此将焊接工艺知识图谱知识间的关系划分为两大类:概念层级关系和实体关系。使用三元组Y(ei,rk,ej)表达语义关系,ei与ej表示节点(概念或实体),方向是由ei指向ej,rk表示语义关系每个三元组表示一个事实。如母材厚度决定焊接方法,其中边“决定”表示语义关系,实体是“母材厚度”和“焊接方法”。
构建船舶焊接工艺知识图谱首先要确定本体与知识图谱映射匹配机制。本体的实质是将关系和实体等进行层次化抽象表达。将本体概念层级结构当作树,本体概念层级结构的概念、实例等作为树的节点,其关系用连线表示。而知识图谱相当于一张巨大的语义网,将知识图谱的概念层级关系图当作树,概念节点作为树的节点,则实体节点可作为知识图谱的实体关系图的节点,其节点之间的关系也用连线表示。故本体和知识图谱的本体映射匹配模式可当作树与树、树与图之间的映射。船舶知识图谱映射匹配机制的构建如图2所示。
图2 本体与知识图谱的映射匹配机制Fig.2 Mapping matching mechanism between ontology and knowledge graph
本体和知识图谱之间的树与树映射关系:焊接工艺知识本体概念层级由父概念和子概念构成,以树结构描述本体,则其根节点为父概念,如工艺参数、焊接资源等;子节点为多层子概念,如焊接参数类知识及焊接设备等;概念最底层实例为叶节点,对应为上级子节点下的实例知识。将本体的概念树结构映射到知识图谱中,从而形成了右侧知识图谱的概念层次关系图。本体和知识图谱之间的树与图映射关系:本体的实例层主要包含在概念树结构中为叶节点,其中存在较多语义关系。此时,将本体实例表示为图的节点,蕴含的关系表示为图的边,将本体中的实例及其语义关系完整地映射到右图的知识图谱中,完成知识图谱的基本实体关系图的填充。
知识图谱中的知识以三元组形式表达,故采用基于类型表的方式完成焊接工艺知识图谱的存储。为各类型焊接工艺知识构建相应数据表,同一类型实例存放在相同的表中。表的每一列表示该类实体的一个属性,每一行存储该类实体的一个实例。但此方式可能导致概念的共同属性被重复存储,例如管法兰焊机的某些属性在焊接资源表及工艺实例表中同时存在。因此,在构建数据表时每个类型的数据表只记录属于该类型的特有属性,不同类别的公共属性保存在上一级类型对应的数据表中,下级表继承上级表的所有属性[11]。图3为焊接工艺相关的类别体系,图4为在该类别体系下设计的类型表。
图3 焊接工艺知识层级关系类别体系Fig.3 Welding process knowledge hierarchy relationship category system
图4 层级关系下的类型表Fig.4 Type table under hierarchical relationship
系统提供了基于知识图谱的语义检索功能,在知识检索时,可直接检索与检索目标相关的所有知识。知识语义检索实例如图5所示,可以根据语义关系及阈值的不同搜索出相应知识,确保检索的精确性;知识语义检索网络如图6所示,根据检索内容以知识图谱的形式呈现出与其相关的其他型焊接知识,确保了检索的全面性。
本文提出了基于本体的焊接工艺知识图谱构建及存储方法,提炼船舶焊接工艺知识,分析知识间的语义关系,构建船舶焊接工艺知识图谱并基于类型表模型结构形式存储,基于语义检索实现了知识图谱的应用。结果表明,基于本体的知识图谱建模及存储方法优化了船舶焊接工艺知识的模型架构及存储模式,依此建立知识系统可实现船舶焊接工艺知识的有效管理,提高知识的可重用性。
图5 知识语义检索实例Fig.5 Example of knowledge semantic retrieval
图6 知识语义检索网络Fig.6 Knowledge semantic retrieval network