梁 蕾,宋庆明,康陆佳,沈思远,田黄田,吴 敏
(1.上海飞机制造有限公司制造工程技术中心,上海 201324;2.上海飞机制造有限公司科技管理部,上海 201324)
知识图谱作为语义网的数据支撑,近年来成为了研究与应用的热点问题。知识图谱将实体表示为节点,实体与实体间的关系表示为节点间的边,从而形成了一个巨大的知识网络。例如,“ARJ21-700”是“客机”的实例,“机翼”是“客机”的部件,而“上飞公司”是“ARJ21-700”的生产商,上述知识都可以通过(实体-关系-实体)的形式来描述。这种表示形式被称为三元组,以上事实通过三元组可以表示为:
(ARJ21-700,类型,客机)
(ARJ21-700,部件,机翼)
(ARJ21-700,生产者,上飞公司)
知识图谱可分为开放领域知识图谱与限定领域知识图谱。开放领域知识图谱以描述普遍通识为主,如:WordNet、FrameNet、Mind-Net、OpenCYC、Yago、HowNet、CCD、CFN、Knowledge Graph、“知心”与“知立方”等。限定领域知识图谱描述某一特定领域内的知识或是事实,如:地理信息领域知识图谱Geonames,计算机、金融与法律领域的“爱图谱”,航空领域HowNet等。
知识图谱的构建需要投入大量的人力,特别是限定领域知识图谱,需要构建人员同时掌握知识图谱构建方法及领域内专业知识,相较于开放领域知识图谱,具有更高的难度。制造领域相比于计算机、金融与法律领域,公开可获得的文本资源有限,并且每个制造单位产品、数据及管理模式差别较大,使得制造领域知识图谱的构建成为具有挑战的研究问题,相关领域的知识图谱更是鲜有报道。
本文在飞机总装制造领域构建了含17 种实体、20种实体关系、实体总量25846,关系总量64402的总装制造领域知识图谱。总结出了知识图谱架构、数据汇聚、数据标注、图谱生成等构建步骤。本文后续部分组织如下:第二部分介绍构建方法,第三部分展示所构建的知识图谱,最后为总结。
本文将知识图谱构建过程总结为架构、数据汇聚、数据标注、图谱生成4 个步骤。其中,知识图谱架构确定知识图谱包含的实体种类及实体间的关系种类,文献[11]将该过程称为本体的建立;数据汇聚实现支撑图谱构建的全部数据的获取;数据标注实现数据内实体及实体关系的标注;图谱生成从标注的数据内抽取出实体及关系,后经过消歧、归约与校对,形成最终知识图谱。
通过知识图谱描述总装制造人员、业务、产品与技术等知识域,以知识管理为目标,规划了7 大类知识图谱。具体为:产品结构图谱、岗位图谱、技术谱系图谱、零部件图谱、业务流程图谱、知识条目图谱、制造方法图谱。图谱的架构(本体)如图1所示。
图1 知识图谱架构(本体定义)
(1)产品结构图谱描述企业产品的零部件构成结构,包括工位实体、工种实体、机身部位实体、AO(装配大纲)模板实体、图纸实体、零件实体。关系包括工位与工种关系、工种与机身部位关系、机身部位与AO 模板的关系、AO模板与图纸的关系、图纸与零件的关系。
(2)岗位图谱描述公司岗位构成与层级关系,实体包括组织机构实体、岗位实体、人员实体,关系包括组织机构间的关系,组织机构与岗位关系,人员与岗位的关系。
(3)技术谱系图谱描述管理及技术专业构成及关系,实体包括技术类型实体,关系包括技术类型间的关系。
(4)零部件图谱描述零部件类型及关系,实体包括零件类型实体与零件实体,关系包括零件类型与零件的关系。
(5)业务流程图谱描述公司关键业务流程,实体包括任务实体与任务步骤实体,关系包括任务与任务步骤关系。
(6)知识条目图谱描述知识类型与知识条目身,实体包括知识类型实体与知识条目实体,关系包括知识条目与知识类型关系,知识类型间关系,以及知识条目与知识来源关系。
(7)制造方法图谱描述制造与装配工艺方法构成与关系,实体包括专业实体与制造方法实体,关系包括专业与制造方法的关系。
(8)此外,还包括岗位与任务关系、任务步骤与知识条目关系、零件与制造方法的关系、制造方法与知识条目的关系。
以工艺规范、培训资料、操作规程、技术要求、MBOM、装配大纲数据等为基础数据,利用人工智能领域的自然语言理解与数据挖掘技术,获取产品、零部件、工艺方法、材料、岗位等概念的文本内容描述,并建立同义等关系,形成初始知识图谱,如图2所示。该过程能够充分保证所建立图谱涉及概念的全面性,也能够保证所形成图谱与知识条目的关联性,避免知识图谱建成后无法自动地标注与理解知识条目的问题。
图2 数据汇聚、标注与图谱生成过程示意图
在形成初始图谱并与现有技术体系语义对齐后,人工介入干预图谱的构建结果,保证图谱中概念的规范性。人工干预工作包括:确定具有歧义描述的唯一规范性描述,但图谱将保留歧义关系保证语义覆盖度;确定概念间关系,如工艺方法归属关系、零部件结构关系、零部件类型关系等。
本节展示所构建的知识图谱。所构建的总装制造知识图谱的各类实体及实体关系数量如表1 及表2 所示。7 大类知识图谱17 种实体总计实体25846个,20种实体关系总计64402项。
表1 知识图谱中各类实体数量统计
表2 知识图谱中各类实体关系数量统计
知识图谱采用图数据库存储并可以用力导引图的方式展示各图谱中实体与实体间的关系。另外,所有图谱通过关系形成关联。每个图谱的展示,是从各图谱视角切入,能够通过逐步点击实体展开与该实体通过关系关联的其他实体,从而展开到其他图谱的实体。例如,从产品结构图谱为切入,点击企业实体“上飞公司”能够展开该部件下全部零部件(如,制造工程技术中心),点击“制造工程技术中心”展开下设单位(如,冷加工工艺室),点击“冷加工工艺室”展开下设全部岗位(如,机加工艺岗),点击“机加工艺岗”展开该岗位全部任务(如,编制DC)(任务属于业务流程图谱的实体)及该岗位下的全部人员,点击任务结点能够展开任务步骤(任务步骤属于业务流程图谱的实体),点击任务步骤展开相关的知识(知识属于知识类型图谱下实体)。图3、图4与图5分别为岗位知识图谱、产品结构知识图谱与制造方法知识图谱的可视化展示图。
图3 岗位图谱的可视化展示
图4 产品结构图谱可视化展示
图5 制造方法图谱可视化展示
知识图谱作为人工智能基础知识组件,其构建与应用受到了广泛的关注。由于总装制造领域的专业性较强,在该领域知识图谱的构建与应用尚研究不足。本文通过知识图谱架构、数据汇聚、数据标注、图谱生成等步骤,构建了含17 种实体、20 种实体关系、实体总量25846,关系总量64402 的总装制造领域知识图谱。本文的研究能够为相关限定领域知识图谱的构建工作提供参考与借鉴。进一步扩大本知识图谱的数据量,研究其在各工艺相关业务场景下的应用,具体地如,利用机器学习等方法,降低人工工作量;增加知识有效性验证方法,降低对人员专业知识的需要;在工艺设计中利用知识图谱实现工艺过程的自生成、工艺参数自决策、工装工具的自选择等知识驱动的智能应用将是本文今后的重点工作。