岳高峰 刘继红 高亮 温娜
摘 要:智能制造领域的标准涵盖设备、机床、计算机系统、智能传感器等多种类型。以工业化、数字化、智能化为特征的智能制造对标准的数字化和机器可读提出了内在要求。为了满足智能制造标准的数字化、网络化、智能化发展要求,基于知识图谱技术和本体建模理论,本文提出了用于智能制造标准数字化转型的本体模型,包括类、属性、关系和规则库。在此基础上,通过在行业应用的典型示例,解释和验证了本文所提的模型和方法。
关键词:知识图谱,标准数字化,本体
DOI编码:10.3969/j.issn.1002-5944.2023.15.005
基金项目:本文受市场监管总局科技计划项目(项目编号:2022MK188)及中国标准化研究院院长基金项目“面向智能制造数据知识标准的数字化转型方法和一致性测试研究”(项目编号:532022Y-9424)资助。
A Digital Transformation Method of Standard for Intelligent Manufacturing Data Based on Knowledge Graph Technology
YUE Gao-feng1,2 LIU Ji-hong1* GAO Liang2 WEN Na2
(1. Beihang University; 2. China National Institute of Standardizationn)
Abstract: Standards in the fi eld of intelligent manufacturing cover equipment, machine tools, computer systems, intelligent sensors and other types of products. Intelligent manufacturing, characterized by industrialization, digitalization and intellectualization, puts forward inherent requirements for the digitalization and machine readability of standards. In order to meet the requirements of digitalization, network and intelligent development of intelligent manufacturing standards, based on knowledge graph technology and ontology modeling theory, this paper proposes an ontology model for the digital transformation of intelligent manufacturing standards, including classes, attributes, relationships and rule base. On this basis, the model and method proposed in this paper are verifi ed through typical examples of industrial applications.
Keywords: knowledge graph, standards digitization, ontology
0 引 言
歐美发达国家在将新技术用于推动制造业的变革发展。在世界经济持续低速增长态势的背景下,西方国家推动将新一轮科技变革带动产业变革,提升国家核心竞争力,并将标准化作为推动技术创新、产业变革的支撑和保障。德国在2020年3月发布了第四版《工业4.0标准化路线图》;美国在2022年10月发布了《先进制造业国家战略》,提出为美国制造业注入新活力、构建制造业供应链弹性,并建议制定数据兼容性标准,实现智能制造的无缝集成,引领智能制造未来发展。
我国提出了智能制造发展战略。2015年以来,工业和信息化部联合国家标准化管理委员会先后印发了《国家智能制造标准体系建设指南》的2015、2018和2021版,提出了智能制造标准体系,涵盖船舶、纺织、石化等14个细分行业。智能制造是基于先进制造技术与新一代信息技术深度融合,贯穿于设计、生产、管理、服务等产品全生命周期,具有自感知、自决策、自执行、自适应、自学习等特征,旨在提高制造业质量、效率效益和柔性的先进生产方式[1]。智能制造系统架构从生命周期、系统层级和智能特征等3个维度对智能制造所涉及的要素、装备、活动等内容进行描述,主要用于明确智能制造的标准化对象和范围。
党中央、国务院[2]提出发展机器可读标准、开源标准,推动标准化工作向数字化、网络化、智能化转型。同时,对于智能制造提出实施高端装备制造标准化强基工程,健全智能制造、绿色制造、服务型制造标准,形成产业优化升级的标准群。智能制造涉及到的多种类型的“机器”,涵盖设备、机床、计算机系统、智能传感器等多种类型,涉及到机器可读标准也最多。智能制造涵盖了设计、生产、物流、商贸等业务活动,与车间自动化生产、自动搬运、自动货物运输、智能机床、自动包装、仓储自动化等工业智能紧密关联,这都为标准的机器可读,以及标准的数字化、网络化、智能化转型提出了内在要求。鉴于制造行业的智能化发展需求,包括工业互联网、物联网、自动化设备设施等在内的制造资源对机器自动化智能化解析处理,提出了数字化要求。如何让机器更好地理解和执行标准,推动标准化工作向数字化、网络化、智能化转型,是当前数字经济时代的迫切发展需求。
1 现状综述
1.1 国外标准数字化情况
ISO将数字化技术作为重要的影响因素列入ISO发展战略,指出数字基础设施发展以及数字技术与其他传统技术结合,正在迅速而显著地改变世界各地的人们生活和工作方式[3]。标准数字化有助于提高企业的生产效率,创造竞争优势并促进创新;可以帮助社会和企业以可持续的方式促进新技术的传播。此外,ISO还将利用数字技术的力量来改善自己的价值链和敏捷性。IEC和ISO联合提出了IEC/ISO smart计划[4],包括著名的标准成熟度模型。在此基础上,德国标准化机构DIN/DKE进一步拓展了该模型[5],如图1所示。DIN将数字标准的定义为“数字标准包含标准化任务的所有相关信息,并以适合特定应用的方法和范围提供这些信息。数字标准可以由人和机器启动、创建、处理、实施和调整”[5]。同时,认为当前的标准仅以文档形式提供,包括纸质文档、电子文档;提出规范和标准也应以数字形式提供,以便于机器或其他自动化系统可以自动读取和应用[6]。欧盟[7]提出通过标准化支持数字化转型,提高全球市场竞争力。标准数字化可以促进产品和服务的安全性;建立对新兴技术的信任;努力寻求共识并为欧洲提供最先进的解决方案。
综上所述,国际上将标准数字化转型都作为标准化的发展战略和前沿技术。在智能制造领域,面向机器可解释、可执行的文档是标准数字化转型的重点研究方向。
1.2 基于本体理论的知识图谱技术
Gruber等[8]将本体定义为“概念化的显式规范”。本体作为一种形式化的知识表示,在知识的获取、存储、共享和重用过程中起着重要作用。W3C制定了基于XML的语义网技术,推动了本体理论的应用。资源描述框架(Resource Description Framework,RDF)使用XML语法表示互联网上的数据模型。RDF图由三元组(Turtle)组成,包括主语、谓语和宾语,可以实现互联网范围的知识网络。在RDF 的基础上,W3C推出了一种语义表达能力更强的知识网络本体语言(Web Ontology Language,OWL),可以支持類、属性、个体和数据值。语义网规则语言(Semantic Web Rule Language,SWRL)是基于OWL的规则逻辑语言,并且支持演绎推理能力。2012年5月,Google公司提出知识图谱(Knowledge Graph,KG)的概念,用于对收集的各方面信息进行结构化组织,以提高搜索引擎的性能[9]。Hogan等[10]将知识图谱定义为旨在积累和传达现实世界知识的数据图谱,其节点表示相关实体,边表示这些实体间的关系。Neo4j是一个支持原子性、一致性、隔离性和持久性事务的知识图谱管理系统。Neo4j通过图(graph)、Nodes(节点)、Lables(标签)、Relationship(关系)、Relationship type(关系类型)、Properties(特性)等来构建知识图谱。语义网络和知识图谱为本体三元组建模提供了基本方法,可以方便地实现知识网络的表示和构建。
本体理论和知识图谱技术为标准数字化转型提供了坚实的技术基础,也为实现标准机器可解读、可解析实现高级别成熟度提供了技术实现的方法和工具。
2 智能制造数据标准本体及知识图谱构建
2.1 概述
数据标准是一种重要的智能制造标准,包括普通标准、术语标准、分类代码标准、元数据标准和接口标准等。数据标准通常是实现自动化设备和系统等机器解读和处理的一种资源,数据标准的数字化转型对智能制造标准数字化转型起到重要的示范和带动效应。当前,我国的智能制造标准中的技术内容,大多数以文档格式存在,包括纸质文档、PDF等电子文档以及html网页格式的文档。智能制造标准中的内容,大略相当于图1所示的成熟度模型中二三四级的内容为主。为此,本文在综合调研我国智能制造数据标准现状的基础上,通过本体技术和知识图谱技术,提出了一种面向机器可解读、可执行、可解释文档的标准化数字化转型技术和方法。
数据标准可以分为普通标准、术语标准、分类代码标准、元数据标准和应用接口标准等若干种类型。不同数据标准,根据标准包含的技术内容又可以拆分为若干标准组成模块,包括标准文献模块、范围模块、规范性引用文件模块、术语模块、通用条款模块、代码模块、元数据模块、接口模块、参考文献模块等。
普通标准包含标准文献模块、范围模块、规范性引用文件、术语模块、通用条款模块、参考文献模块。术语标准、元数据标准、分类代码标准、接口标准等可以是专业的普通标准,除普通标准的一般内容之外,更多的是专业性模块。分类与代码标准主要技术内容是分类与代码模块;元数据标准主要技术内容是元数据模块;接口标准主要技术内容是接口模块。还有一类综合性数据标准,可能会包含这几种专业模块。
2.2 数据标准本体
式中,类、实体或节点(C);类、实体、或节点在此处被看作同义词,表示为:“(类)”;
属性(P),指有关类的相关信息;例如,标准号、标准名称、起草人和其他相关信息可以是标准文献的属性;
关系(R)或边;关系表示节点或类之间的连线、逻辑关系;包括:OWL或Protégé工具中定义的通用关系(如IS-A);知识图谱中的一些特定的逻辑关系,如“规定”“起草”等,以有向箭头的形式表示:-[关系]->;
公理规则(A);公理规则主要采用语义网规则语言(SWRL)表示,如自反(reverse)关系。例如,“规范性引用”与“被规范性引用”是自反关系。
2.3 数据标准类和属性
2.3.1 标准文献
标准文献是将标准作为一个整体,是一种技术文件。标准文献信息主要是标准元数据信息,从描述性角度的数据标准相关信息,是一种标准的外在信息。与标准文献相关的类(或节点)主要是描述标准文献元数据信息的类,包括标准文献、起草人、起草单位等类。此外,标准正文中的范围模块、规范性引用文件、参考文献等模块,也属于从总体上描述标准文献之间关系的内容,也归入标准文献类(见图2)。
标准文献一般包括下列类:
标准文献类,主要是从文献角度定义和描述标准的相关信息;标准文献指以文件的形式存储了特定专业领域的知识;标准文献是标准内容承载的文件媒介;标准文献通过描述性信息来表达标准文献的相关信息;包括标准号、标准名称、发布日期、实施日期、发布部门、起草单位名称、起草人姓名等属性。
起草人类,参与标准起草的人员信息,包括起草人的姓名、隶属单位、身份证号码、职务/职称、联系电话等属性;
起草单位类,参与标准起草的组织机构、社会团体或部门,包括起草人的单位名称、统一社会信用代码、所在省份、联系人名称、联系人电话等属性。
规范性引用文件类,通常是一种标准文献的相关信息,一般包含文献代码(主要是标准号)、文献名称(主要是标准名称)等属性。
参考文献类,一般包含标准文献在内的文献,例如标准、著作、期刊文章、技术报告、法律法规等,一般包括文献的作者、文献名称、编号、出版单位等相关属性。
2.3.2 标准内容
标准内容是将标准作为一个知识载体所包含的信息和知识。根据前文所述,根据模块化原理,除范围、规范性引用文件、参考文献等模块纳入标准文献类之外,将数据标准内容可以分为:通用条款模块、术语模块、元数据模块、代码模块、接口模块等,这些模块通过通用条款、术语、代码、数据元、接口等类,以及相关的属性、关系、规则库等表示。
条款类,是一种标准内容,是标准中最小的知识单元,可以体现为数据分类代码、软件接口、数据元、术语、或其它技术要求等。通常包含章条号、条款内容等属性。条款可以是规范性条款或描述条款,用以表达要求、指示、陈述或推荐等技术内容。对于数据标准来说,除了通用条款之外,还可能包含术语、代码、数据元、接口等特定的格式化数据。
术语类,表达术语定义技术内容的最小知识单元。通常包含中文名称、英文名称、定义、注、出处等标准属性。
缩略语类,表达缩略语的最小基本单元。通常包含缩略语、中文词汇、英文词汇等属性。
数据元类,数据元是构成数据的最小单元。通常包含数据元的标识符、中文名称、英文名称、缩写名、说明、表示、值域、是否必选、语境等属性(见图3)。
代码类,是信息代码类的简称,用于标记信息的类别或个体的标识方式。例如标准号、身份证代码、物品代码、行政区划代码、学科代码等都是代码。通常标准中可以有若干种代码,例如阿拉伯数字代码、拉丁字母代码等多种代码。代码类的属性可以有代码1、…、代碼n、代码类型、信息实体名称、信息实体说明。
接口类,是软件工程中应用访问接口或数据接口,是实现不同软件模块集成的一种方式,也是软件工程中模块化理念的一种体现。通常,不同软件开发协议或不同的机器语言,具有不同的接口表达方式。接口类一般包含类名称、功能描述、输入参数、输入参数类型、输入参数说明、输出参数、返值类型、返值说明等属性(见图4)。
2.3.3 标准内容类和属性
标准文献之间、标准文献与应用场景之间、标准文献与内容条款之间的关系,见表1。
2.4 规则库
在《OWL语义本体语言快速指南(第二版)》(Web Ontology Language Direct Semantics (Second Edition))中定义了一组公理。本文采用了其中的一部分通用性的公理,如继承关系或称为IS-A关系、相反关系(Inverse)。此外,还为标准知识图谱定义了一些公理规则。
继承关系,例如:
(代码类)-[IS-A]->(条款类)
相反关系,例如:
规定关系和源自关系是相关关系;
规范性引用和被规范性引用是相反关系。
为了便于理解,用自然语言表达的相关基本规则:
规则1:规范性引用文件不能放在参考文献。如果标准文献1中技术条款被标准文献2规范性引用,那么,标准文献1不能出现在标准文献2的参考文献中。
规则2:代码唯一性。如果标准文献中的代码1是信息实体1的代码,那么,标准文献中的代码1不能作为信息实体2的代码。
规则3:数据元标识符唯一性。如果标准文献中的数据元1的标识符为A,那么数据元2的标识符不能为A。
规则4:数据元缩写名合法性校验。数据元缩写名,或者英文名,经常作为数据建模的实体名称,一般应符合XML语法或其他机器语言的语法规则。数据元英文名称或短名称通常不宜出现特定字符,例如“?”、空格等。
规则5:英文术语大小写规则。标准文献中的英文术语指称不用大写。
规则6:缩略语大小写规则。缩略语用大写,英文名称首字母或相应的字母应大写,其它字母小写。
2.5 标准知识图谱示例
课题组按照采用本体建模的方法,采用NEO4J的社区版作为开发工具,对某信息化数据标准进行了分析研究,提出了初步的标准知识图谱构建的示例图。分别从术语标准、元数据标准等做了示例,如图5~6所示。
元数据标准知识图谱示例如图6所示。
3 总结和展望
本文面向智能制造领域数据标准的数字化转型,提出了一种标准文献及标准内容数字化转型的方法。该方法采用本体建模方法,以知识图谱技术为实现手段,符合ISO smart成熟度等级的三四级,即机器可解读的内容、可解析的文档的相关要求。但是,本文的不足之处在于,主要针对现有标准的数字化转型提出的一种方法,还没有完全实现最高等级的标准自决策的智能化水平。
参考文献
[1]工业和信息化部 国家标准化管理委员会關于印发《国家智能制造标准体系建设指南(2021版)》的通知[Z/OL].(2021-11-17)[2023-05-16].http://www.gov.cn/zhengce/ zhengceku/2021-12/09/content_5659548.htm.
[2]国家标准化发展纲要[Z/OL].(2021-10-10)[2023-05-16]. http://www.gov.cn/zhengce/2021-10/10/content_5641727. htm.
[3]ISO Standardization Foresight Framework - Trend Report 2022[R/OL].[2023-05-16].https://www.iso.org/ publication/PUB100470.html.
[4]IEC、ISO. IEC/ISO SMART——Unleashing the digital power of international standards[EB/OL].[2023-05-16]. https://www.iso.org/smart.
[5]SCENARIOS FOR DIGITIZING STANDARDIZATION AND STANDARDS[R/OL]. DIN、DKE, 2021[2023-05-16].https://www.dke.de/de/normen-standards/normungstrategie/deutsche-normungsstrategie/idis.
[6]DIN and DKE make great progress in achieving digital standards and standardization[N/OL].(2022-05-31)[2023-05-16]. https://www.din.de/en/din-and-ourpartners/press/press-releases/din-and-dke-makegreat-progress-in-achieving-digital-standards-andstandardization-879458.
[7]Digital in Standards: supporting the Digital Transition through standardization[EB/OL].(2021-09-29)[2023-05-16].https://www.cencenelec.eu/news-and-events/ news/2021/publications/2021-09-29-digital-instandards/.
[8]GRUBER T R. A translation approach to portable ontology specifications[J/OL].Knowledge Acquisition,1993,5(2): 199-220.
[9]SINGHAL A. Introducing the knowledge graph: things, not strings[J/OL].[2023-05-16].https://www.blog.google/ products/search/introducing-knowledge-graph-things-not/.
[10]HOGAN A,BLOMQVIST E,COCHEZ M,et al.Knowledge graphs[J].ACM Computing Surveys,2021,54(4):1-37.
作者简介
岳高峰,副研究员,研究方向为知识管理、工业数据、标准体系理论与方法等领域。
(责任编辑:张佩玉)