RV 减速器故障知识图谱的构建

2021-03-29 13:41:18涂志健吴建卫能赵转哲马强
机器人技术与应用 2021年6期
关键词:三元组减速器结构化

涂志健 吴建 卫能 赵转哲 马强

(1 芜湖赛宝机器人产业技术研究有限公司,安徽芜湖,241003;2 芜湖职业技术学院,安徽芜湖,241000;3 安徽工程大学机械工程学院,安徽芜湖,241000)

0 引言

现如今工业发展迅速,RV 减速器是新兴起的一种减速器,它具有质量小、体积小、传动比变化的范围大、使用寿命长、精度稳定性好、传动效率高、传动性能平稳等一系列优点[1]。

故障处理的好坏是影响RV 减速器寿命长短的重要因素。由于RV 减速器的故障类型多,检测处理效率低下复杂,并且处理成本高,导致其故障难以处理,因此,国内外学者针对其故障处理提出了多种理论方法以及实践。张冶[2]通过日常使用摆线针轮减速器,总结积累减速器故障处理经验,以此保证其正常使用;李学凌[3]提出分析工作中矿用减速器常见的故障种类和起因,总结常见的故障和原因,提出解决方法,为煤矿的安全生产提供可靠的保障;李蛟真[4]等主要对减速器的漏油与振动异响两类问题的成因及处理方法进行了研究,提出了在减速器发生故障时,查清故障成因,对症采取措施,能有效解决“直接更换总成本较高”的问题;溥江[5]等通过计算行星齿轮减速器健康与断齿故障下的时变啮合刚度与动力学模型,分析行星齿轮减速器在健康、点蚀、断齿三种工况下的齿轮振动特性,为减速器故障诊断提供理论依据。然而,以上的成果基本是通过人工总结和积累的故障处理经验,先查清故障成因,然后对故障进行处理,没有提出能够快速查询到故障原因的方法,同时其方法的使用需要日积月累,难以大众化使用。

本文针对于RV 减速器故障处理的问题,提出建立知识图谱,通过建立RV 减速器故障领域的知识图谱将其数据可视化、可检索,提高故障检测的速度,使其能够大众化使用,提高了RV 减速器故障处理的便利性。

RV 减速器如图1 所示。

图1 RV 减速器

1 知识图谱构建技术

知识图谱是利用图的形式来描述知识和建模世界万物之间关系的一种技术[6],百度对其的解释为:知识图谱是图书情报界中的知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

本质上,知识图谱是一种描述实体、实体属性与实体关系的大型语义网络,基本形式是(实体1—关系—实体2)、(实体—属性—属性值),通常以网络的形式出现。在知识图谱中,节点可以代表一个概念、一个实体或一个属性,边可以代表实体、概念等相关属性。

知识图谱在不同应用场景和不同业务的需求下都能够提供服务,知识图谱的构建步骤如图2 所示。

图2 知识图谱构建步骤示意图

知识图谱大致可分为两类:一是通用知识图谱,二是领域知识图谱[7]。通用知识图谱面向全领域,主要应用于面向互联网中的检索、推荐、问答等业务场景,由于它强调的是广度,精确度要求低,因而更多的是强调实体,很难生成完整的全局性本体层的统一管理。领域知识图谱有严格与丰富的数据模式,因而要求构建者有一定的深度与完备性,其对准确度要求非常高,通常用于辅助各种复杂的分析应用或决策支持,如军事、机械、医疗等特定领域进行辅助决策。本文所构建的知识图谱类型即为领域知识图谱。

1.1 知识抽取

知识图谱的数据来源非常多,如专业的数据库、互联网可供爬虫爬取的数据等;数据类型基本为:结构化、半结构化、非结构化三种数据,其中后两者占比较大;因此对数据源的获取需要使用知识图谱中的知识抽取[8]。

对于结构化数据,经过较简单的处理便可获得实体、实体关系、属性、属性值等;对于半结构化、非结构化数据而言,其数据置信度不高,规模较大,个性化的信息较多,形式复杂多样,因此知识抽取主要处理的是半结构化和非结构化数据。

知识抽取主要分为三大类:实体抽取,事件抽取与关系抽取。实体抽取的主要任务是实体识别,主要是识别三大类(实体类、时间类和数字类)与文本中的七小类(人名、机构名、地名、时间、日期、 货币和百分比)命名实体,从而确定实体类别;事件抽取主要从数据中抽取出需要的事件信息,并以结构化的形式呈现出来;关系抽取是通过给定的实体关系类别与结构化数据,自动抽取实体之间的某种语义关系。

知识抽取常用的方法有:基于特征向量方法、基于核函数方法、基于神经网络方法,其中常用的为基于神经网络方法。

1.2 知识表示

知识表示是将抽取的实体、实体关系、属性、属性值表示成机器能够处理的数据结构[8],其中最常用的是RDF 三元组结构。该结构能够实现不同领域的资源描述,为资源描述提供一种通用框架和实现数据集成的元数据解决方案。

RDF 三元组结构的具体实施方式为:对实体加上一个属性和相应的属性值,即实体1—关系—实体2、实体—属性—属性值,通过定义规则,将抽取的实体、属性以及属性定义转换成RDF 三元组结构,形成数据层,在数据层的基础上引入模式层,定义实体、属性、关系来描述和约束资源,构建基本的规则体系。

RDF 三元组结构如图3 所示。

图3 RDF 三元组结构示意图

1.3 知识融合

知识融合是将不同来源的数据知识进行融合[8],进行实体消歧、实体对齐、实体匹配等工作,其中最重要的是实体对齐工作。

不同来源的数据主要有结构化数据、半结构化数据和非结构化数据。为了统一化管理,生成所需要的实体,使后续工作能够进行下去,必须要对不同来源的数据进行融合。在进行知识融合之前,第一步的工作便是实体对齐,实体对齐是为了判断不同数据来源的实体是否为指向真实世界中同一个对象,包含实体消歧和共指消解。实体消歧的本质在于解决一个词有很多可能的意思,也就是在不同的上下文中所表达的含义不太一样的问题;共指消解,也叫指代消解,解决指代不明的问题;通过实体对齐解决来自不同数据库数据源一词多义,以及指代不明的问题,提高知识融合后实体的准确性。

1.4 知识推理

知识推理是通过知识图谱中已有的知识去推理未知的知识关系[8];如已知雄狮子吃肉,母狮子吃肉,能够推出小狮子也吃肉;由于知识图谱中的实体、实体关系和属性种类繁多,人们难以将所有的推理方式都列举出来,基本上都是在使用的过程中去总结。对于推理方式的总结,人们必须依靠所使用知识图谱中实体与实体关系或者实体与属性来进行实现。

1.5 知识存储

知识图谱中的知识是通过RDF 的结构进行表示的,其基本构成单元是事实,每个事实都被表示成三元组的形式。知识图谱进行知识存储的常用存储方式为图数据库存储,图数据库存储的表现方式为节点、边与属性,节点代表的是实体、属性值等对象;边代表的是图中连接节点的有方向的线条,用于代表不同节点之间的关系;属性用于描述节点或者边的特性;图数据库存储的方式直观、方便。

RV 减速器是新兴起的减速器,而且其优点明显,是智能制造装备与精密仪器的核心零件,但现在由于领域知识图谱数据的特殊性和不断更新的特性,因而现在对于构建RV 减速器故障知识图谱方面的技术很少,难以满足人们对RV 减速器检测的需求,故本文提出关于RV 减速器故障知识图谱的构建方法。

2 RV 减速器故障知识图谱构建的主要技术

本文提出关于RV 减速器故障知识图谱的构建,并且根据RV 减速器的数据源提供了相应的构建方法,根据自顶向下和自底向上相结合的方式构建垂直行业领域知识图谱。自顶向下的构建方法可以使知识图谱的构建得到简化,并能使工作变简单,实现快速构建的目的。

本文提出自顶向下的方式构建知识图谱。首先定义知识图谱的数据模式,数据模式从最顶层的概念开始构建,通过人工构建实体模式层,随后逐渐向下一级细化,再通过底层数据的不断填充,构建并不断满足RV 减速器故障知识图谱的需求。

根据RV 减速器故障的数据进行实体、属性、关系的定义,RV 减速器故障知识图谱的构建主要是数据的处理、知识表示、知识存储与可视化、知识问答等过程。

2.1 数据处理及知识表示

知识图谱建立的基础是对数据源的抽取,因为RV减速器为新型减速器,目前没有其相关的结构化数据,因此本文主要对RV 减速器故障的非结构化数据源进行处理。

对RV 减速器故障的非结构化数据的处理,主要通过知识抽取相关技术,从不同结构与类型的数据当中,抽取出能够被计算机理解的结构化数据,为知识图谱的建立打下基础。

本文通过人工的方式对采用的文本数据进行处理,通过人工以及计算机对文本数据中关于RV 减速器不同部位的故障进行分类处理。首先依据故障位置的不同,分为齿轮故障、漏油故障、噪声振动故障等;然后依据故障位置进行故障分析,找出故障原因;最后提出改进策略以及解决方案。

数据处理后,还需要通过知识表示才能使得处理后的数据成为被计算机可理解的数据结构。

本文通过产生式规则[9]的方式进行知识表示,通过已定义规则将已处理的数据通过三元组的形式表示,即定义为规则=<实体1,关系,实体2>的形式,规则代表的是已经定义的规则;实体1 和实体2 代表的是实体的类别,如齿轮故障、磨损、胶合、加工精度差等;关系代表的是实体与实体之间的关系,如:齿轮故障,发生故障的原因是齿轮磨损,其中“齿轮故障”与“齿轮磨损”表示实体,“故障的原因”表示两个实体之间的关系。根据定义的规则建立RV 减速器的知识结构,同时通过推理结构控制整个过程的运行,将其转化为三元组结构的形式,方便之后的查询与分析。

产生式规则的表示结构如图4 所示。

图4 产生式规则的表示结构图

2.2 知识存储及可视化

RV 减速器知识图谱数据只采用三元组的形式进行存储,其使用人员能够通过相关的信息进行查询,但是使用人员只能查询到故障,却不能直观地看到查询结果与故障之间的关系,这对于新人或者经验较少的人员是及其不友好的。为了解决这个问题,本文采用现在应用最为广泛的图数据库软件Neo4j[10]对三元组数据进行处理,利用Python[11]相关代码将RV 减速器的关系型数据写入Neo4j 中,并通过Neo4j 生成可视化图谱。

本文使用的可视化图谱中含有32 个实体、7 种实体关系。其中,32 个实体在图谱中表示为:10 个故障实体,例如齿轮、传动轴等;5 个故障表现,例如齿轮磨损、断齿、轴承振动大、声音异常等;6 个故障原因,例如加工精度差、制造设计强度不足、润滑失效等;7 个故障改善,例如规范现场安装联轴器工艺,百分表检测减速机输入轴、输出轴等;4 个建议,例如禁止超载使用、禁止违规操作等。可视化图谱中每个实体都代表一个节点,每条边代表实体与实体之间的关系。实体即节点和边的关系组成了RV 减速器知识可视化图谱,其存储方便并且提供了相应的查询算法,方便工作人员的使用与查询。可视化图谱如图5 所示。

图5 可视化图谱

2.3 知识问答

建立可视化知识图谱以后,便可以进行知识问答系统的构建。本文基于知识图谱的问答系统包括问句分类程序、问句解析程序、回复程序以及问答程序四个模块。

首先是问句分类程序模块,使用的脚本文件是question_classifier——在其脚本文件中,对问句类型的特征词进行定义,例如齿轮故障、齿轮故障的子故障、齿轮胶合的原因等,实现对用户输入问句的类型进行分类;然后是问句解析程序模块,使用的脚本文件是questions_parse——在这个脚本文件中,需要根据上一步问句分类程序脚本文件中得到的问句类型,将其转化为SQL 语句,根据SQL 语句对存储在Neo4j 中的字段进行提取;其次是回复程序模块,使用的脚本文件是answer_search——在这个脚本文件中,需要根据上一步问句解析程序转化得到的SOL 语句执行查询,并根据问句的类型来调用相应的回复模板;最后是问答程序模块,使用的脚本文件是chatbot_graph,其是通过调用以上的三个功能模块来构建并实现知识问答。当给定自然语言问题之后,程序会对该问题进行语义理解和解析,然后通过数据库对解析结果进行查询,得到最终答案。问答界面如图6 所示。

图6 问答界面

3 结论

为了提高RV 减速器故障的处理速度,本文提出构建一种RV 减速器故障知识图谱,并分析其在故障诊断中的有益之处;本文对知识图谱的定义及相关技术进行了介绍,并且从数据的处理、知识表示、知识存储与可视化、知识问答等方面对RV 减速器故障知识图谱的构建进行详述,验证了RV 减速器故障知识图谱能够提高RV 减速器故障的处理速度,并且降低了其故障处理的难度。

RV 减速器故障知识图谱的构建极大地降低了故障处理所花费的成本,也能够为其他机械设备的故障知识图谱构建提供一些帮助。

猜你喜欢
三元组减速器结构化
基于带噪声数据集的强鲁棒性隐含三元组质检算法*
特征标三元组的本原诱导子
促进知识结构化的主题式复习初探
结构化面试方法在研究生复试中的应用
计算机教育(2020年5期)2020-07-24 08:53:00
驼峰第三制动位减速器夹停钩车问题的改进
关于余挠三元组的periodic-模
低密度超音速减速器
军事文摘(2018年24期)2018-12-26 00:57:40
基于ANSYS Workbench 的ATB260 减速器箱体模态分析
基于图模型的通用半结构化数据检索
计算机工程(2015年8期)2015-07-03 12:20:35
三元组辐射场的建模与仿真