基于本体的汽轮机多源异构知识建模与融合

2021-11-02 03:01剡昌锋张永明艾科勇吴黎晓
兰州理工大学学报 2021年5期
关键词:发电机组异构全局

剡昌锋, 张永明, 艾科勇, 栗 宇, 吴黎晓

(1. 兰州理工大学 机电工程学院, 甘肃 兰州 730050; 2. 安徽容知日新科技股份有限公司, 安徽 合肥 230031; 3. 大秦铁路股份有限公司, 山西 太原 030045)

汽轮发电机组作为电力系统中极为关键的大型旋转机械设备,对安全性、稳定性以及寿命的要求非常高,如果出现意外故障,会造成人员伤害或严重的经济损失,因此为了提高汽轮发电机组运行的安全性与可靠性,对汽轮发电机组的故障进行准确的诊断和预测具有重要的工程实用价值.汽轮发电机组结构复杂,并且其故障知识分布存在多样性和异构性,导致在建立故障诊断专家系统时知识的表示与管理成为一个关键问题.

本体在知识表示、检索、共享和应用方面成为一个研究的热点.本体是源自于哲学中的术语,指事物客观存在的本质[1-2],它能描述某一特定领域概念间的含义和关系.近年来,基于本体的多源异构的知识表达在人工智能、知识工程、语义检索等领域中引起广泛的关注.

斯坦福大学提出了七步法构建领域本体,研制了Protégé软件,使本体建模更加方便.Dendani等[3]研发了基于领域本体的汽轮机故障诊断案例推理系统,实现了文档化的知识表示与推理.栗宇等[4]提出了基于本体的汽轮发电机组故障诊断知识建模,对汽轮机故障进行单一本体建模.Zhou等[5]介绍了一种基于本体机床故障诊断方法和一种基于知识库的故障诊断方法,设计了一个基于知识的可配置机床故障诊断平台.周安美等[6]提出了基于本体的风电设备多源异构知识管理框架,建立了局部本体与全局本体之间的映射关系,并开发了基于本体和故障模式及危害性分析(failure mode effects and criticality analysis,FMECA)的风力发电机组智能故障诊断系统.Fang等[7]研究了从用户生成的带注释的图像中自动构建基于大众分类的视觉本体,从另一个角度实现了本体知识的表示.Peng等[8]针对液压系统故障诊断知识具有复杂的结构和映射关系等问题,提出了一种基于本体的故障诊断知识表示方法.Zhao等[9]将本体应用到电力的异常诊断中,能够挖掘出电网出现故障的深层原因.袁侃等[10]将本体应用于飞机结构诊断中,通过本体实例推理出故障原因,提出了基于本体和FMECA的风力发电机组智能故障诊断研究.Yan等[11]利用产生式的方法表示了汽轮机的故障知识.Wei等[12]提出了基于二维全息谱和贝叶斯决策理论的不确定性问题,研究了汽轮机故障知识的不确定性问题.Orchard等[13]采用框架知识表示的方法研究了涡轮发电机组的诊断与预测问题.

以上的研究在本体知识表示和推理方面都存在一定的局限性,对复杂大型的故障知识库难以精准高效地表达与推理,对故障诊断概念及其属性没有形成固定的表现方法,易形成某一领域知识本体孤立.对于汽轮发电机组复杂的诊断知识以及概念间的关系和属性约束,利用本体可以实现规范化定义,提供全局与局部检索,实现知识表示、管理与重用[14].因此本文提出了汽轮发电机组多源异构的本体建模与知识融合的方法,利用软件Protégé_4.3构建了汽轮发电机组的全局与局部本体,详细说明了建模的方法与步骤,改进了知识融合的算法与多源知识检索的过程,通过多源知识的检索过程验证本体知识模型的可行性,最后通过SQI(spectra quest incorporated)机械故障模拟实验台模拟了汽轮发电机组转子不同的故障,验证了本体模型与知识融合算法的可行性与有效性.

1 汽轮发电机组多源异构知识源的选择

汽轮发电机组的知识源分布在各个不同的电厂中,这些知识概念的表示方式和存储方式都不同.电厂的知识存储方式有结构化、半结构化的数据库,也有非结构化的数据,例如文本、图像等[15].从不同的知识库中获取建模所需的知识,构建一个能够被共同理解的概念体系,以供汽轮发电机组知识共享使用.这些都可以采用本体进行结构化表示,实现不同领域、不同结构知识的统一表示[16].不同知识源运用不同的局部本体进行建模,映射关系则是这些领域本体之间的纽带,它能够加强企业间知识库的衔接,使汽轮发电机组领域知识融合为一个可供全局检索的知识群.

1.1 汽轮发电机组知识融合结构

各知识源以一个拥有公共词汇库的全局本体为基础,建立自己的领域本体结构,即局部本体[17].全局本体包含汽轮发电机组领域中最基本的概念和知识结构,是统一描述的概念,图1为汽轮发电机组的多源异构混合本体结构.局部本体在全局本体的基础上进行拓展,增添各个领域的特性和知识体系结构,通过映射关系使领域本体之间易于操作.如果知识源中的知识有变化时,不再需要对全局本体进行修改,大大降低了建模的难度,提高了查询的效率.

图1 汽轮发电机组多源异构混合本体Fig.1 Multi-source heterogeneous ontology of steam turbine

在汽轮发电机组混合本体的基础上,建立了其多源异构的知识融合框架,如图2所示,此框架主要有基础层、结构层和用户层构成.各层之间通过Web服务进行通讯,当用户层发出查询请求时,结构层会根据系统发出的要求选择适当的知识源,执行处理后将结果反馈给用户.基础层处于框架的底层,是各个知识源与单本体之间的交互.各知识源的数据储存方式是不一样,采用单本体对各个知识源进行统一化的描述,形成局部本体,为各知识源之间的融合提供基础.结构层是框架的核心,对用户层发来的请求进行处理,先根据全局查询语句查询,查询无果时,通过映射关系将全局查询语句分解成局部查询语句,从各个知识源抽取知识后,返回给用户层.用户层处于框架的顶部,主要任务是输入汽轮发电机组的故障信息和输出系统的诊断结果.

图2 汽轮发电机组多源异构知识融合框架Fig.2 Heterogeneous knowledge fusion framework of steam turbine

1.2 汽轮发电机组知识源的选择

1.2.1汽轮发电机组结构知识库

大型火电设备汽轮发电机组结构知识来源不一,主要有设备说明书、设备手册和设计原理图等[18],从这些资料中提取知识为汽轮发电机组设备维护和故障诊断提供指导.汽轮发电机组由多个系统组成[19],系统由组件组成,组件又由最基本的零件组成,层次结构如图3所示.主要系统有控制系统、机械部件、润滑油系统、滑销系统、辅助系统等.

图3 汽轮发电机组层次结构图Fig.3 Hierarchy chart of steam turbine generator sets

1.2.2汽轮发电机组故障诊断知识库

根据历史经验和有关专家诊断技术的不断积累,形成了汽轮发电机组的故障诊断知识库.这些专家经验和诊断案例分散在各个不同的领域中[20],利用本体提取这些经验和案例有助于设备的预防维护和实时诊断.汽轮发电机组故障主要有机械故障、电气故障、热力故障和辅助设备故障等,如图4所示.其中机械故障又可分为转子不平衡故障、转子不对中故障、油膜失稳故障等.转子不平衡故障又可分为原始质量不平衡、转子初始弯曲、转子热弯曲等.这样就形成了一个庞大的汽轮发电机组故障树.

图4 汽轮发电机组故障树Fig.4 Failure tree of steam turbine generator sets

1.2.3汽轮发电机组故障模式、影响和危害性

故障模式、影响及危害性分析是针对汽轮发电机组所有可能的故障,并根据对故障模式的分析,确定每种故障模式对汽轮机工作的影响.找出某一特定故障,并根据故障表现方式的不同程度及其发生率确定其危害性[21].汽轮机的FMECA部分知识如表1所列.

表1 汽轮发电机组部分FMECA Tab.1 Part FMECA of steam turbine generator sets

1.2.4汽轮发电机组检测知识库

汽轮发电机组检测知识库的不断丰富[23],形成了本体的检测域,如图5所示.检测域结构主要包括动力故障检测、控制系统检测、管路系统检测和现场要素检测等.检测的范围广泛,主要对象有汽轮发电机组(设备)、技术员能力水平(人员)、技术方法、运行环境等,这些对象在不断积累中形成了庞大的检测知识库.

图5 汽轮发电机组检测层次结构图Fig.5 Detection structure chart of steam turbine generator sets

2 汽轮发电机组多源异构本体知识建模

2.1 汽轮发电机组全局本体的构建

全局本体是一个公共词汇库,描述整个系统的语义,能够准确地对所有异构知识源中的概念和概念间的关系进行统一规范表达,使用户在检索知识时不用考虑各知识源的异构也能很快地检索出所需知识.

本体概念化是使用统一术语来对对象规范说明[24].本体一般由类、类属性、关系、关系属性、实例和公理集等组成.汽轮发电机组故障诊断本体(steam turbine diagnosis ontology,SDO)形式化定义为(SDO)=〈C,AC,R,AR,I,X〉.其中,C为汽轮发电机组中类集,AC为类的属性集,R是类间的关系集,AR为关系的属性集,I为实例集,X为类与类之间的严格约束公理集.

针对汽轮发电机组构建了全局本体的基本类,主要有故障特征、故障类型、故障现象、发生时间、故障机理、诊断方法、评价方法、维修策略、汽轮机型号和隶属机构等.汽轮发电机组全局本体的基本类如表2所列.

表2 汽轮发电机组全局本体基本类Tab.2 Global ontology base classes of steam turbine

汽轮发电机组故障诊断本体中的属性是对故障类内部结构的描述,对象属性描述的是类与类之间的关系.本文定义了9种主要对象属性,类的属性如表3所列.

表3 汽轮发电机组全局本体基本类属性Tab.3 Global ontology base classes property of steam turbine

在汽轮发电机组本体概念化的过程中,需要对各个概念约束,完成对知识的严格定义.除了以上属性定义,还需完善对知识的描述,如steam turbine type还需添加属性install date、equipment number等.定义概念和属性后,建立汽轮发电机组全局本体模型如图6所示.

图6 汽轮发电机组故障诊断全局本体模型Fig.6 Fault diagnosis global ontology model of steam turbine

2.2 汽轮发电机组局部本体的构建

根据各异构知识源的具体情况,获得各知识源的局部本体.在全局本体的基础上,通过定义各局部本体的概念属性,将模型继续扩展,不断对各个局部本体进行修改和完善,最终形成整个汽轮发电机组的故障诊断知识表示模型.利用建模软件建立汽轮机局部本体模型如图7所示.汽轮机的局部本体的知识源主要有结构域本体、故障域本体、检测域本体、FMECA本体等.构建局部本体的步骤和方法与构建全局本体的基本一致,其中最重要的是本体基本类的确定和类属性的规范.

图7 汽轮发电机组局部本体模型Fig.7 Local ontology model of steam turbine

通过对汽轮发电机组物理结构、故障知识、检测知识以及FMECA术语的概念化,得到汽轮机结构域本体、故障域本体、检测域本体、FMECA本体的类和对象属性,将类与对象属性进行连接,得到各个局部本体的模型.

3 汽轮发电机组多源异构本体知识融合

建立全局本体与局部本体的目的是为了实现知识融合,用户不用考虑知识源的分布和异构,输入查询语句,就会获得诊断结果的所有集合.建立全局本体与局部本体之间的映射是为搭建一个桥梁,实现多源知识融合与检索.

3.1 汽轮发电机组全局本体与局部本体间映射

由于汽轮机知识分布不同,同语义的概念在全局本体与局部本体可能会存在不同的名称,所以通过本体间的映射关系实现两个本体之间语义概念的关联,可以将源本体的实例映射到目标本体[6].汽轮机本体映射的流程如图8所示.

图8 本体映射流程图Fig.8 The chart of ontology map

定义全局本体OG和局部本体OL,分别从中选取概念CG和CL,分别计算概念相似度SN、属性相似度SA、全相似度SO,若是这三者中一个或者一个以上的最大相似值大于给定的阈值λi,则将这一概念对存储在结果集合中.用同样的方法完成本体中所有概念对的相似度计算,最后在结果集中选取相似度值最大的概念对成立映射关系.流程中主要步骤如下:

1) 概念相似度的计算

由于汽轮机本体的命名一般由词组组成,所以首先对其进行词组序列化、去冗余词和去连字符预处理.根据字符串映射法ISub[13]映射处理后,判断全局本体与局部本体的概念相似度.分别给定汽轮发电机组全局本体与局部本体的两个概念CG和CL,CG∈OG,CL∈OL.概念CG和CL的语义相似度为

(1)

(2)

(3)

式中:IDG、IDL分别表示CG和CL在OG、OL中的URI;LbG,LbL分别表示CG和CL在OG、OL中的名称;SG、SL表示CG和CL在OG、OL中的同一词集合;wG、wL为权重,此权重由专家给出.

字符串映射法ISub为

ISub(tG,tL)=comm(tG,tL)-diff(tG,tL)+

winkler(tG,tL)

(4)

式中:tG、tL表示全局与局部概念对的字符串;comm(tG,tL)表示字符串的相同部分;diff(tG,tL)表示字符串的差异部分;winkler(tG,tL)表示修正系数.

2) 属性相似度的计算

(5)

式中:θi为局部本体概念属性的权重值.

3) 概念全相似度的计算

由于现实中会存在同形异义或异形同义的情况,不能单纯凭概念的相似度或者属性的相似度来认定两个概念的重合程度.分别给定概念相似度和属性相似度的权值,得到概念全相似度的计算公式为

(6)

式中:φi,φj为权重值.

映射的条件就是概念相似度、属性相似度和概念全相似度是否大于各自给定的阈值.若其中一个或者一个以上满足条件,则被存储到结果集合中,以供映射时调用.

3.2 汽轮发电机组多源异构知识检索的实现

多源异构知识检索是整个汽轮发电机组知识集成的关键步骤[25].在给定查询请求时,无须了解底层知识源的情况,直接对全局本体发送查询请求,以汽轮机全局本体和局部本体间的映射关系为基础,将查询语句分解成若干条子查询语句,实现多源异构情况下的知识检索.知识检索的过程如图2中结构层所示,主要包括:故障源查询请求的提出、全局查询语句生成、底层知识源的确定、查询语句分解、子查询语句的生成、查询结果集成、查询结果输出.其中,根据映射关系分解全局查询语句是最重要的一个步骤,具体的算法如下:

4 实例验证

本文首先介绍了汽轮机的知识源,然后根据各个不同的知识源建立汽轮机本体模型,根据字符串映射法ISub设计全局本体与局部本体映射算法,实现了汽轮机多源知识融合和检索.主要创新点是汽轮机本体知识模型的构建及全局本体与局部模型间映射算法的设计.为了验证其合理性,采用实验台模拟汽轮机的经典故障,即转子质量偏心故障与转子不平衡故障.实验台如图9所示,由电动机、电动机变速控制器、转子系统、数据采集器和信号分析软件等组成.

图9 SQI机械故障模拟实验台Fig.9 SQI simulation test bench(MFS) of mechanical fault

图10 质量偏心故障特征Fig.10 Fault characteristics of mass eccentricity

图11 质量偏心轴心轨迹Fig.11 Track of shaft axis of mass eccentricity

图12 不平衡故障特征Fig.12 Fault characteristics of imbalance

图13 不平衡轴心轨迹Fig.13 Track of shaft axis of imbalance

图14 汽轮机本体模型推理过程图Fig.14 Ontology model reasoning process of turbine

图15 OWL_Viz推理结果图Fig.15 Result chart of OWL_Viz reasoning

此实验通过定义共同属性,验证了局部本体子类“转子及动叶片”和“转子不平衡”与全局本体子类“转子质量偏心”之间的本体映射算法,证明汽轮发电机组多源异构知识融合算法是可行、有效的.

5 结论

故障诊断技术已发展成集状态检测、信号处理、模式识别和智能决策等为一体的新型交叉学科[26].汽轮发电机组多源异构的知识建模与融合为故障诊断提供了方法与技术.本文将全局本体与局部本体的映射算法引入汽轮机,能够使多源异构的知识融合,分析汽轮发电机组多源异构知识源的选择.根据汽轮机多源异构知识定义了汽轮机的概念属性,借助Protégé软件构建了汽轮机可供检索的全局本体与局部本体模型.提出了汽轮机本体映射与知识融合算法,并通过实例验证了算法的可行性与有效性.

猜你喜欢
发电机组异构全局
ETC拓展应用场景下的多源异构交易系统
基于改进空间通道信息的全局烟雾注意网络
领导者的全局观
试论同课异构之“同”与“异”
大型核电汽轮发电机组自主化成果介绍
内燃机发电机组应急冷却系统优化
多源异构数据整合系统在医疗大数据中的研究
二分搜索算法在全局频繁项目集求解中的应用
660MW发电机组氢气泄漏原因与处理
吴健:多元异构的数字敦煌