李红亮,张振海
(兰州交通大学自动化与电气工程学院,兰州 730070)
我国高速铁路快速、大规模的发展,为人们的出行带来了极大便利。车载设备作为列控系统的重要组成部分,也是保证高铁安全运行的核心。目前,我国高铁车载系统在维修案例方面存在案例知识结构性差,重用率低,维修经验缺少有效存储与检索的问题。这些问题会加大维修人员的工作量,降低工作效率。因此,要对车载设备维修案例知识的管理提出更高要求。
近年来,国内外专家学者致力于设备维修知识的表示方法研究。LEE[1]提出一种可以简化流程,在很大程度上提高维修速度的知识管理工具,它以神经网络作为媒介,适用于设备维修领域;DESOUZA[2]提出了一种可以运用到设备维修中的知识表示框架;PENG等[3]开发了便于知识获取、检索与重用的知识表示模型及协同系统;王道平等[4]的研究成果增强了设备维修诊断的效率,在综合考虑了维修的规程、经验和原理后,结合类定义与规则推理,用两者的结合形式表示维修诊断知识;张勇等[5]提出了三层框架,三种本体分别为应用、领域和构建元,在本体概念统一的基础上保证了类的一致性,将本体知识引入到设备维修管理体系的构建中,可大大提高维修知识的可重用性;周扬等[6]在飞机故障知识的基础上,引入本体论,构建了飞机故障本体,但该本体并没有对故障结构的层次性进行明确表示;侯成义等[7]提出了不断优化整合维修知识的过程,此过程的实现,依赖于维修案例知识系统、维修经验知识系统、故障诊断系统。从研究范围来看,随着产品全生命周期理论的不断完善,知识重用开始从设计阶段向制造阶段发展,也有学者开始研究产品维修服务阶段的知识重用问题[8-9]。
由国内外在设备维修领域的众多研究中可以看出,将本体引入维修案例知识建模,可实现高效的案例检索与知识整合,但维修案例知识之间存在相似性。为减少工作人员工作量,缩小检索范围,提高效率,首先,提出一种基于本体的高速铁路车载设备维修案例知识管理框架;其次,构建由五要素组成的高铁车载设备维修案例本体;最后,提出一种本体与CBR(Case-Based Reasoning)相结合的案例检索模型。不仅可以减少相似度计算量,还能简化高铁维修案例的表示过程,可很好地实现维修知识的快速检索与重用。
案例是人们对生活中典型且富有意义的事情的记录。维修案例知识是指在维修领域具体化的知识,维修案例则指记录设备从发生故障到故障排除整个过程。在这个过程中,涉及到多方面的知识,首先,需要理论知识;其次,需要技术方面的知识排查故障;最后,用操作知识排除故障[10]。在对维修案例进行了大量的调研整理后,可知信号设备维修案例的组成主要有三类,维修经验、技术理论和组织机构。车载设备维修案例结构如图1所示。
图1 车载设备维修案例结构
经分析车载设备维修案例的组成结构,可知其特点如下。
(1)复杂性。车载设备故障案例记录涉及多方面的知识,概念间存在复杂性关系。
(2)经验性。车载设备维修是一项实践性和专业性很强的工作,维修经验大多都是工作人员在维修过程中一点点摸索并积累下来的。所以要借鉴学习大量的维修案例,积累一定经验后才能提高维修的工作效率。
(3)多样性。在记录维修案例时,记录形式多样,可用图表、文字或视频来描述当时的故障信息。
(4)重复性。在记录的维修案例中,存在大量相似甚至相同的案例。
(5)数字性。有些设备发生故障后,维修人员在维修过程中会记录下一系列故障数据,而这些数据往往可以帮助维修人员判断设备故障情况,可在很大程度上提高案例诊断的精确度和设备维修的准确率。
上述5个特点,对知识表示方法的一致性和可扩展性有很高的要求,对各要素概念、属性及相互关系能够准确清晰地表示,这样才能更好地对故障维修案例进行结构化、规范化管理。
本体在人工智能和智能信息集成等领域发挥着越来越重要的作用[11]。本体通过一种特定的语言定义和说明后[12],能够让计算机系统理解并且解析静态的预案文本。通过运用本体构建高铁信号设备维修案例知识模型,直观表达出技术理论、维修经验、组织机构之间的关系,有利于集成设备维修案例的各类信息,也有利于案例知识的规范化表示及灵活管理[13],同时为今后车载设备智能维修系统的发展奠定基础。
本体构建工具是一种应用程序,它可以创建、编辑和处理本体。Protégé是基于Java环境且由斯坦福大学医学信息研究组开发编写的。由于Protégé界面友好,使用方便,开放源代码,并且还支持中文,因此,选择Protégé作为本体模型构建工具。
构建本体的方法有很多种,大多数是以特定领域为导向,故方法的设计一般根据具体的项目而定。当前,本体构建方法主要有以下4种: ①骨架法,它主要提供一个构建本体的流程;②TOVE法,也称“评价法”;③Methontology法,此方法给出了构建本体的三个阶段;④七步法,由斯坦福大学开发[14]。以上这些方法都是前人在进行具体项目时总结出来的经验。文中将七步法和骨架法结合在一起,提出一种针对高铁信号设备维修的本体构建方法,如图2所示。
图2 车载设备维修本体构建流程
当前,由于大多数设备维修案例知识存在结构性差,利用率低,维修经验缺少有效存储的问题,本次提出了一种模块化结构理念。此设计是基于本体的案例知识管理框架,如图3所示,可对案例知识进行精细化的管理。此框架主要包含三大部分,也可理解为三个阶段,分别为知识来源、知识组织和知识应用。
图3 车载设备维修案例知识管理框架
第一,知识获取阶段的主要内容是搜集各种关于设备维修的相关信息,如设备维修的技术标准、维修手册、以往专家对设备维修总结的维修经验和之前的维修案例,这些信息和非结构化的知识都可通过概念化后作为知识库的基础知识。这部分内容大多是由专家组和研究人员共同进行研究,以保证所获取知识的正确性和共认性。
第二,知识管理阶段首先是对知识获取阶段所获得的概念化知识进行分类,之后进行模块化管理。通过分析真实案例,提取出一个案例模板,继而建立维修案例表示本体,这个本体可以调用知识库中的知识。最后,将案例进行实例化。
第三,知识应用阶段,主要对案例库中的知识进行检索、修正和展示等。可使历史案例及其中经验与数据发挥潜在价值。
本体论可以实现领域知识的“可重用性”与领域术语的“标准化”。以上文构建的车载设备维修案例知识体系为基础,以本体建模软件Protégé为载体,构建本体知识模型。车载设备维修过程中所涉及到的概念、术语等语义化后构成维修领域本体知识。信号设备的本体结构如图4所示。
图4 本体结构
由图4可知,将整个维修过程分为四大部分,其中,包含了4个子本体:结构子本体,原因子本体,方案子本体和故障模式子本体,对知识进行分类管理。
3.1.1 结构子本体
此本体主要是对设备结构、各部件之间的关系和模块功能等信息进行管理。其概念集可用一个五元组来表示:SC={S-Id,S-Name,S-Mark,S-Sys,S-Fun}。其中,S-Id为设备代码,S-Name为设备名称,S-Mark为设备标识,S-Sys为设备所在系统,S-Fun为设备功能。
3.1.2 原因子本体
原因子本体表示对设备故障的原因分析进行本体表示,用来具体化故障模式。它既对故障现象进行分析说明,又对维修方案制定提供了一定的依据。其概念集可用四元组表示:RC={R-Phe,R-Pos,R-Dre,R-Ire}。四元组依次表示故障的现象、部位、直接原因和间接原因。其属性关系可以用三元组表示:RR={has_phe,has_dre,has_ire}。
3.1.3 方案子本体
方案子本体用来表示故障维修的方案。在制定维修方案时,要根据故障原因及现象视情况而制定,故障造成后果的紧急性和故障维修的经济性也要考虑在内。方案子本体可用五元组来表示:
PC={P-Pos,P-Rea,P-Sol,P-Env,P-Typ}。五元组依次表示:维修部位、故障原因、维修方案、维修环境、维修类型。
3.1.4 故障模式子本体
故障模式子本体表示设备故障的模式和类型。用MC={M-Phe,M-Typ,M-Mod,M-Lev}表示。这四元组分别表示故障的现象、类型、模式和等级。
3.1.5 高铁维修案例领域本体图
高铁维修案例OntoGraf图如图5所示。
图5 高铁维修案例OntoGraf图
构建领域本体,首先,可对维修中概念间的关系做一规范;其次,可实现案例检索在同一领域内进行,通过结构相似度和情景相似度双重匹配,检索出可供新的维修任务参考的相似案例。
通过对大量的故障案例进行分析,总结出高铁车载设备包含故障信息、故障描述、故障原因、维修方案、处理结果及评价反馈6个方面的信息[15]。案例知识体系如图6所示,在Protégé中创建维修案例表示本体如图7所示。
图6 维修案例知识体系
图7 维修案例表示本体创建
属性可分为对象属性和数据属性两大类。类间的相互关系可由对象属性描述;概念的元素特征和数据类型则由数据属性表示。车载设备维修案例本体中的部分属性如表1所示。
表1 车载设备维修案例本体部分属性
MyCBR[16]是一款由德国人工智能研究中心研发的便捷、支持推理框架设计、扩展性强、适应性强的案例推理工具,可作为Protégé的插件使用。
传统的CBR进行案例检索时,重点在于要求目标案例与源案例的相似度最高,但这种相似度最高的案例并非是最适用、最便于重用的案例。高铁车载设备维修案例库的建立,其目的在于当出现新的故障时,能够及时、准确、快速的检索出与新故障相似度高的历史案例,然后根据相似的历史案例处理方案,对新故障实现快速准确的处理维修。“最相似”并不是案例检索的最终目标,比“相似”更为重要的是“最适合重用”。故可以从案例的相似度、适应度两方面对案例知识进行衡量。
图8是在传统CBR基础上建立的知识重用模型。此模型主要是在两阶段相似度之后选出相似的案例,判断这些选出的相似案例是否满足提前设置好的相似度阈值,若满足,则继续计算其案例适用度,最后,选择适用度最大的案例将其进行重用。此过程中的重点是两阶段相似度计算和案例适应度的计算。
图8 本体与CBR结合的知识重用模型
前文提出了一种领域本体与CBR相结合的案例检索方式,此方式的实现,要以两阶段案例相似度计算法作为基础。第一阶段,进行模糊检索,此过程是利用语义相似度缩小检索范围;第二阶段是在已经缩小的案例范围内计算属性相似度。CBR与本体结合的检索模型如图9所示。
图9 CBR与本体结合的检索模型
4.1.1 本体网结构相似度
领域本体网结构的相似度,是指目标案例与源案例的本体网结构中,重叠节点数占总结点数的比例。所占比例越高,说明两案例中的概念重合度越高,相似概念越多,可认为两者的相似度较高,此结果也可以从整体上衡量两案例的相似度。
领域本体中含有多个分支,故首先要计算其分支相似度,其公式如下
(1)
(2)
式中,φK为计算相似度时第K个分支的权重,此值可以反映出维修人员对于维修要素的重视程度[17],故确定此值时,要考虑产品特性和维修需要。
4.1.2 属性相似度计算方法
在结构相似度的基础上,可以缩小检索范围。属性相似度可分为两种:类别型和数值型。
(1)属性类别相似度计算公式如下
(3)
式中,分母表示两概念的属性总和,分子表示概念间的交集,即共享概念。
(2)数值型相似度计算
a.精确数值
(4)
式中,|at-as|为源案例与目标案例中数值之差的绝对值。
b.符号数值
(5)
此公式表示源案例与目标案例符号数值在完全相同时相似度取1,反之,取0。
c.区间数值
(6)
式中,L为区间长度。分子表示两概念的交集长度,即共享部分的长度;分母表示两概念不重叠部分的长度。这就表明,两者区间重合率越高,相似度也就越高。
通过4.1节对两阶段相似度的计算,基本可以检索出与目标案例相似度较高的案例作为备选。由于对高铁车载设备的维修要求快速、准确、高效,故需计算案例适应度,可衡量检索到的案例是否可更改和再利用。由此,引出案例适应度的计算。
假设目标案例与源案例的情景部分分别有n个属性Y={y1,y2,…,yn}和k个属性
Xi={xi1,xi2,…,xik}。集合Y和Xi中对应的属性值得集合分别为asY(t)和asXi(t)。
(1)属性相容数
m1i={t|t∈(Y∩Xi)}
(7)
此公式用来计算第i个源案例与目标案例的共享情景属性个数。
(2)属性匹配数
m2i={t|t∈(Y∩Xi)∩(asY(t)=asXi(t))}
(8)
共享属性中数值相等的个数称为匹配数,用此公式计算。将m1i与m2i进行比较,得出以下3种结果
(9)
基于以上两小节对相似度计算的总结,本节以图5模型为目标案例进行实例验证,以验证所提方法的可行性。
(1)本体网结构相似度
以图5模型的中“Fault-Cause”、“Environment”和“Fault-Position”3个分支进行案例分析。用“1、2、3”分别表示3个分支。
专家给出3个分支的权重分别为:φ1=0.5,φ2=0.3,φ3=0.2。
各分支每层的权重分别为:ω11=ω12=0.2,ω21=ω22=0.2,ω31=ω32=0.1,ω41=ω42=0.5,ω13=0.2,ω23=0.9。
当给出2个源案例,与目标案例进行本体网相似度计算,计算过程如下。
①源案例1
BoSim(At,A1)=0.5×0.93+0.3×0.9+
0.2×1=0.935
因此,目标案例与源案例1的本体网结构相似度为0.935。
②源案例2
0.89BoSim(At,A2)=0.5×1+0.3×0.83+
0.2×0.89=0.927
因此,目标案例与源案例2的本体网结构相似度为0.927。BoSim(At,A2) (2)属性相似度 多普勒雷达是高铁车载系统的测速测距模块中的测速设备。故以3个多普勒测速雷达的故障维修案例作为源案例,计算目标案例的属性相似度。具体数值如表2所示。 表2 多普勒测速雷达维修案例库 ①精确数值型 ②符号型 Sim异常工作(at,a1)=1 ③区间数值 结合给出权重,求得属性相似度如下 Sim(at,a1)=1×(0.15×0.578+0.15×0.367+ 0.2×0.14+0.3×1+0.2×0.75)=0.62 同理,其他2个源案例与目标案例的相似度为0.666和0.685。 (3)案例适应度 假设设定阈值为0.65,则源案例1属性相似度0.62不符合。此时,案例集可表示为:{目标案例2,目标案例3}。 由表2可知,源案例2与目标案例的共享情景属性m12=5,属性匹配数m22=1;可以得出0 同理,源案例3与目标案例的共享情景属性m13=5,属性匹配数m23=2,同样为部分匹配。 上述计算可知,源案例2和源案例3与目标案例均为部分匹配,但m23>m22,这说明源案例3比源案例2具有更高的适应度。源案例2和源案例3的属性相似度分别为0.666和0.685,相差不大,但在案例适应度的评价方面,源案例3高于源案例2。故可以选择源案例3作为解决当前故障问题的参考,可将其修正后重用。 (1)针对高铁车载设备维修知识结构性差的问题,建立了本体模型,确定了维修案例的特征及构成要素,运用本体对维修知识进行统一表示。同时,采用三层结构的知识管理框架,对维修知识进行模块化管理。 (2)针对案例知识重用率较低的问题,提出了一种本体与CBR相结合的知识重用模型,两阶段相似度计算和案例适应度计算是此模型中的关键,运用此模型可有效提高案例知识的重用率。 (3)在案例检索过程中,提出一种本体与CBR结合的案例检索模型。在此过程中需给定一个阈值,在满足相似度阈值的案例中,选取适应度高的案例进行案例修正,以有效完成知识重用。通过一个实例验证了所提两阶段案例相似度及案例适应度方法的有效性。5 结论