基于本体的机械产品知识仓库研究与应用

2010-01-01 01:44邰丽君董玉德武照云
图学学报 2010年2期
关键词:实例仓库本体

邰丽君, 赵 韩, 董玉德, 武照云

(合肥工业大学安徽省数字化设计与制造重点实验室,安徽 合肥 230009)

随着信息技术的迅猛发展和各种先进制造理念的产生,制造业正在迅捷地向并行化、分布式、数字化和智能化制造方式转化。一方面,企业内产生的设计开发资料随着产品的不断增加而日益膨胀,另一方面企业又必须不断地从外界获取各种信息,由此产生的各种知识堆积而且成指数增长。因此,如何在产品知识仓库中数字化表达、捕获、交换、再利用设计及其过程知识、有效地管理已有的产品知识,以及如何对基于知识的开发系统进行分析与建模,成为提高产品开发速度的关键。在产品知识仓库设计方面,已有很多文献进行了研究,朱文博等[1]研究和开发了一种基于特征的知识库系统,孙延明[2]和张为 民[3]等提出了一种基于案例(CBR)的知识获取方式,而刘晓冰[4]等将数据仓库(OLAP)技术运用到知识仓库的设计和构建中。

本文提出基于本体的知识仓库,通过构建企业知识本体,形成基于本体的知识语义骨架网络领域模型,然后利用知识本体映射技术,将各种设计知识与不同的本体元素进行映射,使数据实体映射为基于本体的知识元,从而实现产品设计知识的统一组织和管理。

1 机械产品知识仓库的架构和功能

机械产品知识仓库是面向产品数据分析和知识发现、以“产品为中心”的知识仓库。主要用于解决产品开发全生命周期中知识管理与知识重用问题,将重复的设计和工程任务自动化,具体内容包括产品知识获取、整理、组织、表示、共享和重用等,及时准确地向产品开发人员提供产品设计、制造、装配、加工等各方面知识与帮助,并支持产品的并行协同虚拟开发。整个知识仓库的架构如图1所示。

图 1 机械产品知识仓库体系结构

(1) 知识源

知识源主要有:产品标准、产品文档、产品实例和专家知识等。各种产品应用系统中的产品原始数据、中间数据和最终数据,像在数据仓库中一样,数据在进入知识仓库存储体之前必须进行各种处理,如提取、净化、转化等。某些数据库、文本、Web等知识源,可通过知识发现系统处理后存入知识仓库存储体。其它知识源,如各种论坛的总结性知识,智能代理在网络上获得的信息,这些信息在进入知识仓库之前,首先放在临时仓库,当知识管理者对它们进行有效性验证以后才可以输入到知识仓库中。

(2) 知识仓库存储体

机械产品知识仓库存储体是产品知识仓库的中心,这里存储所有的知识,但并不是所有的知识储存在一个统一的服务器中,包括各种类型的数据库,并且分布在很多位置,往往有备份,知识仓库存储体中的知识主要分为设计资料库、虚拟产品开发辅助库、虚拟产品建模辅助库、产品知识库和相关信息库等。产品知识仓库需要借助于数据库管理系统的强大功能来辅助对知识仓库的管理。

(3) 人机交互界面

人机交互界面主要包括管理界面、内部用户界面和外部用户界面等。知识管理员需要借助于友好的管理界面对知识仓库中的知识进行维护、更新等。内部用户根据不同的权限通过内部用户界面可以浏览和写入相关产品数据和信息。外部用户分为一般用户和协作用户,一般用户通过Web服务器只能浏览或下载系统公开的知识,而协作用户则可以通过Web服务器共享产品设计知识。对于计算机水平不同的人员采用不同的输入方式,输入界面应该友好、方便。

(4) 知识仓库工具

知识仓库工具主要包括知识获取辅助工具、分析工具、知识发布工具、知识发现工具、知识检索引擎等。

2 知识仓库中的本体

语义描述的基础之一是本体,为了组织设计知识以便于知识需求和检索,需要建立本体模型,并利用本体中定义的术语作为元数据来标注,以有效描述大量的设计原理、领域知识、设计案例和专家经验等。知识本体作为领域知识规范的抽象和描述。可以构造丰富的概念间的语义关系,能够准确描述概念含义以及概念之间的内在关联,形式化能力最强。同时本体组织便于逻辑推理获取概念之间的蕴涵关系,提供较高的知识推理能力。因此,运用知识本体进行设计知识的表达,可以更好地实现基于语义的知识共享和知识需求。

2.1 知识本体结构

针对机械产品设计知识的特性,知识本体的结构可描述为如下四元组:

其中 KO表示知识本体,C表示某领域的概念集,P是建立在C上的属性集,M是建立在C上的方法特性集,R是建立在C上的关系集。一个概念的定义和描述往往会涉及到多个其它概念,概念之间具有关联性和继承性。式(1)是领域知识本体的总体表示和描述,对于知识本体中的每一个知识本体元素,可用式(2)来表示。

其中 q表示知识本体元素,c表示某个领域概念,如齿轮、轴、轴的结构设计等,P、m分别是概念c上的一组属性和方法,r则是建立在c上的与其它概念的一组关系。实际应用中,人们常常使用式(2)。

为了进一步明确知识本体元素的含义和内部结构关系,将式(2)分解为式(3)和式(4)

式(3)是某一领域概念c自身的描述,体现为对属性集P和方法特性集m的定义和描述;式(4)则是概念c与领域中其它概念之间的一组特定的领域关系r的描述,例如并列、隶属(度)、关联(度)、蕴涵、双向蕴涵、继承关系等。

根据以上对知识本体的结构描述,若知识本体由n个本体元素组成,概念集C=(c1,c2,…,cn)和建立在C上的关系集R={r1, r2, …, rn}将共同组成一个有向图G(X, E),其中X为图的点集,E为边集,X的值域为概念集C,E的值域为关系集R。由此不难看出,知识本体通过概念之间的关系集R构成了相对完善的知识内容体系和网络化结构,知识本体的网状结构如图2所示。

图 2 知识本体的网状结构

图中的椭圆框代表一个领域概念Ci,而一个椭圆与其它椭圆之间的箭头连线代表概念Ci,与其它概念的关系,诸如关系ri1, ri2, …, rij等,与之关联的概念不同则概念间的关系一般也不相同。例如,概念A与概念B之间是包含关系,而概念A与概念C则是关联或并列关系。图中的单向箭头表示关系不可逆,而双向箭头则表示两个概念间的关系可逆。因此,概念间关系的多样性,使得关系集R构成概念之间的层次关系、关联关系、继承关系等多维关系的网络结构,代替传统知识分类分层组织方法的主题之间单一层次结构关系,能够更加方便地管理知识的分类和实现基于任务过程的知识动态配置。

本体不但有好的逻辑基础,还有相应的描述语言支持基于本体的应用系统开发。典型的本体描述语言有RDF(S),OIL,DAML+OTL和OWL,按表达能力由弱到强的顺序给上述语言排序是RDF(S)、OTL、DAML+OIL、OWL。这些语言都采用XML作为语法基础,在继承的语法和表达能力的基础上进行扩展。是制定的面向语义的本体标记语言,是语义领域适合语义应用的本体标记语言的最新综合研究成果。本文下面仅对表达能力最强的OWL进行分析。

2.2 知识本体的映射

由于本体构建的分布性,且目前还没有统一的构建标准,不同的用户使用不同的方法构建出的本体也是不同的,即使是同一领域也会有不同的本体,这就是本体的异构性。为了解决异构本体间的互操作性,便于本体间的知识共享和重用,人们提出了本体映射方法。所谓本体映射[5],是指两个本体存在语义级的概念关联,通过语义关联,实现将源本体的实例映射到目标本体的过程。

本体映射过程如下:① 标准化:将本体原先的形势转换成为一种可进行相似性计算的形势;② 选择用于映射的概念对;③ 相似性计算;④ 映射执行:根据第三步的结果,对候选映射进行筛选,建立映射;⑤ 映射后处理:返回至第2步,重复运行,直到达到满意结果。其中相似性计算是本体映射的一个重要步骤。目前常用的相似性计算方法[6]很多,如基于实例的方法、利用启发规则方法等,但都有其局限性,本文从属性、语法、结构、实例4个方面进行相似性的计算,并把计算结果进行合并,得出最终的概念相似度。

定义1相似度Sim:V1×V2×O1×O2→[0,1],相似度在0和1之间。Sim(A, B)表示A和B之间的相似度。V1和V2是两个本体所基于的术语集,O1和O2是需要映射的两个本体。Sim(A, B)=1:表示两个概念完全相似;Sim(A, B)=0:表示两个概念完全不相似。

定义2属性相似度Simsx(A, B)

在本体中,每一个属性也是一个概念。设概念A 的属性为ai,概念B 的属性为bj,两个属性间的相似度记为ASim(ai, bj)。设概念A 和B 之间共计算出m 个ASim(ai, bj),并设置相应的权值wk。则属性相似度为

定义3语法相似度Simyf(A, B)

其中 syn(A )表示概念A 的同义词集;len(A) 表示概念A的字符串长度;ConSubStrings表示A、 B 共有的字符串长度。

定义4结构相似度Simjg(A, B)

其中 Af、As、Ab分别表示概念A 的父、子、兄弟概念集;概念B 类似;α、β、λ 表示权重因子。

其中 S、T 分别表示A、B 的特征集合,(S∩T)≠Ф, S/T 表示集合S 除去集合T 中具有的特征;T/S 反之类似; ε 是非公共特性的相对重要程度(为可调节参数)。

定义5实例相似度Simsl(A, B)

其中 I(a)、I(b)表示本体A、B 中概念 a、b 所拥有的实例数;I(Aa.b)表示本体A 中属于概念a也属于概念b 的实例数;I(Bb.a) 表示本体B 中属于概念b 也属于概念a 的实例数。

总相似度将按照式(1)~式(4)计算得到不为0 的相似度赋予不同权值计算总相似度如下所示

其中 Wyf,Wsx,Wjg,Wsl≥0。

3 机械产品知识表示

3.1 产品知识模型

产品信息模型建立是机械产品知识仓库的关键。利用以描述逻辑为基础发展而来的OWL本体表示语言可以对产品概念设计知识进行本体建模。而本体作为知识的一种良好载体,在语义层面不但提供了形式化描述知识的基础,而且使系统之间的知识级共享和集成成为可能。该知识仓库对产品信息模型定义如下:

(1) 产品结构模型 结构模型包括4个基本类:部件、型号、材料和视图;6个基本属性:子部件、结构关系、部件属性、部件型号、部件材料和部件视图。

(2) 产品行为模型 行为模型包括一个基本类:行为;4个基本属性:子行为、行为关系、行为类型、行为相关部件。

(3) 产品功能模型 功能模型包括一个类:功能;6个基本属性:功能目标、子功能、功能类型、元功能、目标功能、功能相关部件。

(4) 产品需求模型 需求模型包括一个类:需求;5个基本属性:需求提供者、子需求、需求类型、需求提出时间、需求相关件。

(5) 产品实例模型 实例模型包括一个类:实例;5个基本属性:实例设计者、子实例、设计时间、实例类型、实例相关件。

整个产品信息模型如图3所示。

图 3 产品知识模型

3.2 产品表达实例

根据上述产品知识表达模型,采用语义web语言owl来描述产品本体,完整的产品本体描述应包括:定义领域空间、定义此本体的概况、定义基本类、定义基本属性等。具体构建过程如下:

(1) 定义领域空间

(2) 定义此本体的概况

(3) 定义基本类

(4) 定义基本属性

4 基于本体的案例推理

目前关于CBR[7]系统的实现技术一般都围绕CBR的几个关键步骤进行如案例的表示、案例的组织、案例的检索等。本文提出基于本体的案例知识表示模型。其中,案例本体可作为案例知识的一种通用表示模型,不但可以对案例知识进行有效表达,支持基于内容的检索,还可表达案例的特征并支持CBR。

本文在案例库中引入了3种本体:概念本体,表示领域概念及概念之间关系;案例本体,用来表达案例实体;分类本体,表达知识的层次结构,可用建立案例的层次分类体系。

定义6概念本体To::=(Ocbn, Ct, Rt, It),其中,Ocbn是领域名,Ct概念集,Rt是关系,It是实例集,它包括概念实例集和关系实例集两个部分。

定义7案例本体Caseo::=(Ocbn, Oc, Rc, Ic),其中,Ocbn是领域名,Oc是案例集,Rc是关系,Ic实例集,包括案例的描述属性实例集,案例的数字属性实例集,案例与案例特征关系实例集。

定义8分类本体Tao::=(Cta, Rta, Ita), 其中,Cta是分类概念集,Rta是关系集,用来表示分类层次关系,Ita是实例集,是关系的实例集。

定义9案例知识库Ocdb::=(Ocbn, Oc, Rc, Ic),其中,Ocbn是领域名,Oc是本体集,记为Oc=(To(概念本体),Caseo(案例本体),Tao(分类本体));Rc是关系集; Ic是实例集。

依赖本体中类的定义,案例在知识库中表现为以属性作为维度的特征向量,每一维代表对应属性上的取值。即任意的案例x可以表示为如下特征向量:

<A1(x),A2(x),…,Ak(x)>

其中 案例x有k个属性,Aj(x)表示它的第j个属性的取值。

实例推理步骤如下:

(1) 问题特征的抽取、描述和输入。

(2) 根据问题案例特征信息进行相似案例的检索。

(3) 问题案例与实例属性匹配与相似性计算。首先计算各个属性的相似度。如果期望值是一个确定值,按照式(1)计算其相似度;如果是一个范围值,按照式(2)计算相似度。最后按照式(3)把各属性的相似度综合成实例的相似度。

其中 x, y∈ [α ,β ]

其中 ωi表示第i个属性的权值。

(4) 最后把检索到的相似实例按照相似度的高低进行排序,并选取相似度最大的实例作为备选方案。

5 应用案例

上述分析方案在作者开发的制造业知识管理系统的产品知识仓库子系统中得以应用。该系统采用 Protégé2000+OWL构建描述本体;用 Jena 实现本体与数据库之间的连接,数据传递,实现推理机。

系统包括本体构建模块、映射本体库模块、知识检索模块、知识发现获取模块和系统管理用户界面等6个模块。企业知识本体是整个系统的基础,其他各个模块均依赖于企业知识本体来建立。构建本体库采用知识分类的方法,对各类别知识本体概念化,并赋予属性,同时必须对属性进行本体实例化。原数据源采用映射、本体概念关联的方法导入到本体库中,构建知识获取模块,方便知识的获取。系统界面如图4、图5所示。

图4为类的基本操作界面,可以进行添加类、添加子类、删除类、查找类、浏览类、浏览与类的相关项等。在图右边面板里可以对选定的类描述说明,记录下与这个类相关的信息。在Documentation中可以对类进行详细的文本说明,在Constraints中给出类的约束。下面的槽列表给出的是类的描述属性。在该模块中类的建立体现了分类学的层次结构,类与子类是一种树结构关系,类与类、类与子类间可以建立本题关联。

把知识进行本体的实例化是知识获取的关键,图5是系统软件实例库界面,在该模块中可以为选定的类建立实例、删除实例、浏览实例相关项和查找实例。每个实例的属性都可以设一个属性值,值的类形式多样化。这些值可以是整数、实数、布尔值、字符等等,还可以是类和自定义标志,甚至可以取其他的实例作为值。实例的形式可以是表示知识的各种数据格式,包括文档、图形、音像等。

图 4 类的界面

6 结 论

本文提出基于本体的知识仓库,建立了一种基于本体的本体化产品知识模型。对知识仓库的功能体系结构、知识本体的构建、本体映射以及基于本体的案例推理都进行了深入地研究,采用 Protégé2000+OWL构建描述本体,用 Jena 实现本体与数据库之间的连接。并将研究内容在制造业知识管理应用系统的机械产品知识仓库子系统中进行应用。

[1] 朱文博, 李爱平, 刘雪梅, 等. 基于知识的冲压产品集成建模[J]. 同济大学学报(自然科学版), 2006, 34(4): 528-533.

[2] 孙延明, 骆 雯, 刘 斌, 等. 基于CRB的液压缸设计方法[J]. 计算机辅助设计与图形学学报, 1999, 11(2): 176-199.

[3] 张为民, 李爱平. 模具设计案例知识管理系统的研究和开发仁[J]. 计算机工程, 2005, 12(3): 197-199.

[4] 刘晓冰, 杨春立, 高天一, 等. 基于设计仓库的产品设计知识管理方法研究[J]. 计算机集成制造系统 —— CIMS, 2005, 11(6): 831-835.

[5] 黄烟波, 张红宇, 李建华, 等. 本体映射方法研究[J].计算机工程与应用, 2005, 18: 27-33.

[6] 李选如, 何洁月. 语义集成:本体映射方法研究[J].计算机技术与发展, 2007, 17(2): 122-124.

[7] 丁剑飞, 何玉林, 李成武. 基于本体的分布式CBR设计系统[J]. 计算机工程, 2007, 33(21): 183-185.

猜你喜欢
实例仓库本体
眼睛是“本体”
填满仓库的方法
四行仓库的悲壮往事
小猫看仓库
基于本体的机械产品工艺知识表示
消防设备
完形填空Ⅱ
完形填空Ⅰ
专题
Care about the virtue moral education