董建刚 , 张 峰 ,2
(1.榆林学院 信息工程学院,陕西 榆林 719000;2.西北工业大学 自动化控制学院,陕西 西安 710065)
本体库是智能化IETM系统核心内容之一,信息检索和图形化呈现等后续操作都要基于本体库进行,所以需要在领域专家的帮助下,构建出一个合理的领域本体库。但由于本体的构建多是面向特定领域,如果没有好的方法加以指导,就难以在不同领域本体的构建中保持一致,也不利于本体的规模化和规范建设。为此,迫切需要研究一种面向航空武器装备的本体构建方法。
笔者在遵循本体建模原则的基础上,综合贯通各种方法的优势,尤其是相对比较成熟的“七步法”,并借鉴软件工程领域的质量环思想,提出了一种新的领域本体建模方法——循环进化法[1]。
目前比较有名的本体构建方法主要有7种:Methontology法 、Enterprise 法 、TOVE 法 、KACTUS 法 、SENSUS 法 、IDEF5法和七步法。
斯坦福大学开发的七步法主要用于领域本体建模,其构建步骤体现了“具体-抽象-具体”的思想,从语法上也经历从RDF(s)原语到OWL约束声明的过程[2]。该方法主要包括以下步骤:
1)确定领域和范围:分析该本体面向哪个领域;为哪些类型的问题提供检索结果;系统用例的角色是谁。
2)考虑复用:指的是能否借用现成的第三方本体库。
3)列举术语:写下该本体中期望出现的所有相关术语的一个非结构化的列表。名词是类名的基础,动词或动词短语是属性名的基础。
4)定义术语层级:通过自顶向下或自底向上的方式将非结构化列表组织成分层结构,确保这个分层结构是类与子类的层次结构。
5)给类赋属性:每个类(术语)都抽象自实例,类的属性(成员)是所有实例共同特点的集合。给类加属性后,通常立即给属性限定定义域和值域,一方面便于通过层级关系使之被继承应用于子类;另一方面为本体一致性校验作准备;
6)定义侧面:必须依赖于OWL原语,“侧面”的概念包含3部分:①定义基数约束,给属性设置数值限制;②定义范围约束,给属性设置实例限制;③关系特性,包括属性的对称性、传递性和逆属性等。
7)实例化:类是抽象属性的集合,实例化的过程就是将类中的属性值赋以具体的值形成个体。
由于出自对各自学科领域和具体工程的不同考虑,现有的本体构建过程各不相同,目前也尚无统一的本体建模原则。针对航空武器装备的实际情况,并借鉴Gruber于1995年给出 的5条本体建模原则[3],笔者提出了IETM领域本体构建的基本原则如下:
1)应具有较强的明确性和客观性。本体应用自然语言有效地定义航空武器装备IETM术语内涵,该定义应该是客观的、明确的,并应是尽可能完整的。
2)应具有较好的一致性。由IETM领域本体推导产生的结论应与概念本身含义一致;本体所定义的公理以及用自然语言说明的文档也应该是一致的。
3)应具有较好的可扩展性。在原有IETM领域本体中添加定义新的通用或专用术语时,并不需修改原有概念。
4)应具有最小编码偏差。在知识层级进行概念的定义,而不是依赖于某一特殊化的符号层的表示方法。最小编码偏差可以满足知识共享代理可在不同的显示系统和显示风格中执行任务。
5)应具有最少本体约束。本体的约束应该最少,只要能满足航空武器装备IETM知识共享需求即可,即对建模对象给出尽可能少的约束条件。
6)在IETM领域本体构建过程中应有多方面领域专家共同参与和协作。
针对航空武器装备IETM的实际情况,图1给出了其领域本体构建的基本流程,主要分为IETM知识需求分析、IETM知识概念化和IETM知识编码化3个阶段。
图1 航空武器装备IETM领域本体构建的基本流程Fig.1 Aviation weapon equipment IETM domain ontology construction basic flow
在软件工程领域中,质量环是指从最初识别需要到最终满足要求和期望的各阶段中影响质量的相互作用活动的概念模式,又称为质量螺旋或产品寿命周期[4]。质量环中的一系列活动一环扣一环,相互制约,相互依存,相互促进,且质量环可以不断循环,每经过一次循环,产品的质量能得到一次提高。
基于上述思想,综合七步法和质量环的优点,提出了一种针对IETM领域本体构建的新方法——循环进化法,其具体流程如图2所示。
图2 循环进化法构建本体的基本流程Fig.2 Cyclic evolution method to construct ontology basic flow
在IETM领域本体构建好之后,就需要对其进行有效的存储和管理。一般来说,本体存储方法可以概括为以下3类:1)文件系统存储;2)关系型数据库;3)专用管理工具。
根据IETM系统知识库的结构,把本体库中的概念和实例分开,实例部分是存储在关系数据库中IETM的内容数据。
由于IETM的内容数据是以XML数据格式表示的,那么本体概念与其实例数据的关联就需要在本体的概念与XML数据之间建立一个映射关系,从而可以从XML数据中获取其相关的实例。
具体映射规则定义为
其中:R是规则的标签,u是要映射的数据表,q是XML数据中的节点,p是本体库中的抽象类。
例如:本体的抽象类发动机故障与数据库表fault表中
可以根据SQL Server 2005中支持的XML查询语句方式获得一个集合,这个集合便是发动机故障的实例集。
飞行器发动机根据其工作原理可分为4大类[3]:
1) 吸气式发动机(Air-breathing Engine,AE):主要由大气中吸取空气作为燃烧氧化剂的发动机。
2)火箭发动机:燃料消耗较大,不适于长时间工作,仅用于短时间加速。
3)脉冲发动机:多用于低速靶机和航空模型。
4)用太阳能电池驱动的航空电动机,目前尚处试验阶段。
通常意义上讲的航空发动机是指吸气式发动机。在本实例中,选择吸气式发动机作为本体建模的边界,它确定了研究的核心术语范围。
根据吸气式发动机的全寿命周期,可将其问题域划分为3类:第1类是设计阶段的文档,如零部件结构、整体性能参数和8大系统等设计资料;第2类是生产阶段的文档,如零部件制造、组装等工艺流程;第3类是维护阶段的文档,包括飞行事故、故障分析和处理方法等历史记录。在本实例中,吸气式发动机的问题域限定在设计和维护两个阶段的数据信息,解决“设计—使用—设计”的优化问题,提供衔接两阶段数据的语义检索。根据上述问题域,可知用户组主要有设计人员、维护人员和领域专家3类,以及除此之外系统必需的管理员,故其顶层用例模型如图3所示。
图3 吸气式发动机的顶层用例模型Fig.3 Airbreathing engine top use case model
AE设计人员和维护人员是该本体的核心用户,主要向他们提供语义检索功能和知识库支持[5];本体工程师和AE领域专家是该本体的知识库抽象模型构建者,后者的领域知识需要转化成OWL语言模型,转化的过程中需要经过规范和优化才能达到高效运行的目的,这就需要具有软件工程经验且熟悉本体语言的本体工程师;实例采集员也是该本体的核心输入者,其主要任务是根据抽象模型采集实例发动机数据录入到知识库中。
目前国外已经成型的本体知识库资源仍非常有限,尤其是专业领域的本体库更少。在航空发动机领域,目前只有少量的本体设计片段刊载在实验性的研究文献中,而尚无公开发布的航空发动机本体库可供共享复用[6]。
上表的分类是对AE进行顶层划分的子模块,该结构化的过程以及后续步骤可以按照子模块分别进行建模。以发动机类型为例进行分层结构定义,层级结构如图4所示。
图4 吸气发动机类层级Fig.4 Aspirated engine type hierarchy
该结构严格按照类和子类间的继承关系构建,它满足DL中最基本的subClass分类传递,确保owl:subClassOf和rdfs:subClassOf等原语的内嵌语义得到遵守和执行。该层级的类属关系是传递的,例如图5所示的“CFM56-3”是涡扇发动机的一个实例,则可以推出“CFM56-3”是燃气式发动机的一个实例。另一类层级关系由传递属性完成,如构建“零部件”之间的组成与被组成关系时,subClass层级不能从含义上代替“hasPart”来表义。
图5 CFM56-3发动机Fig.5 CFM56-3 engine
事实上,很大一部分层级结构都在类层级之外,这种情况下就需要通过“属性传递”来自定义层级关系。该过程通常与后续的属性定义和侧面传递定义交叉进行。以**型号航空发动机零部件为对象,定义的层级结构如图5所示,该结构在机械制造业普遍出现,向OWL或RDF(s)转化的过程中需要通过自定义属性“hasPart/isPartOf”来描述组件从属关系。综上所述,subClass原语并非层级关系的唯一映射方式,层级关系也并不局限于类(Class),图6描述的是解决非Class层级的一个典例,以属性定义的方式可以解决目前绝大部分Class以外的层级表义问题,尽管这类层级不是严格意义上的分类结构,但这样的资源作为开发起点经常是难以回避的。常见的泛层级关系主要有5种:邻近关系、继承关系、从属关系、阵列关系和参考关系。依此类推,完成其他分类的层级定义。
在Protégé中,构建本体包括建立文件、建立类及类层次、建立属性及属性的允许值、添加实例4个基本步骤。经过上述4个步骤所建立的本体知识库不仅能表现出领域知识纵向的类属分类,还通过本体术语间的关联关系揭示领域知识间的内在联系,有效地提高领域本体库的共享与重用性。
图6 涡扇发动机零部件层级图Fig.6 Turbofan engine components hierarchy chart
1)建立文件
打开Protégé后,先定义文件名并设定保存路径,然后在“元数据(MetaData)”画板中输入关于本体的各项元数据,如本体的注释和默认名称空间等信息。
2)建立类
在Protégé中,根据全面确定的航空发动机本体的类层次结构,可建立如图7所示的航空燃气涡轮发动机类图。
图7 航空发动机的类图Fig.7 Aero engine class diagram
3)建立属性
从语义上讲,本体中的基本关系共有4种:part-of、kindof、instance-of和 attribute-of。但在实际构建本体过程中,概念之间的关系不仅限于这4种,还需要增加一些属性用于更好的表示概念关系,本文中增加的基本关系有:
①因果关系:A引起B,则B造成了A。在propeties里添加“hasCaused”和“isCausedOf”,设置它们的 Domain 和 Range,并分别把InverseProperties属性和TransitiveProperty属性选中,这样就可以在语义上实现逆推和传递。
②实体/定位关系:A放在B处,则B处有A。在propeties中添加“hasLocation”和“isLocationOf”,把 Inverseproperties 选中,并设置它们的Domain和Range。
③代理/对象关系:A操作B,则B被A操作。在propeties中添加“hasoperator”和“isOperatorOf”,把 Inverseproperties 选中,并设置它们的Domain和Range。
④执行/方法关系:A执行B,则B被A执行。在propeties中 添 加 “hasManner” 和 “isMannerOf”, 把 Inverseproperties 选中,并设置它们的Domain和Range。
在 Protégé中,可建立航空发动机的 DataType属性、Object属性、Annotation属性等,其属性如图8所示。
图8 航空发动机的属性图Fig.8 Aero engine property map
本体库是智能化IETM系统核心内容之一。针对IETM系统中海量领域知识库的构建和存储问题,提出了一种领域本体构建的循环改进法。主要包括:
1)提出了IETM领域本体构建的基本原则和基本流程,对比分析了当前较为成熟的七种本体构建方法的优缺点,并指出了它们存在的不足。
2)提出了IETM领域本体构建的循环进化法,它包括本体规划、本体设计、本体实现、本体评价、本体确定、本体维护、改进与扩展共7部分。该方法克服了传统的七步法本体构建过程中存在的改进性和扩展性差的不足。
3)设计了IETM领域本体库的存储方案,并给出了本体概念与实例数据的映射方法,实现了本体知识的有效存储和管理。
4)在详细对比分析了4种本体构建工具的基础上,选择了Protégé作为本文本体构建工具,并给出了创建本体的步骤,据此可得到OWL描述的领域本体。
5)通过航空发动机本体构建实例验证了所提循环进化法的有效性和实用性。
[1]Scott B E.Telemaintenance applications for the WearableTM PC[C]//Proceedings of the 1996 AIAA/IEEE Digital Avionics Systems Conference,USA,1996(1):407-413.
[2]Cooper D W.Document scripting with open standards:transport of application behavior for interactive technical documents[J].Multimedia Tools and Applications,1999,8(1):115-136.
[3]Taylor M A.Case study in knowledge engineering:interactive electronic technical manuals[J].Proceedings of the 1997 ISA TECH/EXPO Technology,1997,1(2):35-43.
[4]Boser C S.Automating the capture of technical information[C]//Proceedings of the 2007 IEEE Military Communications Conference MILCOM,Monterey,CA,USA,1997(2):773-776.
[5]Taylor M A.Case study in knowledge engineering:interactive electronic technical manuals[J].Proceedings of the 1997 TECH/EXPO Technology,1997(1):35-43.
[6]Su L,Bosco C D,England W.Application of New information technology to DOD legacy paper technical manuals[C]//Proceedings of the 1997 Autotestcon,Anaheim,USA,1997(1):22-25.