刘梦超,王玉玫,吴亚非,臧义华,梁 佳
(华北计算技术研究所,北京 100083)
本体作为领域实体概念及关系的抽象,近年来被引入到知识建模领域,用于描述领域知识中概念与概念关系[1]。本体建模方法极大地提高了知识的共享化及可操作性[2]。
目前国内外比较有影响力的本体构建方法有以下5种[3-4]:骨架法、TOVE法、IDEF5法、Methontology法和七步法。与其他方法相比较,七步法相对成熟,包括确定专业领域和范畴、考查复用现有本体的可能性、罗列领域重要术语、定义类和类等级层次、定义类属性、定义属性分面和创建实例这7个步骤[5]。但七步法同样具有一定局限性,此方法不具备完整的生命周期[6],缺乏开发后期应对需求调整或功能增加的模型修正过程。
在军事装备领域,文献[7]将军事装备分为8大类,如火炮、舰船舰艇、飞行器等,并对装备实体定义杀伤力、最大速度等属性。该装备知识体系偏向于军事装备的科普性描述,忽略了面向军事作战需求的知识表达。
螺旋模型[8]是软件开发典型模型,具有增量迭代、风险驱动、面向需求、变更灵活的特点,适用于前期需求不完善、已具有基本功能原型的软件开发。文献[9]提出七步法与螺旋模型相结合的思想,但该方法忽略了用户需求的反馈和专家基于本体构建原则的本体评价。
针对军事装备面向作战的应用需要,本文提出基于需求的螺旋反馈法,强调用户需求和本体构建原则的满足性,并利用该方法构建面向作战活动的军事装备知识体系。
本体(ontology)原本是哲学定义[10-12],是对客观事物的本质描述,随着人工智能(AI)、知识图谱(KG)等领域的发展,本体概念被逐渐重视,并在这些领域中广泛使用。1991年,美国学者Neches[13]最先提出本体的定义,认为本体是“构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则”。1993年,美国另一学者Gruber[14]提出“本体是共享化、概念化、形式化的规范说明”,该定义被学术界广泛认可。
通常,本体被认为是对某一领域的概念化描述[15],本体构建需定义概念及概念间关系[16]。
1.1.1 概念定义
本体概念一般分为3种[17]:通用概念(General concepts)、核心概念(Core concepts)和相关概念(Related concepts)。通用概念一般为时间、地点等描述型概念,核心概念要求能够尽可能对该领域全体特征或事物进行规范性描述,相关概念为该领域的上层领域或相关领域的核心概念。
1.1.2 概念关系定义
本体概念之间有4种基本的通用关系[18]:父子关系(kind-of)、部分与整体关系(part-of)、概念与实例关系(instance-of)、属性关系(attribute-of)。父子关系指概念之间的继承关系,例如:“航空母舰”是“舰船舰艇”的子类;部分与整体关系指某一概念是另一概念的一部分,例如:“甲板”是“航空母舰”的部分;概念与实例关系指概念的实例与概念之间的关系,例如:“辽宁舰”是“航空母舰”的实例;属性关系指某一概念是另一概念的属性,例如:“产国”是“航空母舰”的属性。
另外,为充分表达语义内容,可根据领域知识需求自定义类关系。
本体构建是构建知识模型的主要方式,遵循以下5条公认原则[19-20]:明确性和客观性原则、完整性原则、正确性原则、最大单调可扩展性原则、最小承诺原则。
基于需求的螺旋反馈法强调本体构建原则满足度和用户需求反馈,主要分为4个阶段:总体设计、本体测试与评估、实施阶段、使用人员评估,并根据新的需求反馈进行下一轮螺旋迭代,最终实现满足用户需求、完整可用的领域知识体系,具体步骤如图1所示。
图1 基于需求的螺旋反馈法
2.1.1 需求分析
该阶段本体开发人员需明确本体专业领域范畴及基本需求,使用人员根据实际应用需要对需求进行补充、修改和确认。本体开发人员在此过程中需与使用人员密切沟通,通过实现需求分析文档的形式明确用户需求、使用场景及未来知识体系的应用目标,并与领域知识专家、本体工程师共同合作,分析该需求的可满足性及基于该需求的本体模型的可实现性,并将可行性分析报告或修改意见反馈给需求方,同时,本体测试人员也需针对此需求明确测试方式和测试要求。需求分析是后续本体进化的前提,也是提高本体模型实用性、功能性的基础。
2.1.2 制定本体设计方案
该阶段根据需求分析结果确定数据来源、本体重要术语和本体构建方式。
本体设计人员可通过专业领域书籍、文献资料、专家经验、影视资料、网络信息、已有本体信息等获取数据资源,总结该领域中所有的重要术语和该术语的详细说明。
本体构建方式有3种:自顶向下法、自底向上法和综合法[21-22]。本体设计人员需根据领域知识特点和研究现状选择合适的本体构建方式,定义本体类和本体类层次体系。
该阶段主要由本体工程师和测试人员依据上文提到的本体构建原则来完成,按照本体的正确性、完整性、一致性、共享性、可扩展性和可操作性等要求进行测试评估并提供反馈意见,本体设计人员需根据专家意见改进本体模型,直到满足专家要求。本体测试与评估是本体建模的重要阶段,是本体进化的基础。
2.3.1 本体进化
在初步形成领域本体模型后,本体构建人员可结合需求分析或本体测试结果进化原型本体,以实现本体模型的完整性、一致性、需求可满足性。本体的进化主要包括知识的添加和更新。知识的添加指新增专业领域中新兴概念,需提取新兴本体,将该本体添加到原有本体模型中,并建立与原有本体类的层次关系和本体关系。知识的更新指本体属性、关系的更新,以丰富语义,实现知识正确、完整的表达。
2.3.2 本体详细设计
该阶段细化知识核心体系,定义本体类的属性和属性值;利用相关工具,如Protege工具[23],来进行实例的手工创建。
使用人员在需求计划、本体设计计划及最终实现阶段均参与评估。使用人员需及时反馈评估结果,并提出功能实现要求或新增需求,本体设计人员根据反馈结果制定计划,在原有模型基础上更新模型,直到使用人员满意。
在军事知识系统中,军事装备信息是非常重要的数据资源,军事装备领域是结构性较强、概念层次关系较为简单的一类专业领域。本文使用基于需求的螺旋反馈法构建军事装备知识模型,定义顶层核心概念军事装备1个,相关概念作战活动等4个,通用概念国家等7个,其中装备分为8大类、148小类。模型包括实体属性202个,实体关系6种,涵盖武器类实体5800个,作战活动18个,国家86个。以下为军事装备建模过程介绍。
3.1.1 需求分析
确定军事装备领域边界,根据使用人员的军事作战需求制定需求分析报告,强调知识体系不仅涵盖军事装备重要参数,还需体现军事装备在作战活动中的使用情况。
3.1.2 制定本体设计方案
从军事装备已有本体信息、百科军事装备词条、《军事大辞海》等资料中获取数据,总结重要术语,采用自顶向下的方法实现军事装备知识本体构建。
知识体系定义军事装备领域顶层核心概念8个:飞行器、舰船舰艇、枪械与单兵、坦克装甲车辆、火炮、导弹武器、太空装备、爆炸物,并向下分层,定义核心概念,如舰船舰艇包括核心概念:航空母舰、战列舰、巡洋舰、驱逐舰、护卫舰、巡逻舰等;定义相关概念:作战活动等;并定义通用概念:编号、国家、时间、地点等。军事装备概念层次如图2所示。
图2 军事装备知识概念层次图
军事装备本体关系除前面提到的4种基本通用关系(父子关系、部分与整体关系、概念与实例关系、属性关系)外,另定义2种关系:同义关系(synonymy-of)、角色关系(role-as)。
同义关系表示多个概念、实例具有相同的含义,如“航空母舰”与“航母”是同义关系,“辽宁舰”是“辽宁号航空母舰”的简称,两者亦为同义关系;角色关系连接作战活动和军事装备实例,用于表示在某一军事活动中某装备扮演着什么角色、执行什么任务,如在某军事活动A中818型巡逻舰执行远海巡航任务,则可表示为<某军事活动A,远海巡航,818型巡逻舰>。军事装备知识部分概念间关系示例如图3所示。
图3 军事装备知识部分概念关系图
根据本体测试与评估要求,本体专家和本体测试人员需对军事装备知识体系的结构进行评估。考察军事装备知识体系结构的完整性、正确性、规范性,讨论本体概念是否存在冗余,是否能实现知识在领域内的共享,并根据评估结果对本体进行修改,直至符合本体建模原则和用户需求。
本阶段对军事装备本体核心架构进行细化。本体概念的实例需定义属性来体现其相关特征,本文定义3类属性:命名性属性、描述性属性、关联性属性。
命名性属性指一类用于区分对象的属性,通常为某一实例的唯一编号或名称。如某型战斗机名称“歼-20”;描述性属性用于实例的特征描述,如歼-20的机长、翼展、最大飞行速度等;关联性属性描述实例与实例间的关系,如辽宁舰可搭载直-18J预警直升机。
属性值类型根据属性性质可分为:字符型、数值型、文本型、日期型、文本路径等。
以“作战活动”为例,其部分属性定义结果如表1所示。
表1 作战活动的部分属性
使用人员评估军事装备知识体系需求满足度,考察可否获得装备的重要信息,是否能了解到军事装备在不同作战目标、作战样式、作战环境中的使用情况,从而获得战场经验。本体开发人员基于评估反馈结构对知识体系进行修改扩充。
1)是一种本体建模方法,具有可自定义概念、关系及属性的特点,最大程度丰富知识的表达。领域知识的主要表达方式如图4所示。
图4 知识表达
2)强调本体测试和评估,保证本体构建原则满足性,有效消除冗余,实现数据的一致性。
3)采用增量迭代的方式,以小的分段来构建最终知识体系,灵活多变。
4)使用人员与设计人员实时交互,最大限度满足使用人员需求。
本体建模方法评价是验证建模方法效果的重要手段,本文从定性和定量2个角度对所建立的军事装备本体模型(模型2)进行评估,并与文献[7]模型(模型1)进行对比,以间接体现基于需求的螺旋反馈法的优劣。
对模型1和模型2从实体概念和应用2个维度进行对比分析,分析结果如表2所示。
表2 本体模型比较
从表2可以看出,在实体概念维度,2种本体模型大致相同,模型2添加人员与作战活动概念;在应用维度,模型1主要用于装备知识快速获取,模型2则注重用户需求,强调装备服务于作战活动。
利用文献[24]本体评价指标体系,设定评语集V={好,较好,一般,较差,差},邀请领域专家、本体工程师、用户等填写调查问卷共100份,对模型1和模型2进行评价。采取模糊综合评价法[24],得到本体综合评价向量B,为将模糊评语B转化为总得分,依据文献[25],设定各级评语集合向量F=[100,85,70,55,40]T,模型评价对比如表3所示。
表3 本体模型评估结果比较
从表3可以看出,2种模型本体评价结果均为好,模型2评价指数比模型1高0.49。
知识建模是构建知识概念模型的过程,是建立知识库的重要基础。本文提出了一种新的基于本体的知识建模方法——基于需求的螺旋反馈法,解决知识建模过程中需求更改或增加的问题,并应用该方法构建简单的军事装备知识模型,为军事装备领域知识表达提供统一的体系,为后续知识融合、知识计算和知识应用提供了基础。未来将对基于需求的螺旋反馈法的适应广泛性进行研究,并将该方法应用到其他军事领域中。