周育伟,杨朝红,王宏宇
(陆军装甲兵学院信息通信系,北京 100072)
智能化浪潮汹涌而来,加速着人类社会的进步和发展,智能化技术是改变世界的颠覆性技术之一。世界各军事强国在军事领域对人工智能的应用都给予了大力的支持。同时,战场信息获取从匮乏转向过载甚至“爆炸”,使指挥员在面临海量信息的时候无法快速决策,忽略一些重要的信息,如何将信息优势转化为决策优势是一个关键问题。
知识是对信息的抽象和组织,因此相对于信息,知识能更好的指导人的决策和行动,可以将信息优势转为认知优势,进而转换为决策优势,辅助指挥员进行决策,由于军事领域的特殊性,面向军事领域知识图谱的构建,前期一般采用自顶向下的方式构建知识图谱,这就需要对本体层进行研究和构建。
本文基于本体的概念和构建方法,探讨目前军事领域本体构建的现状,归纳已有的军事领域本体,构建一个涵盖多维度、多层次的军事领域本体。
本体这一概念最早源于哲学领域,意为“对世界上客观事物的系统描述,即存在论”,后来随着人工智能的发展,1998 年被德国学者Stude 引入到了人工智能领域,并赋予了新的概念“本体是共享概念模型的形式化规范说明”。这个定义包含了四层含义:
⑴共享(Share):本体中所蕴含的知识是为大多数人认可的,其表达的是共性的知识。
⑵概念化(Conceptualization):本体所表述的知识是客观的现实世界的一个抽象概念模型。
⑶明确性(Explicit):指本体中全部的术语、属性及公理在使用前都必须有明确的定义。
⑷ 形式化(Formal):指本体可以被计算机所理解,具有机器可读性。
可以说本体是对某一个领域进行描述的术语集合,是从世界存在的客观事物抽象出来的概念模型,这个模型包含了概念和概念之间的关系和属性以及对它们的约束、公理等,本体就相当于是知识图谱的骨骼,实体则是对知识图谱按照本体骨架进行填充的血肉。
将本体定义为六元组:
其中,C 表示概念集,A表示各个概念的属性集,R 表示关系,A表示各个关系的属性集,H 表示概念层次,用来说明概念集的层次划分。例如,H(C1,C2)表示C1是C2 的子概念,X 表示公理集,用来约束概念与概念之间的关系或是概念与关系的属性值。
常用的本体构建方法包括以下几种方法:七步法、METHONTOLOGY 法、KACTUS工程法、SENSUS法、骨架法、TOVE 法、IDEF-5 法,其中七步法较其他几种方法更为成熟。
对于军事领域本体构建,有很多学者进行了研究。雷玉霞等人提出了军事领域知识本体的设计思想,给出了一些用于知识库中知识的语义一致性、完备性和精确性的公理。程英迅对军事训练领域的数据进行研究,提出了军事训练定义的六元组结构,构建了军事训练本体,开发了分布式数据库搜索引擎。彭明辉基于搜狗的军事新闻报道语料对军事领域情感本体进行了构建,基于该本体构建了军事领域情感倾向性分析平台。蒋维等人提出了建立本体的5 个步骤,实现了本体建立过程部分功能自动完成,但是未进行本体的检验和更新。杨建池等人构建了用于作战仿真的军事领域核心本体。钟诚等人对军事仓储领域本体进行了构建,并结合骨架法提出了一种优化的领域本体构建流程。李坤等人将军事领域本体划分为5 类二级本体,并对每类二级本体进行了具体的划分,设计了类的属性,但是并未给出类间的关系,添加了本体实例,完成了军事领域本体库的存储。陈立峰等人分析了军事通信领域本体的特点,给出了军事通信领域构建的方法。邹烨翰对军事条令条例的本体进行研究,针对美军《任务清单》进行本体构建。雷瑛等人对多源军事数据进行分析将军事数据本体划分为机构、人员、装备、物资、环境、设施和理论法规7 类二级本体。刘煜澄对包括万国兵器网、关系性能数据库存储的兵器数据进行分析构建了兵器本体。张清辉等人构建了军事信息服务本体,并验证了所构建本体模型的有效性。
当前本体构建的工具有Protégé、WebOneto、KAON、WebODE等工具。其中,Protégé具有支持中文语言,通过图形化界面进行构建,支持推理及软件的扩展,操作简单等多种优势,成为构建本体的第一选择。七步法目前成熟度较高,而且七步法是基于本体构建工具Protégé 进行本体构建的方法,故借鉴七步法提出一种军事领域本体构建的方法并使用Protégé 工具对军事领域本体进行构建。图1 展示了结合七步法的军事领域本体构建的流程。
图1 军事领域本体构建流程
⑴明确军事领域本体的领域和范围
明确军事本体对应的边界、业务功能域、用途、描述的信息内容、使用和维护本体的对象。
⑵收集军事概念和数据资源
在构建军事本体前,依据军语、各类战备工程数据库标注、军事报文、交换文件、战场情报等,收集环境作战数据。
⑶现有本体可重用性构建
对现有本体进行分析和完善,提高可重用性。可重用本体具有重要的意义,一方面可对现有本体进行拓展,减少很多不必要的研发工作,提高本体构建的效率。另一方面,可以为现有本体提供经验性的指导以及设计上的启发和帮助。
⑷本体的分析表达
对于不可重用的现有本体,需要对收集到的军语、标注、标准进行数据分析,提取核心概念、概念属性以及概念间的关系。
⑸构建本体
首先,采用自顶向下的方法定义类和类的继承关系,即从军事领域最基本的概念开始,逐层细化。例如从条令条例的概念开始,细化为共同条令、外军作战条令、专业条例等。然后,类定义完之后需要对类的属性以及类之间的关系进行定义,比如定义作战编队和战区之间的所属关系等。最后,基于军事业务规则,对类的属性进行限制,包括属性的类型,属性的定义域和值域。如对一个连队的人数进行约束,不能超过军事知识的范围,符合军事领域知识的规范。
⑹本体整合和实例化
对军事本体进行整合,采用一致性规约化方法对来自不同兵种、不同业务领域的军事本体进行重定义和语义化处理,以免影响数据共享和融合,确认本体后可抽取数据进行实例化。
⑺本体评估和修正
经过明确领域,搜集概念等步骤,可以初步构建一个本体。但构建本体并非是一蹴而就的任务,在构建的过程中会受到构建者自身认知的限制,因此可能会存在一定的差错和冗余,因此需要对本体进行评估和修正。一方面可以经过调研和请教领域内的专家进行探讨,记录评价意见,从本体的一致性、明确性、可扩展性等方面进行综合评价,另一方面可以使用Protégé内自带的推理机进行本体的一致性检验。军事领域本体的构建随着业务需求变化而扩展迭代更新,以保证满足军事业务需求,与时俱进,实现高性能,高可用。
通过总结、归纳已有军事领域本体,以及对装备手册等数据来源进行分析,并咨询领域专家,共设置四级本体树。一级本体包含武器装备、战场环境、军用物资、人物、条令条例、设施和组织机构共7大类,二至四级本体是对上一级本体的具体划分。
以武器装备为例,考虑到作战中可能涉及的各类装备,按照领域用途将武器装备本体分为遥感装置、保密装备、电子对抗装备、军械装备、侦察观测装备、陆军装备、海军装备、空军装备、工程装备、防化装备、指挥通信装备、弹药导弹、多栖装备和保障装备共14 个二级本体。以侦察观测装备为例,下设指挥镜、方向盘、望远镜、步兵潜望镜、测距机、炮兵声测系统、炮兵测地系统、炮兵镜、炮兵防空兵夜视设备、经纬仪、轻武器夜视设备、雷达等14 个三级本体,雷达本体下设机械扫描雷达和电扫描雷达2个四级本体。
在对军事领域本体的概念进行定义之后,需要对本体的关系和属性进行定义。在Protégé软件中,关系为对象属性(Object Property)即表示本体类与类之间的关系,属性为数据属性(Data Property)即表示本体类所具有的性质,一条事实可以用三元组(定义域,对象/数据属性,值域)进行表示,对于对象属性来讲,值域是一个本体概念,对于数据属性而言,值域是一个定义好的数据类型。例如三元组(轰炸机,搭载,导弹)表示了本体概念“轰炸机”作为定义域,“搭载”作为关系,“导弹”作为值域的一条事实“轰炸机搭载了导弹”,这样“轰炸机”类的实体和“导弹”类的实体就可以拥有“搭载”这个关系。军事领域本体设置以下五类关系:
作战关系 主要用来描述作战过程中的行动关系。包括:支援、协同、指挥、干扰、保障等关系。
人员关系 主要用来描述人员与人员、组织、装备和物资的关系。包括:上级、下级、平级、配备、隶属、任职、管理、维修、研发等关系。
装备关系 主要用来描述装备作战单元和组织机构等之间的关系。包括:编配、配属、搭载、生产、使用、消耗、部件等关系。
位置关系 主要用来表示方位的关系。包括:东、西、南、北、东西等关系。
其他关系 主要是一些共性的关系,如:组成、属于、包含等通用的关系。
数据属性的类型设计主要用来约束属性值的数据类型,在定义属性类型时需要对属性名、属性值和属性的数据类型进行定义,数据属性将本体类与数据类型进行关联,Protégé 中提供了多种数据类型。以导弹类本体为例,其主要属性定义如表1所示。
表1 导弹类属性类型设计(部分)
考虑到个体的主观意识影响,并且本体构建是一个随着构建者认知不断加深而重复修正的一个过程,在本体构建的过程中会产生一定的概念、关系、属性和公理等方面的冲突或冗余,故而需要对已经构建好的本体进行一致性、准确性和可满足性等方面的检测。构建本体的过程中参照《军语》等专业术语概念进行构建,将有歧义的本体概念降到最低,同时邀请领域专家进行点评修改,提高本体构建的准确性,构建好的本体保存为OWL格式的文件,然后使用Protégé软件中自带的Pellet 推理机进行本体的一致性检测。Protégé 软件内置的Pellet 推理机是一种基于Tableau算法的描述逻辑推理机,Pellet推理机可以根据本体结构生成断言概念结构,确定本体元素与元素之间是否存在相互否定的关系,从而实现描述逻辑一致性检验的目的。构建好军事领域本体后就可以根据本体进行实体抽取、关系抽取、属性抽取等任务完成军事领域知识图谱的构建,为智能问答、辅助决策等下游任务提供基础。
本文对军事领域已有本体进行了归纳总结,借鉴七步法提出了军事领域本体构建的流程,复用已有的军事领域本体,对包括装备手册在内的数据进行分析总结,使用Protégé 构建了一个涵盖范围广、多层次的军事领域本体,为下一步基于军事领域知识图谱的构建做铺垫。但是考虑到军事领域本体构建的质量要求高,因此构建的全过程都是依靠人工的,因而构建过程缓慢,之后会对半自动以及自动构建本体展开研究和探讨。