面向语义互操作的数据链消息本体技术

2019-12-26 01:38袁春慧杨海涛
指挥与控制学报 2019年4期
关键词:数据链异构报文

袁春慧 杨海涛

数据链,本质上是一种通信链路,按照规定的消息格式和通信协议传输信息,它将战场上的传感器、指挥与控制中心、陆海空等武器平台、作战部队之间传递的信息进行连接,使各力量紧密交链[1],构成立体分布、纵横交错的信息平台[2],有效发挥了一体化作战体系同步感知战场态势、快速行动、精确打击、协同作战等的系统效能.

数据链的研究始于20 世纪50 年代,目前,美国、俄罗斯、北约组织、以色列以及我国等许多国家都使用了数据链.而美国作为最早使用数据链的国家,历经60 多年时间先后研制装备了几十种数据链,形成了适应信息化作战的数据链体系,数据链技术较为先进,数据链型号种类繁多,按照各种链在作战中的应用范围可分为通用数据链、专用数据链、卫星数据链,按照作战功能可分为情报侦察数据链、武器协同数据链、战术数据链等,如图1所示.时至今日,美军数据链经历了从单向到高速双向,从视距到多种传输手段的飞速发展.我国数据链的研发起步较晚,但发展较快.目前已有多种类型的军兵种专用、通用数据链用于装备或在研.

可以看出数据链是为满足作战需求设计的一种特殊的通信系统,其传输的是计算机可以识别的特定消息,称之为“报文”,不同的需求设计出不同类型的数据链系统,因此,消息具有多源的特性,同时,其涵盖范围、编码解析方式等等的不同又造成了消息的异构性.所以数据链消息具有多源异构的特性,这也造成了不同数据链之间、数据链与各平台间不能直接进行信息的传递和交换,需要对数据链进行集成.传统的更新方法采用碰到什么问题解决什么问题的方式,例如在数据链间、数据链与平台间添加格式转换适配器以满足信息交换,这种专用的集成方法集成范围窄、花费巨大、无法推广使用.因此,需要寻找一种通用的、集成范围广、费用低廉的集成方法.

本体,作为对知识的一种明确规范的概念描述模型,可在语义层面上解决多源异构的问题.本文尝试将其与数据链传输的消息联系起来,在数据链消息融合领域加以应用.通过建立数据链消息本体,实现本体间互操作,达到各系统间的互连、互通、互操作,以期建立一体化数据链体系,实现信息的快速交换和共享.

图1 美军主要数据链发展概况

1 本体技术概述

本体技术起源于哲学领域,最初被定义为“对世界上客观存在物的系统描述”,20 世纪90 年代起,本体技术逐渐被应用于情报研究、人工智能和系统工程等领域,并迅速成为这些领域的热门研究课题[3].后来,本体技术的概念被衍化为“规范的概念化说明”[4].一般来讲,本体包含5 部分内容:类、属性、实体、关系及规则,语义是本体的核心,类是所描述对象的集合,属性是类的特征,实体是类包含的具体事例,规则是对类间关系的约束,支持未明确表达或隐藏的新知识[5],抽象出的本体模型是计算机可读的.近些年来,越来越多的专家、学者致力于本体技术的研究,使其应用领域逐渐扩大.

1)在信息检索方面.本体具有很强的逻辑推理能力,可将其用于信息检索.IBM 研究院[6]、美国的马里兰大学[7]等提出了基于语义互操作的信息检索方法.马斌[8]等利用本体技术,优化了中文分词算法,实现了基于语义扩展的信息查询,大大提高了查询的速度和准确率.

2)在语义互操作方面.作为标准化的概念模型,本体可将各种数据和信息资源描述为机器可理解的语义,促进计算机的相互理解和互操作性[9].Jiang Xing[10]构建了用户学习本体以满足用户的个性化需求.Pulido J.[11]采用SOM 方法和本体技术实现了知识地图,服务于Web 的动态操作.周津[12]等利用本体技术构建了物联网异构信息融合模型.

3) 在语义集成方面.作为规范化的共享概念模型,本体可以有效地解决数据融合和集成问题.Cinzia Daraio 等[13]提出了基于本体的数据库管理方法,通过数据库的存储和调用来解决异构数据源的集成问题.

4)在军事应用领域.近年来,本体技术也越来越多地被应用在军事领域,例如,为了解决装备数据定义的概念不一致问题,军械工程学院的肖冰等[14]采用本体思想明确装备领域概念,提出了构建装备领域本体的方法.中国舰船研究院的张中亮[15]根据数据链传输的格式化和其树状结构,概述了本体技术在多数据链集成方面的可行性和与其他方法相比的优越性.

5)在其他学科领域.除了上述领域,本体也广泛应用于各个需要信息融合和知识共享的专业领域.例如:哥伦比亚大学的Claire 等于2015 年构建出了临床细菌性感染疾病本体[16].北京协和医学院杨春媛等于2015 年研究出了人类肝脏类疾病本体[17]等.

本体用于数据集成和检索查询的意义在于它用统一的规范性模型来描述异构数据,并且是计算机可读的,这就使得异构数据源间可以透明地进行数据交换,用户不需要知道数据的结构,只通过语义互操作、本体间映射关系以及规则推理即可完成集成和检索,大大提高了数据源的兼容性和可操作性[18].因此,从消息层面研究数据链系统集成具有一定的可行性.基于本体在数据集成方面的优势,本文将本体技术引入到数据链消息集成中,通过构建数据链消息本体对多数据链进行集成.

2 数据链消息本体的构建

数据链系统包括3 个基本要素:传输通道、通信协议和标准的格式化消息[19].其中,格式化消息是数据链信息实现“机器到机器”传输,共享战场态势的关键[20].文献[21]指出未来数据链的发展趋势主要集中在: 消息标准的统一、数据链整合、向无人作战平台发展等.

近些年来,美军为解决其多数据链集成使用问题,开发了一系列消息处理系统,用以屏蔽异构格式消息,其中较为典型的有C2P 指挥控制处理器、MTP多战术数据链处理器和CLIP 通用链路集成处理器)[22],虽然其技术细节未被详细介绍,但是这些处理器均对消息进行转换.随着各种新型数据链的不断涌现,传统的数据链集成系统已经不能满足作战平台与链路间的信息融合与交互,构建可扩展、自描述的语义级本体模型可以解决这一问题.

图2 数据链模型结构

如图2所示,消息的格式化转换主要是在数据链模型的应用层进行.

2.1 技术路线

本体数据可通过概念、关系、属性、实例和规则来描述客观世界的数据链消息,并建立模型.本文参照Gomez Perez 定义的本体模型[23],将数据链消息本体模型形式化定义如下:

定义数据链消息本体

本体表示为一个5 元组O(C,R,P,A,I),

C代表类(Class)[24].主要表示一类对象的集合,包括数据链消息中数据元素的逻辑结构和相应的约束关系等.

R代表关系(Relation),是领域中不同概念之间的相互关系.具体到数据链消息,其基本的关系主要有3 种: part-of(部分和整体)、instance-of(类与对象)、attribute-of(属性)、kind-of(传递关系).

P代表属性(Property).属性用于描述类的特征.主要包括数据类型属性和对象属性等.

A代表规则.规则表示数据之间的关联关系,可在推理机中对规则进行定义及说明.

I代表实例(Individual),代表数据链消息概念类所指示的具体实体:I=i1,i2,i3,··· ,in∈C.

构建本体的目的是使其成为解释各数据链消息源中共享概念及概念间关系的全局概念,以实现对异构数据的语义集成,提升知识融合效率[25].对于本文研究的数据链消息,由于数据链路的快速发展,将会出现越来越多的数据源,描述的范围和方法也各有不同,这大大增加了全局本体的构建难度.根据数据链消息明显的分领域特性,例如目标监视领域、武器协同领域、PLI 领域等,进行领域划分可降低本体构建的难度,如图3所示,在构建数据链全局本体时加入全局数据集合的概念,也就是领域本体,对各个数据源消息中具有的相同概念进行提取,使其分类为多个领域,通过各数据链源本体与领域之间的映射,实现本体间的互操作.

图3 数据链消息本体构建体系结构

原则上,全局本体是一个包含所有概念的通用本体模型,对数据链消息全局本体来说,其应该包含各数据链消息源的所有概念、属性等等,构建所需工作量巨大,而且一旦有新的数据链加入,则需要重新构建,过程复杂.本文加入领域本体后,描述全局本体时仅仅需要它在领域专家的指导下,对各个领域本体中出现的相同概念进行一个统一的规定,以防止相同的概念在各领域本体中出现不同的定义[26].例如,“航迹”、“批号” 等,可由全局本体进行统一规定,也可在某领域特性较强时,直接划归到某领域.很明显,这非常适用于不断更新的数据源.本文数据链消息本体构建的整体技术路线如图4所示.

2.2 构建领域本体

领域本体是用来描述同领域内概念、属性及其相互关系的本体模型,本文中加入数据链消息领域本体是基于数据链消息明显的分领域特性,以及在数据链更新换代的需求及各型数据链涌出的背景下,仅仅使用全局本体已经无法满足不断增改的数据链消息源.

国内外研究出来很多构建本体的工具,如Prot´eg´e[27]、WebODE[28]、OilEd[29]以及OntoEdit[30]等.比较这几种主要开发工具,Prot´eg´e是由斯坦福大学开发的一个开源的本体编辑器,界面友好,用户比较容易学习使用,具有开源、良好扩展性等优势,目前最新版本是2019 年6 月发布的5.5.0 版.

现行的领域本体的构建方法有: IDEFS法、TOVE 法、骨架法、METHONTOLOGY 法、七步法等[31-32].每种方法都有各自的适用领域,事实上,本体构建非常讲究应用需求,不同的需求需要用到不同的构建方法,对数据链消息领域本体构建来说,可以根据指挥应用系统和数据链系统的特点,来考虑构建方法,可以将方法进行适应性的改进,或者将其中两种或多种方法进行融合.本文根据几种构建方法,结合数据链消息的特点,给出数据链消息领域本体的通用构建流程,如图5所示.

步骤1.领域分析.根据应用需求,分析各消息标准的领域范围.明确各消息中数据元素的含义,参照这些消息的类别,将消息进行归类,完成领域的划分.领域划分的原则是将数据元素大致相同的消息归为一个领域[33],确保领域本体能够支持消息的集成和共享.

步骤2.分析领域内数据元素.在上一步中已经将各个消息标准在本领域内的数据元素进行了归类,接着将属于同一领域的数据元素提取出来加以整合,将无意义的字段删除,即可得到本领域的数据元素.

步骤3.本体重用.通过本体重用可以减少本体构建的工作量[34],鉴于数据链消息的领域特殊性及之前研究领域的空白,本体构建过程中,只需要考虑各个数据链消息在一些概念及其属性上的重用,以确保相同类的一致性.

步骤4.定义类及其关系.由于在第2 步中提取出的数据元素绝大部分都是属于底层概念,因此,可以采用自底向上法定义类及其关系.为数据元素定义概念,抽取合适的概念作为类,并采用Prot´eg´e进行类及其关系的设计.

步骤5.定义属性及其关系.本文对类进行定义时,已经为数据元素定义了概念,接下来为这些类定义属性及其关系,以描述类的内部结构及其相互关系.

步骤6.创建实例.最后对类进行实例化,即赋予类具体的数值并添加属性.

利用Prot´eg´e构建的数据链消息本体,可以以文件扩展名为OWL 文件格式存储,易于复制、编辑,便于计算机识别等操作.OWL 是一种本体格式语言,本体的推理机Jena 可以解析OWL 语言格式的文件[35].

图4 数据链消息本体构建的技术路线

图5 数据链消息领域本体构建流程

按照上述流程,对M、J 系列消息标准进行领域划分,以目标监视领域为例:

M 系列: 空中航迹位置报文、空中位置扩展报文、水面航迹位置报文、水面位置扩展报文、特殊点位置报文、特殊点扩展报文、数据链基准点位置报文.

J 系列: 数据链基准点报文、紧急点报文、空中航迹报文、水面航迹报文、水下航迹报文、陆地点或轨迹报文、空间航迹报文.

将上述M、J 系列消息划分为同一领域后,提取其数据元素,删除报文携带的与传输消息无关的字段,合并后得到所有数据元素: 航迹、属性、平台信息、经纬度体系、直角坐标体系、航迹质量、传感器、时间、训练标识、强制告知标识、紧急标识等.最后通过Prot´eg´e工具定义各类及其属性、层级关系等,构建目标监视领域本体.例如图6为现实世界中由预警机、载机及导弹等组成的空中数据链系统,系统中传输的数据链消息与目标监视部分领域本体的对应关系.

2.3 本体映射

数据链消息领域本体构建完成后,就需要将其与各数据链源本体进行映射,以完成数据融合.

本体映射是对两个或多个不同的本体按照语义关联关系为这些本体中的元素(概念、属性、实例)建立互操作的过程[36],完成源本体和目标本体间的相互转换[37].对数据链系统而言,其主要功能是进行消息的接收和发送,因此,各数据链源本体和领域本体互为源本体和目标本体,其映射类型可分为概念之间、属性之间以及概念与属性之间等,即1: 1,1:n(或n:1),l: null(或null: l)和m:n.

Ehrig 和Staab 提出了本体映射过程的6 个步骤[38]: 1) 提取概念、属性等特征以计算相似度;2)选择相互映射的概念对;3)计算相似度;4)整合相似度;5) 优化映射;6) 迭代,反复进行第1) 步到第5)步,直到得到满意结果为止.从整个映射过程可以看出相似度的计算是本体映射的重要环节.目前,有很多针对本体映射提出的相似度计算方法,使用的技术手段各不相同.

图6 数据链系统对应关系

图7 本体映射流程

本文将基于混合高斯模型的贝叶斯网络[39]引入到数据链消息本体映射算法中,以满足多源异构数据链信息对可靠性和时效性的要求以及多本体映射要求.如图7所示,首先将本体模型转换成贝叶斯网络模型,将本体中的元素转换为网络模型中的节点,然后采用K-Means 聚类算法对相似节点进行聚类,利用混合高斯模型对K-Means 算法中的K值进行判定,以保证聚类结果的全局最优化,从而减少结果误差,使其满足查全率和查准率并保证稳定性和效率.

2.4 语义集成框架

本文应用中间件技术,设计了一套可供二次开发的数据链语义集成框架.中间件是一种独立的服务程序或系统软件,数据链平台应用软件间可借助其实现资源共享,中间件位于客户机服务器的操作系统上,管理计算机资源和网络通讯[40].本文设计的中间件系统除了具备传统中间件的功能外,还根据数据链多源异构消息的特点,增加了本体知识库.使用本体知识库作为数据分类、共享、重用的基础,使用OWL 描述Web 服务的概念、关系、方法,用JENA推理引擎进行语义推理,解决互操作问题.在单一领域内统一相关概念的定义,有利于一体化数据链体系消息无缝传输的实现,可以有效解决数据链系统“孤岛”问题,适应数据链技术的飞速发展.系统框架如图8所示.

图8 中间件设计框架图

3 结论

数据链技术的飞速发展使得数据链系统建设缺少顶层设计和统一规划的缺点日益显现,例如数据链系统中存在多数据链共存现象,数据链系统与多作战平台间存在数据交换等问题.从国外数据链的发展趋势来看,为适应未来信息化战争的需求,必须提高数据链的整体作战效能,使数据链朝着网络化、集成化、体系化和功能综合化方向发展.本研究从消息标准层面对一体化数据链体系中多源异构消息进行了特性分析,介绍了数据链及本体技术发展现状,对基于本体技术的消息集成方法,包括全局本体、领域本体及其之间的映射算法进行了梳理.提炼了构建多源异构数据链本体的新思路,为数据链集成应用研究提供了一定的可行方向.

猜你喜欢
数据链异构报文
基于J1939 协议多包报文的时序研究及应用
ETC拓展应用场景下的多源异构交易系统
以太网QoS技术研究及实践
离散异构线性多智能体系统的输出一致性
试论同课异构之“同”与“异”
多平台通用数据链助力未来战场
基于深度学习的无人机数据链信噪比估计算法
浅析反驳类报文要点
凝聚与铺张——孙绍振教授《以丑、呆为美》两岸同课异构教学观摩后记
快递也有污染,绿色发展在即 以数据链净化快递行业生态链