基于本体的军事情报元数据描述研究

2015-03-25 02:35李轶童黄子俊熊家军吴长飞
舰船电子对抗 2015年4期
关键词:军事情报数据模型本体

李轶童,黄子俊,熊家军,吴长飞

(空军预警学院,武汉 430019)



基于本体的军事情报元数据描述研究

李轶童,黄子俊,熊家军,吴长飞

(空军预警学院,武汉 430019)

目前,军事情报系统按情报的专业种类提供定制和分发服务,缺乏对情报资源的统一描述,不同专业系统之间情报共享困难。结合元数据以及军事情报自身的特点,将基于本体的元数据思想引用到军事情报描述中去,建立用于描述军事情报资源的元数据模型,提出了基于本体的军事情报元数据模型的描述框架,使情报资源通过元数据更容易被发现、获取、利用和共享。

本体;元数据;军事情报;元数据模型

0 引 言

随着大量情报侦察监视技术和手段的运用,军事情报源种类和数量不断增加,造成了情报多元、复杂、无序、异构等特点。一方面使得情报之间相对封闭,不同系统之间的情报共享变得非常困难,而造成了大量情报资源无法利用的“情报泛滥”,另一方面也造成了情报用户在大量无序、异构的情报面前无从选取、定位的“情报缺乏”。如何解决这一矛盾,是情报工作者必须面对的问题。运用基于本体的元数据方法对情报进行描述,能将情报的内容更加规范、完整地描述出来,增强情报的透明度和共享性。

元数据可理解成对其他数据的特征进行描述的数据,同时确保这些数据能被计算机理解,是一种可以使信息资源被有效组织和管理的工具。基于本体的元数据不但能对专业术语进行形式化的定义,使其支持语义描述,能有效地促进领域内知识共享,同时也能帮助用户查询所需要的情报。

本文从情报的现实需求出发,主要针对情报的异构性提出了一种基于本体的情报核心元数据模板,并结合XML语言将其进行描述,增强了不同军兵种用户对情报的感知、理解及推理能力。

1 元数据的作用及类型

1.1 元数据的作用

元数据在人们生活中长时间被用作对资源的定位、说明等。关于元数据的定义,国际图联[1]提出了比较确切的说法:“元数据是关于数据的数据。此术语可以指任何用于帮助网络电子资源识别、描述和定位的数据”。

近年来,元数据被应用到越来越多的领域,因此其作用也受到越来越多的关注和重视,元数据在预警情报描述中的主要作用表现为以下几种:

(1) 有利于情报资源的著录描述。通过元数据提供的各种信息进行语义描述,可较为全面、详尽地描述情报资源,帮助维护者建立资源文档,用户理解资源信息。

(2) 有利于情报的组织管理。相应的元数据可有效解决异构数据的组织和管理,并方便数据资源的长期保存。利用元数据还可以对管理过程进行控制,包括权限管理、数字签名、密级管理、访问管理等。

(3) 有利于情报的发现与定位。根据用户的情报需求,快速找到用户所需的情报资源并确定情报资源的位置。

(4) 提高情报的共享能力[2]。通过统一规范的元数据对情报资源进行描述,打破不同专业和不同系统之间的情报壁垒,实现不同专业情报信息系统之间的网络信息共享。

1.2 元数据的类型

完整的元数据体系根据其功能可分为以下4种类型[3]:

(1) 描述型元数据,用来描述和标识信息最本质、最基础的特征,以便资源被用户识别和发现。

(2) 管理型元数据[4],用于组织和管理数据资源的元数据,如版本控制、信息采集等。

(3) 保存型元数据,用来描述资源的期限、更新、转换等相关的元数据。

(4) 技术型元数据[4],用于描述和系统运行有关的元数据。

2 本体概念及作用

2.1 本体的概念

本体(Ontology)的研究最早起源于哲学领域,人们将对世界客观存在事物的描述称之为本体论或存在论。自上世纪90年代以来,其思想被人工智能、计算机等领域所研究并采用。近些年,关于本体的定义有很多,其中获得较多认同的定义是:1998年R.Studer在前人的基础上给出了一个本体较为明确的解释[5],即“本体是共享概念模型的明确的形式化规范说明”。

定义1[6]:在一个完整的本体中,至少应该由概念、关系、函数、公理和实例等五类基本元素构成。因此,本体可以如下表现:O={C,R,F,A,I},其中:

(1)C:概念。本体中的概念是广义上的概念,它除了包括一般意义上的概念外,还包括任务、功能、行为、策略、推理过程等。本体中的这些概念通常按照一定的关系形成一个层次结构。

(2)R⊆2c×c:概念之间的关系,表示概念之间的一类关联。如概念之间的“Subclass-of”关系、“Part-of”关系等。

(3)F⊆Rn:一种特殊的关系。其中第n个元素Cn相对于前面n-1个元素是唯一确定的。函数可用如下形式表示:F:C1×C2×…×Cn-1→Cn。

(4)A:概念或概念之间的关系所满足的公理是一些永真式。

(5)I:领域内概念实例的集合。在有些本体模型中,概念的实例不被看成是本体的组成部分。

2.2 本体在军事情报描述中的作用

(1) 有效扩展资源查询能力。军事情报本体对不同军兵种等的情报资源描述都赋予了语义,而其自身的推理能力可以提供面向语义的查询能力,利用情报本体进行查询的扩充,可以使查询的结果更加全面。

(2) 支持更多的资源交流。军事情报本体的目的是对自身领域的资源进行捕获,通过提供该领域资源的共同理解来确定共同认可的术语,从而使领域知识的结构更加清晰,为情报的表示打好了基础。情报本体可以重用,从而避免重复的领域知识分析。

(3) 支持不同系统之间的互操作性。不同的系统、不同的军兵种采用不同标准的元数据,使得各系统之间存在异构性,本体在不同建模、语言和软件工具之间进行翻译和映射,从而实现不同系统之间的互操作和集成。

(4) 提高信息化的实施效率和质量。利用本体对所需解决的问题和任务进行规范描述,可以提高需求分析及信息获取的效率,节约成本。

2.3 军事情报特点

信息化战争发展以来,由于防空预警、反导预警、航天侦察、网络侦察等大量电子侦察技术和手段的运用,使得情报来源越来越广。军事情报服务于军事活动,因此具有客观性、动态性、时效性、保密性等特点[7]。

(1) 客观性。军事情报的特殊性决定了军事情报必须全部是客观实际情况,不能夹杂任何的主观色彩描述。

(2) 动态性。军事情报反映出随着军事活动发展不断变化的情况,尤其是战时的军事情报内容必须根据瞬息万变的战场情况而不断更新。

(3) 时效性。军事情报的时效性是决定军事情报价值的重要因素之一。它反映出的客观实际情况特别是动向情况应及时提供使用,也因此更强调时效性,以免贻误战机。

(4) 保密性。军事斗争的保密性决定了军事情报的保密性,军事情报关系国家安全和战争胜负[8],因此特别强调保密性,因此在限制级别开放的同时还要加强自身的保密。

2.4 基于本体的军事情报元数据模型

定义2:基于本体的元数据模型是一个六元组,记作M=(I,T,Tc,R,F,P)。其中:

(1)I为实例集,一般是实体类集合,指实体类或对象。

(2)T为术语集,表示包括实体、数据元素和类属元素在内的军用概念术语以及实体元数据、数据元素元数据和类书元素元数据在内的属性术语的集合。

(3)Tc为术语注释集,是自然语言对术语进行解释说明的集合。通过自然语言对术语进行描述,实现用户更好的对术语理解,以便支持元数据模型的后续维护。

(4)R为所有关系的集合。主要包括:

①语义关系,在基于本体的元数据构建中,语义关系分析也是必不可少的,主要有包含关系、统一关系和上下位关系等。

②概念关系,确定概念间的等级关系,得到领域概念的层次关系图,主要有用代关系(优选关系)、属种关系、相关关系和非交关系。

③实体关系,主要包括聚合关系、关联关系和继承关系。

(5)F为函数集,包括:

①Att:A→E∪R:属性函数,将属性分配给某一实体类或关系;

②val:V→(E,A):属性取值函数,属性具有数据类型;

③Inst:E→2I:信息单元实例化函数,可以写为Inst(E)=I或E(I);

④Instr:R→2I×I:关系实例化函数,可以写为Instr(R)={I1,I2}或R(I1,I2)。

(6)P为约束规则集,指所有信息单元实体类、关系和实例要满足约束的集合。包括类型约束(取值约束)和基数约束。

定义3[11]:给定的元数据模型M=(I,T,Tc,R,F,P),模型的解释为一个二元组,记为I=(ΔI●I)。

其中,ΔI为M的论域的非空集合,●I是解释函数,它将术语集中的每个原子类C都映像为ΔI中的一个子集,使得CI⊆ΔI,将每个关系语义R都映像为一个二元关系RI⊆ΔI×ΔI,将实例集中每一个个体c映像为I中的元素,使得cI∈ΔI。

3 基于本体的军事情报元数据描述框架

3.1 军事情报分析

军事情报利用一定的方法和技术对情报的外部特征进行描述、内容特征进行揭示,其资源描述的构成具备了整个军事资源对资源描述需求的共性。与军事资源直接相关的要素包括:区域、武器装备、编制和部署等,这些资源详细记录了与军事情报相关的覆盖范围、作战任务和安全等级等基础信息。同时,军事情报作为军事资源的一类,有着其自身的特性,因此需要一些专门记录这些特性的信息描述。与军事情报密切相关的要素有:时间、提供者、安全等级、级别等,这些数据涵盖了军事情报从建立到内容描述再到访问等每个环节。其中每个信息的描述根据应用条件或记录信息的不同可继续划分为更加详细的信息描述。

3.2 军事情报核心元数据

军事情报的特殊性决定军事情报元数据的特殊性,本文针对军事情报的特殊性,参照国内外一些成熟的元数据标准,在都柏林核心元数据集(DC)[9]的基础上加入军事情报特有的元素,提出了一种基于本体的军事情报核心元数据。

军事情报元数据主要对各类情报资源进行描述,因此情报资源可以按照一定的性质分为资源管理型元素、资源内容型元素、安全认证元素和访问操作元素。

如图1所示,军事情报核心元数据归类合并了在内容和数据结构上具有相关性的数据集合,元数据模型有4个一级情报资源描述分类,在每个一级分类下又分为若干个二级分类。

图1 军事情报核心元数据模版

资源管理元素[10],为用户直观提供概览式情报资源的元数据,包含序列码(全局唯一序列码)SerialCode、版本Version、标题Title、时间Time、提供者ProviderInfo、资源属性ResAttribute、当前状态CurrentState。

资源内容元素,用于描述或标识情报资源内容和概要的信息元数据,包含主题Subject、关键字KeyWord、摘要Abstract、用途Purpose、军事来源Source、覆盖范围Coverage、自定义标签Tag、服务分类ServiceClass。

安全认证元素,对情报资源对象安全认证方面描述的元数据,包含安全等级SecurityLevel、授权信息AuthorizationInfo、信任度Reliability、分发控制DistrubuteControl和加密信息EncrpytionInfo。

访问操作元素,提供情报资源安全合法访问依据的元数据,包含访问级别AccessLevel和访问位置AccesLocation。

3.3 雷达情报核心元数据描述

基于本体的军事情报元数据主要用于规范数据的记录,从而使数据管理和共享能统一标准,提高情报的利用率。根据建立的情报核心元数据模板,记录了一则雷达情报的描述文件。

地面雷达发现的概况:2007年8月8日6时37分,雷达x旅xx雷达站发现一批不明空情,当日14时50分,目标消失,历时8 h13 min,总航程约810 km。期间先后升空5批次歼击机对不明空情进行拦截查证。

// 资源管理元素

// 序列码

//当前版本

// 标题

// 建立时间

2007-08-08 07:06:19// 发布时间

// 更新时间

// 有效期

// 提供者

//提供者机构

//提供者ID

//提供者IP

//提供者级别

//提供者所在区域

//资源属性

//资源类型

640×512//资源格式

中止//当前状态

//资源内容元素

X旅X雷达站发现一批不明空情//主题

X旅X雷达站、不明空情//关键字

X旅X雷达站发现不明空情,6时46分由西北向东南方向移动。13时53分,目标进入相邻作战责任区;14时50分目标消失,历时8h13min,总航程约810km//摘要

实力部署//用途

雷达//军事来源

//覆盖范围

113°50E′~116°30′E//经度

39°30′N~42°10′N//纬度

//自定义标签

<雷达特点>12个型号20部雷达发现目标。包括三坐标雷达、两坐标雷达和测高雷达;频段覆盖包括米波雷达、L波段雷达、S波段雷达。多重覆盖最大达到5重覆盖。

<目标航迹特点>航迹点连续,航迹参数稳定、速度约100km/h;暂消点较多;多重覆盖雷达的定位点基本一致;目标发现和消失的高度均在10 000m左右,整个航迹点上高度欺负变化小。

//服务分类

战略//内容性类型

分析//功能性类型

战场态势//情报类型

//安全认证元素

秘密//安全等级

//授权信息

//授权角色

……//授权用户

//信任度

//分发控制

//加密信息

// 访问操作元素

// 访问级别

// 访问位置

4 结束语

信息化战争对情报的需求比重越来越大,情报数量和种类之多给用户们带来不小的挑战,本文在结合DC元数据和国内外一些成熟的元数据标准的基础上,利用本体理论建立了基于本体的军事情报元数据模型,这种元数据模型更加清楚明了地反映了情报资源所涵盖的信息,使得用户可直观快速地判断是否选择情报资源。

[1] 张春景.信息系统元数据规范应用研究[D].上海:华东师范大学,2004.

[2] 赵军.数据资源描述与组织的元数据方法[D].天津:天津大学,2005.

[3] 张晓林.元数据研究与应用[M].北京:北京图书馆出版社,2002.

[4] 王亚宁.基于本体的军用元数据模型研究[J].计算机技术与发展,2011(4):227-230.

[5] Studer R,Benjamins V R,Fensel D.Knowledge engineering,principles and methods[J].Data and Know ledge Engineering,1998,25(12):161-197.

[6] 黄宏斌.基于语义关系的××信息资源聚焦服务方法及关键技术研究[D].长沙:国防科技大学,2007.

[7] 陈锋.军事情报述论[J].军事百科,2007(4):20-21.

[8] 徐坤.军事情报元数据的多维索引技术研究[D].长沙:国防科技大学,2008.

[9] 吴建中.DC元数据[M].上海:上海科学技术文献出版社,2000.

[10]魏巍.ToIIS中情报信息服务描述和匹配技术研究[D].长沙:国防科技大学,2009.

[11]黄宏斌,刘震,邓苏,等.基于语义的信息聚焦服务[M].北京:电子工业出版社,2012.

Study of Ontology Based Military Intelligence Metadata Description

LI Yi-tong,HUANG Zi-jun,XIONG Jia-jun,WU Chang-fei

(Air Force Early Warning Academy,Wuhan 430019,China)

At present,military intelligence systems provide intelligence customization and distribution services according to intelligence specialty sorts,and intelligence share among different specialty systems is difficult because of no uniform description to intelligence resources.Based on the characteristics of metadata and military intelligence,this paper introduces the thought of ontology metadata into military intelligence description,establishes the metadata model for describing the military intelligence resource,presents the description frame of military intelligence metadata model based on ontology,which makes the intelligence resources be found,got,used and shared more easily.

ontology;metadata;military intelligence;metadata model

2015-04-23

TP311

A

CN32-1413(2015)04-0111-05

10.16426/j.cnki.jcdzdk.2015.04.028

猜你喜欢
军事情报数据模型本体
基于区块链的微网绿电交易数据模型研究
眼睛是“本体”
基于Pro/E 的发射装置设计数据快速转化方法
一种基于社会选择的本体聚类与合并机制
经济全球化对我国劳动收入份额影响机制研究——基于面板数据模型
专题
Care about the virtue moral education