雷伟斌,谢海松,薛建强,刘国永
(北方自动控制技术研究所,太原 030006)
目前战场上充斥着规模巨大、种类繁多、格式各异的战场信息。如何形成高效合理的信息共享能力,实现战场信息精准服务是当前军事信息系统建设中面临的一项重大难题。文献[1]研究了采用基于主题的发布/订阅系统对信息进行分发的方式,该模式订阅简单,匹配容易,但用户通过主题表达出的信息需求过于笼统,难以实现战场信息的精准按需共享。文献[2]研究了信息属性在提高信息存活率与分发速率方面的作用,但对信息内容以及用户信息需求分析不足,无法保证信息分发的准确性和有效性。为此,本文在前人研究的基础上,充分考虑作战用户的信息需求特点,提出了一种基于内容的信息分发系统模型。该模型采用基于信息内容的发布/订阅模式,以增强用户的需求表达能力,并以信息推荐技术作为补充,来弥补发布/订阅模式无法满足用户隐式信息需求的不足,以基于规则的信息推送技术作为补充,来弥补推荐技术无法确保战场关键信息准确分发的不足。该系统既可以满足用户的显式信息需求,也可以最大程度地挖掘用户的隐式信息需求,能更好地实现战场信息的按需分发。
信息分发系统是一种使信息生产者和信息消费者以匿名方式进行交互的分布式中间系统。它由接入战术网络的众多信息分发服务器及客户端共同组成。每个服务器是一个代理分发节点,每个代理分发节点为一定数量的本地客户端提供服务。所有代理分发节点形成一个对等的拓扑结构,如图1所示。信息分发系统是发布/订阅系统在军事上的一个典型应用,因此,也具有异步、松耦合、透明传输的特点[3]。
图1 信息分发系统的拓扑结构
作战用户的信息需求特点,一是作战用户对客观信息需求的认识具有不全面性和不准确性。因为对需求的认识与用户的知识储备、作战经验、思维方式等因素有关。用户认识到的可能仅仅是客观需求的一部分,或者全然没有认识到,甚至对客观信息需求产生错误的认识。因此,在图2中,集合S2与S1并不是完全重合的[4,30]。
二是作战用户的信息需求表达能力具有局限性,因此,表达出的需求具有模糊性。用户与信息系统交互需要通过某种方式表达自身的信息需求,例如关键词组、关键词逻辑表达式以及自然语言描述等方式。任何形式化语言都不如自然语言的描述能力强,但自然语言的处理技术尚有很大不足。因此,任何信息需求模型都不可能做到完全逼真地复现用户认识到的信息需求,只能尽量去逼近。因此,在图2中,集合S3与S2也并不是完全重合的。这也正是用户用信息主题进行订阅存在的不足。
用户的信息需求还可以分为显式需求和隐式需求两种[4]。显式需求是指用户通过检索关键词、订阅请求等方式表达出的需求,即图2中的集合S3。隐式信息需求是指用户完成任务所客观需要,但没有明确表达出来的信息需求,即图2中的集合S1-S3。而发布/订阅系统是完全按照用户的订阅进行信息的匹配与分发的,所以无论是基于信息主题的还是基于信息内容的发布/订阅系统,都只能满足作战用户的部分信息需求,即图2中的集合S6。因此,有必要将信息推荐和基于规则的信息推送技术引入战场信息分发系统作为发布/订阅模式的补充,最大程度地挖掘用户的隐式信息需求,以实现战场信息的按需分发。
图2 用户信息需求关系示意图
信息分发系统得到改进后,战场上的信息服务模式可以分为4种,即信息检索、信息订阅、信息推送和信息推荐,如图3所示。
图3 战场信息服务模式分类
信息检索需要依赖用户主动使用搜索引擎去进行检索。目前的信息检索大都基于布尔模型,用户使用关键词和逻辑运算符来构建需求表达式进行信息筛选。通过这种方式用户只能表达一些模糊的、简单的信息需求,所以搜索引擎返回的结果中含有大量不相关的内容。而大部分的战场信息均有很强的实效性并且对共享的准确性也有很高的要求,因此,信息检索服务常被用于机关日常办公、平时学习训练、临战前准备等场合,而不适合用于战时的战场信息分发。
信息订阅、信息推送、信息推荐这3种信息服务模式在用户做好信息订阅、推送规则制定等前期的准备工作后便可以实现战场信息的及时、自动分发。并且这3种信息服务模式之间是相互补充的。信息订阅分发服务可以准确、高效地满足用户的显式信息需求。而信息主动推荐是一种在民用领域应用比较成熟的技术,它可以智能地根据用户的历史信息需求来预测用户的隐式信息需求。但战场形势瞬息万变,用户的信息需求变得难以预测,因此,信息推荐的准确性有时也难以保证。而基于规则的信息推送服务完全不受用户历史需求的影响,当用户状态与发布的战场信息满足既定条件时,系统便将该信息向相应用户进行强制推送,以确保战场关键信息的准确、及时共享。
通过以上对作战用户信息需求特点的分析,设计了如图4所示的信息分发系统模型。该系统具备3种信息分发方式,即按用户订阅分发、按推送规则分发,按推荐结果分发。并且该系统模型还考虑了服务质量保证措施。部分模块的功能如下:
1)信息队列管理模块:每个信息分发节点均有多个用户不断地在发布战场信息,这些信息需要排队等候进行需求匹配。不同的战场信息有着不同的优先级,优先级由战场信息的重要性和时效性等因素来确定。
2)用户状态能力采集模块:该模块需要不断采集用户的实时状态和用户所在节点的作战能力。用户状态包括:用户位置、速度、移动方向等。作战能力包括:该节点所属作战分队、武器装备的种类、数量、性能参数等。用户的实时状态和目前的作战能力是为用户进行信息推送的必要信息。
图4 基于内容的信息分发系统模型
3)需求名录管理模块:考虑到战场环境的恶劣和复杂,某些信息分发节点可能会因被敌方摧毁、设备故障等各种原因而失去网络连接。对离线的用户进行信息需求的匹配以及分发就失去了意义,并且还会造成计算资源的浪费,影响对其他在线用户的服务质量。因此,需要挂起离线超过一定时间的用户的信息需求列表。
4)用户历史需求分析模块:该模块通过设计好的推荐算法来分析所有用户的历史订阅信息来预测各个用户可能需要的战场信息。生成各个用户的信息推荐模板,并存入用户推荐模板数据库。
5)分发名录生成模块:该模块负责生成与某条发布信息匹配成功的用户名单,并交给战术信息传输服务以进行信息分发。
发布信息的分发流程如图5所示。
信息化的战场上充斥着大量格式各异,类型多样的信息,对这些信息直接进行检索过滤的效率很低。利用元数据为战场信息资源建立一种机器可理解框架,可以实现大量战场信息的高效识别、处理和共享[5]。特别是对于战场上的图片、文档、声音、视频等非结构化信息,元数据所体现出的优势则更加明显。元数据作为一种结构化数据,可以用XML(eXtensible Markup Language)语言进行组织[6]。以一幅遥感图像为例,其元数据信息可以如下表示。
图5 战场信息的分发流程
基于信息内容的需求模型可以给作战用户提供更强的信息需求表达能力。用户不仅可以通过订阅来过滤自己需要的信息种类,还可以约束信息在时间、空间、目标属性等各方面的内容属性。战场上信息种类繁多,需要根据战场信息的内容格式分别来构建用户的需求模型,以便和发布的各种战场信息进行快速地匹配。因为只有当发布的信息种类和用户订阅的信息种类相同时,才有必要进一步去匹配信息的内容。模型中既应包含信息内容的属性也应包含各内容属性的取值范围。以空中目标情报信息为例,用户的信息需求模型如图6所示。同样,用户的需求模型也可以用XML来表示,以便于在系统中使用XML成熟的解析与匹配技术进行事件模型与订阅模型的匹配。
图6 用户的空中目标信息需求模型
作战用户的信息需求是和用户所处的战场环境密切相关的,基于规则的信息推送方法可以弥补传统信息推荐技术不能感知用户所处环境变化的不足。战场信息的推送与用户的历史需求无关,而是与用户的作战任务、时空状态、能力状态等因素相关联的。当用户的位置、机动方向或作战能力等状态信息与发布的战场信息一起触发了设定好的推送条件时,系统便向相应的用户进行该信息的推送。因此,信息推送规则的制定需要结合具体的作战场景,如敌方进行空袭或使用核生化武器等。以敌方突然使用核生化武器为例,若某作战分队未订阅核生化预警信息,并且由于某种原因,该分队也未能收到上级发送的预警信息。此时,信息分发系统的信息推送服务便可以发挥作用,使该作战分队避免受到核生化威胁,如图7所示。
图7 核生化警报推送案例
前人对信息推荐技术的研究焦点均放在信息种类或信息内容的属性上,即用户对什么种类的战场信息感兴趣或对某信息的哪些属性感兴趣,而忽略了信息内容取值的重要性。考虑到战场信息的特殊性,为作战用户推荐的信息不仅要求信息种类可能是用户感兴趣的,信息的内容也应该是与用户需求密切相关的。
无论采用何种推荐方法,用户的偏好信息都是必要的前提数据。以协同过滤推荐算法为例,可以以用户的历史订阅信息和接受的推荐信息中,某信息的某个属性取值范围出现的频率作为用户对该信息属性取值范围的评价。设Sij为用户i的历史订阅信息中某属性的取值区间j出现的次数,Rij为用户i在接受的历史推荐信息中某属性的取值区间j出现的次数。则用户i对取值范围j的兴趣度Tij为
以空中情报信息中的目标高度属性的取值为例,作战用户的偏好信息如表1所示。
表1 用户对目标高度的偏好信息Tij
通过对作战用户信息需求特点的分析,本文将基于内容的发布/订阅系统与基于规则的推送技术、信息推荐技术相结合,设计了基于内容的信息分发系统模型,并对系统实现所涉及的部分关键技术进行了研究。通过分析可知,基于内容的信息分发系统能够最大程度地满足作战用户的显式及隐式信息需求,实现战场信息的按需分发。但战场信息推荐等相关技术尚未成熟,有待进一步研究。