一种移动自组织网络数据分发方法*1

2015-03-09 08:17吉波,张宏亮,张科
现代防御技术 2015年5期
关键词:特征提取数据挖掘



一种移动自组织网络数据分发方法*1

吉波1,2,张宏亮2,张科1

(1.西北工业大学 航天学院,陕西 西安710072; 2. 中国人民解放军驻210所军事代表室,陕西 西安710065)

摘要:针对战场移动自组织网络实时、高效传输大容量情报信息的应用需求,提出一种基于压缩传感与用户需求匹配分析的网络数据分发方法。该方法通过分析用户需求,筛选匹配的用户数据,并利用统一表征字典实施稀疏表示与精确重建,同时利用新情报信息自主更新和维护表征字典,支撑扩展的作战应用。将其应用于分析战场侦察的可见光图像,仿真结果表明新方法能大幅度降低有限带宽网络实时传输数据量。

关键词:压缩传感;Ad Hoc网络;稀疏表示;数据挖掘;特征提取;战场管理

0引言

在作战体系的对抗中,有效夺取战场“信息制胜权”需要综合运用多种传感器,挖掘传感器对战场的感知信息,经过加工处理才能完整地感知战场环境。然而,多种传感器的投入使用,将使得作战平台可获取大量具有冗余性的情报数据,影响作战决策。另一方面,战场环境通信网络的作战资源毕竟有限,尤其是网络的带宽资源。大量战场情报数据在有限带宽资源条件下传输对作战信息系统提出巨大的挑战[1-2]。

美军是最早研究复杂战场环境下可靠传输战术信息网络的国家之一。早在20世纪70年代,美国国防部高级研究规划署(defense advanced research projects agency,DARPA)出于对未来战争的考虑便开始研究在战场环境下利用移动自组织网络进行数据通信[3-4]。1994年,DARPA又启动了全球移动信息系统项目,研究能够满足军事应用需要的、可快速展开的、高抗毁性的移动信息系统[5]。1997年,DARPA启动了先进战术瞄准技术项目,专门研究基于自组织网络快速、准确定位远距离敌方机动防控雷达的瞄准技术[6];随后,针对面上移动目标精确打击需求,DARPA启动了经济型地/海面移动目标交战项目[5],旨在研究与开发经济可承受的全天候、远程精确快速打击移动目标的技术。在这一系列DARPA计划/项目推进过程中,美军构建了多种战地数据链网络,其中以战术数据链(Link16)、基于移动自组织网络技术的战术瞄准网络技术[7](tactical targeting network technology, TTNT)和协同交战概念[7-8](cooperative engagement capability, CEC)最具代表性,分别代表了美空军与海军支撑网络中心战的作战概念。作战平台之间通过高速交换目标跟踪、探测定位与图形图像等信息,对移动/固定目标进行持续跟踪与准确定位。然而,网络成员数越多,目标批次越多,数据更新越快,对系统的传输容量和速率要求愈高。

为灵活高效支撑复杂战场环境信息可靠交换,美军在数据链网络的物理层、链路层和网络层体制上取得了突破性进展,由静态规划的网络架构向移动自组织网络架构方向发展。美军开发了战术成员网[7](tactical network of members,TCN),采用按需分发原则,建立信息收发映射关系,过滤各种传感器发送的量测数据,避免直接广播原始量测造成的带宽资源浪费。TCN通过重新定义目标属性,压缩传输带宽,从而能适配各种通信信道,保证其能适合多军兵种、多任务的作战需要。基于数据链网络的基础信息交换能力,依据作战应用适时、按需分发各类战术信息将是数据链网络信息处理的重要发展趋势。

本文结合移动自组织网络在战场环境的应用现状,提出了一种移动自组织网络数据分发方法,通过挖掘传感器数据潜在知识,建立适应复杂战场环境的高效、动态的数据分发机制,为作战人员实时提供作战应用可用的战术信息,在有限带宽资源下提高数据的利用效率。

1数据分发研究现状

随着传感器技术、作战规模与作战样式的发展,现代高技术条件下的战争涉及海量作战信息的交互与处理。从海量的作战信息中筛选各作战平台/作战人员真正需要的信息,是将信息优势转化为知识优势,进而转化为决策优势的基础和前提。借鉴美军TCN的成功经验,需要对海量作战信息实施按需分发,实现在战时通信资源极度紧张的条件下为作战人员传输有用、可用、可靠的战术信息,避免大量无关信息、无用信息对作战人员造成的“信息淹没”。

目前,实现作战信息的按需分发主要有3种方法。

1.1基于主动服务的信息分发方法[9]

主动服务信息系统通过人工智能与专家系统的推理技术和关联匹配技术等建立规则库以及信息分发与用户需求的关系,向需求用户分发相关数据,其信息分发系统结构如图1所示。

图1 基于主动服务的信息分发Fig.1 Information dissemination based on active service

系统中各用户以及其他的上级通报、卫星数据、人工情报以及共享信息空间等构成了综合的信息池,其中共享信息空间是一个动态的数据集,可存储多种结构的信息数据。信息资源管理器对信息池中的数据进行更新与管理;匹配规则库按照需求分析信息特征的匹配度,将匹配程度高的数据主动推送到相应的用户。用户完全不需要做额外的工作便可以获得所需的信息。

系统结构简单,工作流程清晰。缺点是匹配规则库复杂,尤其是在信息量与需求量很大的情况下,匹配规则难以保证系统的适用性和时效性。因此,基于主动推送的按需分发方法只适用于小规模或局部用户网。

1.2基于发布/订阅的信息分发方法[9]

与主动推送的信息分发处理方式不同,基于发布/订阅的信息分发方法是需求驱动的信息分发方法。用户根据自己的信息需求,向系统发布订阅消息,当中包含用户需求的规范化描述[10];系统依据订阅消息的具体要求向该用户发送所需信息,或者向用户返回所需信息的访问地址。基于发布/订阅的系统结构如图2所示。

图2 基于发布/订阅的信息分发Fig.2 Information dissemination based on   release/subscription scheme

1.3基于过滤的信息分发方法[9]

基于过滤的信息分发方法的核心思想是信息过滤,即用户端根据自身需求的总体或大致特征,将不符合需求的信息屏蔽处理[11]。当用户的信息需求不容易明确描述和体现,或者用户对自己的需求认识不够清晰时,用户根据自身性能特点及需求对所接收的信息进行取舍、筛选,仅保留符合程度较高的信息,从而达到信息分发的目的[12]。然而,在整个过程中,信源用户端由于不明确用户需求而将所有信息堆积在信道上进行传输,极易造成信道资源的浪费。

以上3种方法从信息层面提供了信息按需分发的部分解决方案。但仍未结合网络带宽需求统筹数据到信息的整合过程,复杂电磁环境下的信息分发支持能力有限。为此,需要贯穿数据获取、信息产生、信息交换的处理过程,制定适应低带宽条件的数据分发方案。

2移动自组织网络数据分发方法

2.1数据分发模型

考虑到信息的几何增长效应以及战地数据链网络的通信带宽资源这两方面的因素限制[13],本文分2条线构建数据按需分发处理模型,该模型一方面解决数据的组织与管理,使得大量传感器探测的情报信息进行组织与管理,形成分类有序的情报数据仓库以及对应的检索分析表;另一方面在需求驱动时结合索引分析表进行需求匹配分析,筛选符合需求或者需求符合程度高的数据进行分发。面向内容的数据按需分发模型如图3所示。

图3 移动自组织网络数据分发模型Fig.3 Data dissemination model for mobile   Ad Hoc network

该数据按需分发模型包含数据接收与分发、面向信息内容的数据管理模型、数据库更新与管理和需求匹配4个功能模块组成。

(1) 数据接收与分发功能模块主要完成2个功能:

1) 接收并重建作战体系其他平台的信息;

2) 压缩分发本平台发与其他平台的信息。

(2) 面向信息内容的数据管理模型功能模块完成如下功能:

3) 对本平台以及他平台数据在统一描述空间上进行数据统一表示;

4) 在数据统一表示基和数据模板基础上完成数据挖掘,将大量情报信息转化为易理解的战场感知知识。

(3) 数据库更新与管理功能模块的主要功能如下:

1) 对数据挖掘的情报信息进行组织与管理;

2) 形成数据仓库的内容索引表;

3) 更新系统的数据模板,使其对环境具有强适应性。

(4) 需求匹配功能模块的功能是:

对需求进行描述与提炼。

2.2数据组织与管理

数据组织与管理是高效实现数据按需分发的重要前提,也是消除各作战平台大量情报数据冗余性的重要手段,避免无关或无用数据对数据分发需求的误导。

绿色经济有两种含义,一种是对原有的经济产业进行生态化的改造,由原来的非环保型产业转变为环保型的绿色产业,哪怕放弃一部分收益,也坚决不过度破坏环境。另一种是发展一些对环境本身影响较小的或者利于改善环境的企业。例如农家乐、服务业、有机蔬果等。总的来说,绿色经济就是大力发展无污染、节约能源的绿色经济产业,并能实现环保与经济的双向发展,人们需要认识到绿色经济在我们日常生活中的深层次影响。对于整个社会发展来说,在绿色经济的理念下,其带来的变化将是层次化和多样化的。比如:在这一理念下,只有淘汰那些落后的产业和企业,并积极发展一些绿色生态的企业,才能让其适应时代的发展。

2.2.1数据表示

面向数据内容的数据统一表示包含2部分内容:面向数据内容的代表性特征分析和数据稀疏表示。

假定x是输入数据,划分为大小一致的m个子数据x1,x2,…,xm,为了消除子数据之间的冗余性以体现数据的本质内容,本文采用马尔科夫随机场算法对各子模块数据进行分析。

(1)

2.2.2信息与检索

获得输入数据与数据模板之间的关系后,仍需进一步挖掘它们之间本质内容关系,方能将输入数据按照内容存放到数据仓库中。基于L1,L1/2的正则化理论认为源数据空间中数据的关系与源数据的本征特征空间上特征关系是一致的。也就是说,当把数据的本质内容看成源数据的代表性约束特征时,数据统一表示所获得关系信息y可进一步描述本质内容之间的关系。因此,采用数据挖掘的分类技术可生成内容索引表。

假定数据模板对应的内容特征为C=(c1,c2,…,cK),输入数据的内容特征向量为ci,于是,按照基于L1,L1/2的正则化理论有:

ci=Cy,

(2)

2.2.3数据管理

在输入数据的内容索引表生成后,输入数据可按照内容索引值对应的类别,将输入数据存储在该类中。当某一类数据的数据量较大时,需要实时对数据仓库进行管理与更新,一方面使得数据仓库中数据得以更有效地组织,另一方面则是更新数目模板,使得本文提出的数据按需分发模型更能够适应战场复杂多变的环境。

数据仓库管理与更新采用数据挖掘中的聚类算法,实时利用本类数据生成最具代表性的数据模板,更新已有的数据模板。

2.3数据分发流程

面向信息内容的数据组织与管理的目的是更好地满足数据按需分发需求。当网络中其他用户需要某类信息时,实时发出数据请求。系统的数据接收/分发功能模块接收到数据请求时,实时在本平台内部进行数据检索与分发的处理过程。

2.3.1匹配分析

关联分析的目的是挖掘用户需求与内容索引表间的相互关系。结合分布式数据挖掘的概念和处理流程,本课题采用关联规则技术来实现。比较经典的算法是由 R.Agrawal 等人于1993 年提出经典的关联规则发现算法Apriori算法,算法中提出的最大频繁项集(most frequency index,MFI)是相似度衡量的基础。具体算法实现如下:

设A和B是2个同类分布式数据集,

MFA={(A1,CA1),(A2,CA2),…(Am,CAm)},

MFB={(B1,CB1),(B2,CB2),…(Bn,CBn)},

式中:Ai为集合A的各个数据集的最大频项集;CAi为各自的支持度,1≤i≤m;Bj为集合B的各个数据集的最大频项集;CBj为各自的支持度,1≤j≤n。

对于集合A和集合B的相似度定义如下:

SIM(A,B)=2I3/(I1+I2).

I1,I2,I3分别如下:

2.3.2数据压缩传输

对于数据收发部分,本文采用基于压缩传感的数据压缩传输方法减轻有限资源带宽对数据传输的压力。基于压缩传感的数据压缩传输模块包含3部分关键内容,分别为压缩测量、基于冗余字典的数据稀疏表示、数据精确重建。基于压缩传感的数据传输模型[15]如下:

(3)

式中:A=ΦΨ为M×N矩阵;Ψ为N×N的特征变换矩阵;s为x在特征变换矩阵Ψ下的稀疏表示向量,包含β个非零分量。

(1) 压缩测量

压缩测量通过冗余、统一的测量矩阵将源数据投影到低维特征空间,以达到压缩数据传输规模的目的。压缩测量的关键在于分布式网络如何生成一致的测量矩阵。为解决此问题,本文设计分布式测量矩阵生成协议,主要思想是在时间同步基础上利用伪随机算法保证测量矩阵生成的一致性。

(2) 稀疏表示字典

海量信息预处理系统的数据压缩模块针对各种传感器的类型采用基于K-SVD字典学习算法[15]建立稀疏表示字典库。平台加电开始工作后,数据压缩模块从本地预加载的关于各传感器采集的一维和二维信号数据,利用K-SVD字典学习算法训练得到各传感器对应的稀疏字典库。当接收平台接收到其他平台发送的数据压缩测量时,接收平台根据数据中传感器类型标识自适应地从稀疏字典库中选择用于原始信号稀疏表示的字典。

稀疏字典的构造是实现信号稀疏分解的重要前提。K-SVD算法旨在通过预加载的图像训练集寻找最优的字典,使基于此字典的信号稀疏表示对于训练样本的方差达到最小。K-SVD字典学习算法的目标为

(4)

式中:F为从预加载训练图像集生成的训练样本矩阵,每一个列向量对应一个训练样本;D为待构造的冗余稀疏表示字典,每一个列向量对应一个字典元素;S为F在D上分解得到的系数矩阵,满足约束限定的稀疏性。

(3) 数据重建

压缩传感理论利用信号稀疏或者可压缩性质有效地重建原始信号。当信号为稀疏或可压缩信号时,数据重建可以通过求解一个系数约束的最优化问题实现。信号的稀疏约束可以通过最小L1范数实现,即为

(5)

式中:A为已知的表示矩阵。

3应用实例

利用自然图像按8×8大小的小图像块采样,构成11 000个样本数据,经特征提取形成了如图4所示的数据特征模板,具有特征不变的方向性和边缘性。

图4 数据特征模版Fig.4 Feature templates of natural images

数据特征模版构成了自然环境可见光图像的表示字典。不同的数据按照表示字典的编码向量进行聚类分析,形成同类组织的数据仓库。图5为陆海空战场环境侦察图像表征示意图,其中方形、圆形和菱形分别表示海军编队、海空协同作战和陆战场环境的表征结果。由于海军编队与海空协同作战场景具有类似的背景,其表征重叠;陆战场则具有明显不同的表征特性。可见,利用统一的数据特征模版,可区分不同战场环境。

图5 统一数据特征模版下的不同场景表征Fig.5 Different encoding under uniform   data feature templates

当传感器平台利用可见光传感器探测到战场环境图像时,利用数据特征模版进行特征表示。表征前后数据量比例约为6:1,远端接收平台接收到压缩测量后,利用数据特征模版重建原始数据。可见,利用压缩传感的数据分发方式,在自组织网络上交换数据量是原数据的1/6,有效降低了网络传输的业务量。

4结束语

为了提高复杂战场环境下信息的利用效率,本文致力于解决多传感器投入使用引起的“信息几何增长效应”以及网络有限传输带宽的固定限制,提出了面向信息内容的自组织网络按需分发方案。方案采用了马尔科夫随机场、稀疏表示、数据挖掘等智能信息处理技术面向信息内容对数据进行组织与管理,同时利用数据压缩传感技术构建了低带宽利用的数据压缩传输子系统,减轻网络传输大量数据的压力。

参考文献:

[1]王相平,杨瑞娟,黄美荣,等.基于聚类的雷达数据按需分发技术[J].计算机工程,2011,37(19): 289-290.

WANG Xiang-ping, YANG Rui-juan, HUANG Mei-rong, et al. Technology of Radar Data Distribution on Demand Based on Clustering[J].Computing Engineering, 2011, 37(19): 289-290.

[2]陈洁. 基于内容分发的信息分发管理系统[J].计算机工程,2008,34(21): 82-84.

CHEN Jie. Information Dissemination Management System Based on Content Distribution[J].Computing Engineering, 2008,34(21): 82-84.

[3]JUBIN J, TORNOW J D.The DARPA Packet Radio Network Protocols[C]∥Proceedings of the IEEE, 1987, 75(1): 21-32.

[4]SCHACHAM N, WESCOTT J. Future Direction in Packet Radio Architectures and Protocols[C]∥Proceedings of the IEEE, 1987:83-99.

[5]TOH C K. Ad Hoc Mobile Wireless Networks[M].Upper Saddle River, New Jersey, Prentice Hall PTR, 2002.

[6]陈赤联, 宋明, 王晓明. 武器数据链发展分析[J]. 导航,2008(1): 11-17.

CHEN Chi-lian, SONG Ming, WANG Xiao-ming. Analysis on Weapon Data Link Development [J].Navigation, 2008(1): 11-17.

[7]戴辉. 武器协同数据链发展需求[J].指挥信息系统与技术,2011, 2(5): 11-15.

DAI Hui. Development Requirement of Weapon Cooperative Data Link[J].Command Information System and Technology, 2011, 2(5): 11-15.

[8]陈升来. 协同交战能力(CEC)组网技术[J]. 指挥信息系统与技术,2012,3(1):29-32.

CHEN Sheng-lai. Cooperative Engagement Capability (CEC) Network Technique[J].Command Information System and Technology, 2012,3(1): 29-32.

[9]王子明,张海峰,陈邓安,等.基于信息栅格的作战信息按需分发方法研究[J].国防科技,2012,33(2): 33-36.

WANG Zi-ming, ZHANG Hai-feng, CHEN Deng-an, et al. A Research of Methods for Information Dissemination According to Needs Based on Information Grid[J].National Defense Science and technology, 2012, 33(2): 33-36.

[10]马卫东. 信息共享动力学及主动服务关键技术研究[D]. 成都:电子科技大学,2007.

MA Wei-dong.Research on Information Sharing Dynamics and Key Technology for Active Service[D].Chengdu: University of Electronic Science and Technology of China, 2007.

[11]陈洪辉,宛海宁,陈涛. 一种基于服务的态势信息订制分发方法[J]. 计算机应用研究,2009,26(4):1428-1431.

CHEN Hong-hui, WAN Hai-ning, CHEN Tao. Service-based Method to Subscribe and Disseminate Situation Information[J].Application Research of Computers, 2009,26(4): 1428-1431.

[12]宛海宁,陈洪辉,陈涛. 基于过滤的态势信息分发方法[J]. 计算机工程与设计,2009,30(1): 197-198.

WAN Hai-ning, CHEN Hong-hui, CHEN Tao. Filter-based Method to Disseminate Situation Information[J].Computer Engineering and Design, 2009,30(1): 197-198.

[13]冯剑. 空地数据链系统中一种图像数据缩减方案及关键算法的研究[D]. 吉林: 吉林大学,2004.

FENG Jian. An Image Reduce Scheme and Key Algorithm for Air-Ground Data Link System[D].Jilin: Jilin University, 2004.

[14]XU Zong-ben, CHANG Xiang-yu, XU Feng-min, et al.L1/2Regularization a Thresholding Representation Theory and a Fast Solver[J]. IEEE Transactions on Neural Networks and Learning Systems, 2012, 23(7): 1013-1027.

[15]ELAD M, AHARON M, Image Denoising Via Sparse and Redundant Representations over Learned Dictionaries[J].IEEE Transactions on Image Processing, 2006, 15(12): 3736-3745.

Data On-Demanded Dissemination Method for Mobile Ad Hoc Networks

JI Bo1,2, ZHANG Hong-liang2, ZHANG Ke1,

(1. Northwestern Polytechnical University,School of Astronautics, Shaanxi Xi’an 710072, China;2. PLA,Representative Office in 210 Institute,Shaanxi Xi’an 710065, China)

Abstract:Based on the requirements about real and efficient large volume intelligent information transmission, a data on-demand dissemination method is proposed by using compressed sensing and users’ needs analysis. Appropriate data is chosen and made sparse representation and accurate reconstruction. Meanwhile, new data are used to manage and update representation dictionary automatically for further tactical applications. Numerical simulation on visible reconnaissance images has demonstrated the real data volume in mobile ad hoc with low wideband is small.

Key words:compressed sensing;Ad Hoc network;sparse representation;data mining;feature extraction;battlefield management

中图分类号:TN929.5;TP391.9

文献标志码:A

文章编号:1009-086X(2015)-05-0045-07

doi:10.3969/j.issn.1009-086x.2015.05.008

通信地址:710065陕西西安70号信箱107分箱E-mail:digitalaudio@126.com

作者简介:吉波(1980-),男,山东诸城人。工程师,博士生,主要研究方向为导航、制导与控制。

*收稿日期:2014-10-21;修回日期:2015-03-18

猜你喜欢
特征提取数据挖掘
改进支持向量机在特征数据挖掘中的智能应用
基于Python语言构建名中医医案数据挖掘平台
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
基于数据挖掘的学业预警模型构建
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
基于跟踪脉冲的MIMO雷达多目标微动特征提取
微动目标雷达特征提取、成像与识别研究进展