刘海燕 朱铭铭
收稿日期:2023-09-02
DOI:10.19850/j.cnki.2096-4706.2024.06.018
摘 要:战场信息网是人员、设备、武器平台等互联互通的复杂网络,战场信息网信息群的发现确定,可以进一步定位敌方的战场部署和指挥关系,为作战决策提供更详细的情报支持。在以往的研究中大多以发现拓扑结构为重点对战场信息网进行分析,文章探索利用节点的属性信息进行信息群发现,首先搭建一个虚拟的战场信息网,模拟战场上的情报群和指控群以及其他信息群通信,通过抓取不同信息群节点数据包提取数据特征来构建节点数据集;然后搭建DNN模型以数据特征作为输入,对节点的信息群属性进行判断;最后搭建一个虚拟战场信息网,使用训练后的DNN模型对节点所属信息群进行判断。
关键词:信息群;数据特征;深度学习
中图分类号:TP393 文献标识码:A 文章编号:2096-4706(2024)06-0078-04
Information Group Discovery Technology of Battlefield Information Network
Based on Deep Neural Networks
LIU Haiyan, ZHU Mingming
(Army Academy of Armored Forces of PLA, Beijing 100072, China)
Abstract: The battlefield information network is a complex network of personnel, equipment, weapon platforms and so on, and the discovery and determination of the battlefield information network information group can further locate the enemy's battlefield deployment and command relationship and provide more detailed intelligence support for operational decision-making. In the past research, most of the battlefield information network analysis focuses on the discovery of topology, this paper explores the use of node attribute information for information group discovery, first builds a virtual battlefield information network, simulates the battlefield intelligence group, accusation group and other information group communication, and construct node data set by capturing different information group node data packets to extract data features. Then, a DNN model is built to judge the information group attributes of nodes by using data characteristics as input. Finally, a virtual battlefield information network is built, and the trained DNN model is used to determine the information group to which the node belongs.
Keywords: information group; data characteristics; Deep Learning
0 引 言
网络社区是指内部连接紧密,而外部稀疏的群体结构。互联网社区可以以用户的共同兴趣、教育背景等为分割标准,如论坛、微信群等。社区发现技术为了解、监视、控制乃至运用各种网络起到了至关重要的作用。
以互联网技术为基础的战场信息网,链接多维战场空间的各类作战单元,支持对战场的全面掌控。复杂网络都存在着普适的局部聚集特征,战场信息网也不例外。战场信息网中不同通信节点担负的通信任务不同,节点的流量特征也不同,可以将具有相同流量特征的节点集合命名为信息群。
信息化作战中,发现敌方战场信息网信息群可以得到重要节点和通信流向甚至是整个信息网的部署关系,有助于监视、控制、切断、打击破坏相关节点。本文借鉴互联网社区发现技术,研究设计战场信息网信息群发现技术。
1 网络社区发现方法分析
社区检测研究最早是从子图分割问题演化来的[1],最传统的社区发现算法是图分割算法,即将社区看作密集子图结构,而社区发现就是将网络中的节点分配到多个已经预先定义好规模的社区中,并使处在社区间的边数最小。聚类法将社区看作一组内容相似的节点集合,定义结点的相似度,使用聚类方法进行社区发现。分裂法进行社区发现将社区之间的连接视为有最高通信流量的边,然后将其删除。基于谱分析的社区发现算法的基本依據是,在同一个社区内的节点其特征向量近似。将节点对应的矩阵特征向量看成空间坐标,将网络节点映射到多维向量空间,然后运用传统的聚类算法将它们聚集成社区。基于模块度优化的社区检测算法认为,较高的模块度值应该对应较好的网络划分。其中,模块度是优化的目标函数,它表示所有被划分到同一个社区的边所占的比例,再减除掉完全随机情况时被划分到同一个社区的边所占的比例。三种常用的近似最优算法包括贪心技术、模拟退火[2]、极值最优[3]。动态社区检测算法则随着时间流逝的过程动态更新节点的社区划分。基于深度学习的社区发现[4],将网络的拓扑结构和属性作为神经网络的输入,其中网络拓扑结构可用邻接矩阵表示,网络的属性可以用特征矩阵表示,神经网络的输出就是发现的一组社区。
传统的社区发现研究认为每个节点归属于一个社区。而在现实的网络中,一个节点可以同时归属于不同的社区,例如在社交网络中,某人同时属于不同的微信群。重叠社区的发现比较具有挑战性。
现有的社区发现算法,主要依赖网络拓扑结构来发现社区,但社区的形成除了与节点间拓扑结构有关外,还受到节点自身相关属性信息的影响。本文提出的基于流量特征的战场信息网信息群发现,借鉴了互联网社区发现的思路,运用深度神经网络挖掘通信节点数据流量的特征,并基于该特征判断节点所属的信息群。
2 基于流量特征的节点信息群属性判别
2.1 信息群节点流量特征分析
战场信息网是多作战平台联合、协作的纽带,贯穿整个作战进程。战场信息具有海量性、多源性、异构性和动态性等特点。一般地,为了使战场信息形成规范、语义一致,需要对战场信息进行统一表示[5]。面向任务的格式化战场信息表示是结合消息编码、消息字典以及消息格式于一体的信息表示的方法,通过约定格式化消息及处理规则实现多系统互连互通,典型代表是美军战场信息网中各种数据链消息标准。
数据链以通信网络为纽带,以信息处理为核心将战场态势感知系统、火力打击系统等作战要素有机相连,实现各军兵种作战部队与武器平台之间的信息交互和态势共享[6]。不同数据链具有不同的传输方式和信息格式[7],目前美军数据链分为三类:態势感知数据链,用于多平台之间信息的交换,主要是传输格式化报信息,可以传输各类指挥控制信息,包括作战指令、战场态势分析、战略规划等,实现指挥员之间的信息共享和指挥控制,通常采用的快速、简单、对实时性要求不太高的简短报文进行传输[8-10];情报数据链传输图像和信号情报,支持多种类型的情报信息传递,具有高速、高效、实时不间断的特点[11,12];其他专用数据链,如武器协同数据链,是武器打击专用信息交换数据链。
由此可以看出,不同信息链路中的节点由于其主要任务不同,传输数据的种类、频率、格式等都不同,因此,可以挖掘不同信息群节点传输数据的流量特征,并据此根据节点的流量来判断节点的信息群属性,这对识别战场信息网中通信节点的关系和任务有重要作用。
2.2 基于流量特征的节点信息群属性识别方法
在战场信息网中,基于流量特征判断节点的信息群属性,其基本思路包括如下三步,一是搭建与实际战场信息网相似的网络环境,运行与真实作战数据链类似的数据传输任务,捕获不同信息群节点传输的网络数据包,并提取数据包特征。二是搭建节点信息群属性判别的深度神经网络模型,以捕获的网络数据特征数据集为样本对模型进行训练。三是构建虚拟战场信息网,利用训练的深度神经网络模型,基于实时捕获的数据包特征,对节点的信息群属性进行判别,并将网络的信息群识别结果进行展示。
2.3 基于流量特征的节点信息群属性识别方法的实现
2.3.1 节点的流量数据抓取
在模拟战场信息网中,模拟侦察机回传侦察信息来获取情报链路数据,模拟指挥节点对下级发送指控报文来获取指控链路数据。为了统一时间计算标准,以1分钟为时间长度,在情报链路上的不同节点提取6 000条数据,指控链路上不同的节点提取20 000条数据,不属于上述链路的节点上提取10 000余条数据。
2.3.2 节点的流量特征提取
基于pyshark分析网络协议,创建事件循环,异步处理数据包,以抓取数据包与上一个数据包时间间隔、捕获帧的增量、与第一个数据包的时间间隔、数据包标识符号、数据包的大小、IP数据包总长度作为数据特征,自动化提取特征构造数据集。为每个样本标注节点信息群属性标签,用0代表“情报群”,1代表“指控群”,2代表“其他”。数据集xlsx文件如图1所示。
2.3.3 基于流量特征的节点信息群属性模型构建
基于构造的数据集,搭建深度神经网络模型,通过多分类方法构造节点的信息群属性判定模型。此模型共三层,在输入层和隐藏层1之间有64个阈值;隐藏层1和隐藏层2之间有32个阈值;输出层和隐藏层2之间有3个阈值。对数据集进行切分,将80%的数据作为训练集,用20%的数据作为测试集。
图1 数据集文件
创建判定模型model = Sequential(),添加具有ReLU激活函数的全链接层,最后添加基于softmax激活函数的输出层,以进行三分类:
model.add(Dense(64,input_dim=X_train.shape[1],activation="relu"))
model.add(Dense(32,activation="relu"))
model.add(Dense(3,activation="softmax"))
model.compile(loss="categorical_crossentropy",optimizer="adam",metrics=["accuracy"])
训练模型迭代200次,每次32个样本数据进行训练,并将10%的训练数据分配为验证数据对模型进行评估。训练集和验证集的loss曲线、acc曲线如图2、图3所示。可以看出此训练模型中训练集和验证集都已经收敛且两者之间相差非常小,模型的拟合度很好。
图2 损失变化曲线
图3 准确率变化曲线
对此模型使用验证集进行评估,其中情报群样本精确率为0.984 375,召回率为1,F1-score指标为0.99;指控群样本精确率为1,召回率为0.98,F1-score指标为0.99;其他信息群样本精确率为1,召回率为1,F1-score指标为1。通过评估可以得到该模型对于每个测试集样本的预测都比较准确。
2.3.4 基于流量特征的信息群发现
基于训练得到判定模型后,可以实时对任何节点的信息群属性进行识别。随机在一些节点间运行模拟的侦察情报通信和指控信息通信,在任一节点上抓取600条数据包,提取节点的流量特征,将特征与节点的IP地址一起保存。将节点的数据去除ip地址,得到predict_data,利用模型model计算预测结果predict_res。
predict_res = model.predist(predict_data)
将预测的标签与原始数据的ip地址列合并,作为判定结果保存。
3 实验过程及结果显示
使用VMware虚拟机软件,搭建一个虚拟战场信息网测试网,虚拟了13个通信节点。利用不同信息群节点传输数据的流量特征在虚拟机间运行模拟通信,抓取不同链路节点数据并针对抓包后的文件自动提取数据特征转化为表格模式,搭建深度神经网络模型,通过多分类方法对节点信息群属性的模型进行训练,形成训练模型,最后搭建虚拟战场信息网进行通信,对不同节点抓取数据包,用训练模型进行判断,将抓取数据包的IP地址和标签进行结合,得到判定结果文件。
識别每个ip的标签值,如果此ip是情报群节点标签值为0,标签值是指控群节点则标签值1,属于第三种信息群标签值为2,同时处于多种信息群的节点在其ip后有相对应的标签值,如ip地址为192.168.1.40同时处于情报群和指控群,对应的标签值为{0,1},最后利用标签值进行颜色映射。
情报群节点通过绿色表示,指控群节点通过蓝色表示,第三种信息群使用红色表示,同时处于情报群和指控群的节点通过黄色表示,同时处于指控群和第三种信息群的节点通过橘色表示,同时处于三种信息群的节点通过紫色表示。通过图4可以直接得到各节点在战场信息网中所属信息群,以及处于多个信息群的重要节点。
图4 节点信息群属性显示
4 结 论
本文研究设计了一种根据结点数据流特征判断其信息群属性的方法。搭建虚拟战场信息网对不同信息群节点的流量进行分析,提取不同的特征,基于深度学习方法判断节点所处的信息群。在此过程中运用深度神经网络多分类法,基于流量特征形成训练模型,对网络节点的信息群属性进行判断,最后用不同颜色呈现信息群分类结果。通过该图能够快速判断网络节点处于不同的信息群以及该节点的重要性。该方法可以拓展应用到更多种类信息群的判定,以及基于不同特征的信息群划分中。该方法缺点是需要捕获流量数据,基于流量特征构建模型并进行判断,因此该方法还需要其他网络攻防技术的支持。
参考文献:
[1] 潘磊.若干社区发现算法研究 [D].南京:南京大学,2014.
[2] 李眩,童百利,方婷婷.基于模拟退火思想的最优最差蚁群算法求解的TSP问题 [J].山西师范大学学报:自然科学版,2023,37(2):22-27.
[3] BetterBench.模拟退火算法(SA)、遗传算法(GA)、布谷鸟算法(CS)、人工蜂群算法(ABC)学习笔记---附MATLAB注释代码 [EB/OL].(2021-04-09).https://zhuanlan.zhihu.com/p/363411887.
[4] 张茹.基于深度学习的社区发现和影响力分析 [D].西安:西安电子科技大学,2020.
[5] 潘积远,高亮. 战场信息组织管理现状及其发展趋势 [J].物联网技术,2015,5(6):81-83.
[6] 科普中国-军事科技前沿.美军为何密集测试战术数据链系统 [EB/OL].(2021-10-27).https://junshi.gmw.cn/2021-10/27/content_35290154.htm.
[7] 张沛,王志国,王震.美国空军数据链体系发展现状及建设方向 [J].指挥信息系统与技术,2023,14(1):8-14.
[8] 刘红军,徐永胜.美军战术数据链报文格式及其特点 [J].中国电子科学研究院学报,2006(3):291-295.
[9] 张继永.基于作战任务的数据链网络规划模型 [J].数字技术与应用,2020,38(5):71-72.
[10] 方秀花,姚瑞芳.FBCB2系统的作战应用及未来发展 [J].火力与指挥控制,2006(3):1-4.
[11] 周海俊,晏杰.军队信息保障体系建设及技术发展研究综述 [J].计算机与数字工程,2016,44(9):1790-1795.
[12] 张沛,王志国,王震.美国空军数据链体系发展现状及建设方向 [J].指挥信息系统与技术,2023,14(1):8-14.
作者简介:刘海燕(1970.03—),女,汉族,河北遵化人,教授,博士,研究方向:网络信息安全和信息通信;朱铭铭(1991.08—),女,汉族,山东潍坊人,硕士在读,研究方向:通信网络。