一种基于社交网络的卫星IP数据分析算法

2019-08-16 07:38张君毅赵国庆
无线电工程 2019年8期
关键词:网络分析卫星通信数据包

王 鹏,张君毅,赵国庆

(1.中国电子科技集团公司第五十四研究所,河北 石家庄 050081; 2.西安电子科技大学 电子工程学院,陕西 西安 710071)

0 引言

卫星通信由于在通信量、通信距离、覆盖面积和机动性等方面具备优势而被广泛应用,并成为未来战争中不可或缺的传输手段[1]。卫星通信侦察系统通过连续搜索、检测、监视与跟踪各种活动过程中的指挥控制、信息交互等通信信号[2-3],可获取重点地域内的力量部署、行动态势和意图等信息,为实现支援决策和各类行动控制提供有效支撑[4-5];另一方面,随着互联网技术及卫星通信技术的日益发展,卫星通信网络承载了越来越多的互联网业务流,如www、FTP和电子邮件等典型应用[6]。通过对卫星通信信号的分析测量、解调、编码识别与译码以及协议分析等可以获取包括IP数据包等在内的卫星通信信号特征参数及传输信息[7]。为更好地发挥卫星通信侦察系统的功能作用,本文针对卫星通信侦察获取的IP数据进行分析,获取包括源IP地址、目的IP地址以及协议类型等信息,并引入社交网络分析方法构建卫星IP通联网络,利用社区发现算法对构建的网络进行自动划分聚类,并对网络中的节点重要性进行评价。

1 基本概念

1.1 卫星通信侦察信息模型

在卫星通信侦察系统中,各领域用户主要关注卫星通信信号、卫星通信终端/卫星通信中心站、卫星通信网络、卫星通信转发器、位置和组织等要求。根据这些要求,文献[8-9]构建了卫星通信侦察信息模型,如图1所示,该模型描述了卫星通信侦察中各实体要素以及各实体要素之间的关系。

图1 卫星通信侦察信息模型

1.2 社交网络分析

社交网络是一种由多个节点和节点之间关系构成的社会结构[10]。其中,一个节点表示一个人或者社交网络中的一个参与者,利用节点间的链接关系,社交网络可以链接各种各样的社会关系。在计算机科学中,社交网络分析可以看作是网络知识发现或网络挖掘的分支,实现对网络中关系的分析,得到群体或社团的信息,涉及数据挖掘、机器学习、信息抽取与检索等多个领域[11]。目前,社交网络分析中具有代表性的研究话题主要包括用户行为分析、属性预测及分类等[12]。

随着对社交网络结构与性质的深入研究,研究者发现众多复杂的社交网络都呈现出一个共同的特性,即社区结构。社区结构是指一组内部节点相似度很大或联系紧密,而外部节点相似度很低或联系稀疏的节点集合。

2 基于社交网络分析的卫星IP数据分析

2.1 IP数据包的解析

待分析的数据是卫星通信中截获的Pcap文件。Pcap文件是一种常用的数据报存储格式,其总体结构如图2所示。其中,文件头共包含7个字段24 Bytes,数据包头共包含4个字段16 Bytes,数据包为标准网络协议格式,其长度在数据包头中规定。

图2 Pcap文件结构

通过解析Pcap文件,可以获得IP数据。IP数据又可以分为报头和数据部分,其中报头定义了版本、报头长度、服务类型和总长度等各类参数。IP数据在Pcap文件中的位置及IP数据的基本结构如图3和图4所示。

图3 IP数据在Pcap文件中的位置

图4 IP数据结构

图5给出了本文数据包协议分析算法得到的部分结果,可获取每个数据包的长度、协议类型、源IP地址及目的IP地址等结构化描述信息。

图5 数据包描述信息

2.2 IP网络通联生成及分析

2.2.1 IP通联网络生成

基于2.1节中获取的源IP地址和目的IP地址等IP数据包描述信息,可以生成某卫星的IP网络通联关系图,如图6所示。生成的IP通联网络十分繁杂,无法直接从通联图上获取相关信息。针对这一问题,利用社交网络分析中的社区划分算法对生成的IP网络进行处理。

社区划分是研究复杂社交网络结构与潜在信息的重要方法,经典算法主要包括GN算法[13]、Newman快速算法[14]以及派系过滤算法[15]等。其中,GN算法以及派系过滤算法时间复杂度高,无法适应数据规模较大的网络,而Newman算法则在计算精度方面有待提高[16]。为实现大规模网络中社区划分的高效与准确划分,近年来国内外学者对模块度进行优化并提出了大量的改进算法,实现了比经典方法更好的效果。因此,提出利用基于模块度的IP网络自动划分算法实现对卫星IP通联网络的分析与挖掘问题。

模块度函数Q是Newman和Girvan提出的一个衡量社区质量的评估函数,符合社区高内聚低耦合的结构特点,具有广泛的认可度,其含义是社区内节点的连边数与随机情况下的边数之差,取值范围是(0,1),定义如下:

(1)

(2)

式中,Aij为结点i,j之间的边权值;ki为结点i的邻接边的边权和;m为图中所有边的边权和;ci为结点i所在的社团编号。

图6 IP通联网络

2.2.2 基于模块度的IP网络自动划分

基于模块度的社区划分就是要找出各个节点的社区归属,并且让这个划分结构的模块度最大,基本步骤描述如下:

① 将图中的每个节点看成一个独立的社区,此时社区的数目与节点个数相同;

② 对每个节点i,依次尝试把节点i分配到其每个邻居节点所在的社区,计算分配前与分配后的模块度变化ΔQ,并记录ΔQ最大的那个邻居节点,如果maxΔQ>0,则把节点i分配ΔQ最大的那个邻居节点所在的社区,否则保持不变;

③ 重复步骤②,直到所有节点的所属社区不再变化;

④ 对图进行压缩,将所有在同一个社区的节点压缩成一个新节点,社区内节点之间的边的权重转化为新节点的环的权重,社区间的边权重转化为新节点间的边权重;

⑤ 重复步骤①~④,直到整个图的模块度不再发生变化。

基于模块度的社区划分结果如图7所示。从图7中可以看出,将同属于同一类社区的节点进行了划分,且在结果上标识了每个节点所属的社区类别。

图7 社区划分结果

2.2.3 基于度和集聚系数的节点重要性评价

在2.2.2节中,对2.2.1节中生成的繁杂IP网络进行了自动划分与聚类,使得相关人员更容易理解IP通联网络中蕴含的信息,但无法实现相关信息的自动化呈现。若可以实现网络中节点重要性的自动评价,则可以更加直观和深入地理解当前IP通联网络的信息。

目前,用于评估网络中节点重要性的评估指标有很多,具有代表性的主要包括度、集聚系数、介数、最小生成树指标和拉普拉斯中心性指标等[17]。为实现对卫星IP通联网络中重要节点的快速准确评价。其中,度能够反映节点的邻居个数,但不能反映节点邻居之间的紧密程度;而集聚系数正相反,集聚系数能反映节点邻居之间的紧密程度,但不能反映节点的邻居个数。因此,综合利用度和集聚系数2种评价指标,提出一种基于度和集聚系数的节点重要性评价方法,可以自动对IP网络中节点的重要性进行评价。

假设存在无向网络G=(V,E),其中V=(v1,v2,…,vn)是网络的顶点集,E=(e1,e2,…,em)为网络边的集合,节点的度可以表示为:

ki=∑j∈Vδij,

(3)

式中,δij=1表示节点i与节点j之间直接相连;δij=0表示节点i和节点j没有直接相连。

节点的聚集系数是指某个节点的任意2个邻居节点之间连接的总边数与其所有邻居节点之间所有可能具有的最大连边数之比,是衡量网络传递性的一个度量指标。节点i的集聚系数可以定义为:

(4)

式中,节点i的度为ki,即为i的邻居个数,k个节点所有可能的连边的总数为ki(ki-1)/2;Ei为这些节点之间实际具有的边数。

评价指标可以表示为:

pi=g(ki)+g(ci),

(5)

式中,

(6)

(7)

基于度和集聚系数的节点重要性评价结果如图8所示。基于该图,相关人员可以非常直观地获取该IP网络中的重要节点,以进行更加深入的分析。

图8 节点重要性评价结果

3 结束语

针对卫星通信侦察获取的IP数据,在解析报文协议的基础上将非结构化的数据包转化为结构化的特征参数,并基于提取的结构化特征参数构建了IP通联网络。

针对生成IP网络无法直观体现蕴含信息的问题,利用社交网络分析中的社区概念,提出了基于模块度的卫星IP通联网络自动划分算法,实现了IP网络节点的自动聚类。为进一步自动提取网络中的信息,提出了一种基于度和集聚系数的综合评价方法对卫星IP网络中节点的重要性进行了评价,对于识别网络中的重要节点具有重要意义。

本文利用社交网络分析及相关算法对卫星IP数据的外围特征参数进行了分析与信息挖掘,但并未结合内涵信息。如何通过协议分析获取其内涵信息,实现内涵信息与外围特征相结合的卫星IP数据分析与信息挖掘是后续的研究方向之一。

猜你喜欢
网络分析卫星通信数据包
基于交通运输业的股票因果网络分析
二维隐蔽时间信道构建的研究*
基于ISM模型的EPC项目风险网络分析
低轨卫星互联网融合5G信息网络分析与应用
2021年卫星通信产业发展综述
铱卫星通信业务发展分析及思考
低轨卫星通信系统频偏估计算法研究
民用飞机飞行模拟机数据包试飞任务优化结合方法研究
认知重评和表达抑制情绪调节策略的脑网络分析:来自EEG和ERP的证据*
C#串口高效可靠的接收方案设计