电磁目标体系网络潜在关系预测分析*

2022-05-24 03:39李高云旷生玉
航天电子对抗 2022年2期
关键词:链路电磁节点

李高云,旷生玉,江 果,何 欢

(中国电子科技集团公司第二十九研究所,四川 成都 610036)

0 引言

电磁空间作战是体系与体系之间的对抗。通常复杂体系网络具有涌现性,即便精准地实现了对单个目标对象的掌握,也难以保证准确表征组合后体系目标的能力情况,因此,需要将电磁目标体系作为一个整体对象展开研究。而网络是表征复杂体系的有效手段之一,以图论相关理论为基础建立起来的复杂网络科学成为研究电磁目标体系网络的有效工具。

电磁空间域的博弈,普遍具有攻防快速转换、对抗激烈和真假迷惑等特点,拨开战场电磁迷雾,达成对敌电磁目标体系的深入洞悉是一件异常棘手和重要的任务。在现实中由于侦察探测的局限性,存在部分关系链接错误或者冗余,以及部分实际存在的潜在链接关系没能探测到的情况。因而对电磁目标体系网络潜在关系预测,进而指导电子对抗专项侦察行动,就显得异常的迫切。

体系网络潜在关系分析是链路预测的重要研究方向,即通过已知的网络节点以及网络结构等信息,预测网络中尚未产生连边的2 个节点之间产生链接的可能性,近年来该方向异常活跃。鲁磊等采用疾病-基因关联二分网络的网络拓扑相似性来发现更多潜在致病基因;张新猛等基于链路预测方法解决因微博用户弱关系结构导致的难以发现潜在朋友的问题;刘竟等采用Katz 指标和Cosine 距离计算网络中的路径相似性和学者科研兴趣相似性,预测了潜在科研合作关系;袁国廷等基于网络局部信息的相似性指标实现对联盟院校潜在关系的预测与识别。前述典型研究成果及思路为电磁目标体系网络潜在关系预测研究提供了很好的借鉴。

本文拟以资料情报和海量侦察数据为基础,通过军事事件和对应涉及的目标个体建立起二分网络模型,进而分解为目标对象间的单模网络,采取链路预测算法,对电磁目标体系网络未知潜在关系进行分析。旨在为体系网络分析,提供技术参考和运用模式借鉴。

1 事件-目标关系二分网络构建

军事活动往往是由一系列的军事事件所组成,战场数据是以事件的形式传递。军事演习演练、任务行动,某种意义上是对战术、战法或新型作战概念的实兵验证和体现。因此,分析外军的演习演练和军事行动中的复杂体系运用,具备发现深层次体系运用模式和预测体系节点间新关系的可能,也即对事件-目标网络关系分析,具有实际可行性和军事应用研究价值。

军事事件与目标之间的关系,如同文献与作者之间的关系,所组成的网络包含了事件和目标2 类顶点集合,属于二分网络。事件-目标关系二分网络构建,是开展后续电磁目标体系网络挖掘分析的基础。目前,其构建方法大致可以分为文本资料情报提取和侦察大数据挖掘2 大类。

1.1 基于知识模板的事件-目标关系提取

事件抽取是从描述事件信息的非结构化自由文本中抽取出用户感兴趣的信息,并以结构化的形式存储或呈现给用户。

围绕规范化事件提取和事件-目标关系二分网络构建需求,事件描述的结构化模型可抽象为一个四元组结构模型,数学描述为:

式中,e为事件名称;T为事件涉及的目标名称集,R为事件-目标的关系集,M为目标-目标之间的相互关系集(如指挥协同关系、通信联通关系、信息流转关系等),L为本事件关联的其他事件集合。对于一个抽取成功的事件至少e≠∅且T≠∅。

基于触发词集(如演习演练、南海闯岛、自由航行、穿越台海等),通过手动建立一系列事件知识模板,采取各类模式匹配算法,将待抽取的资料文本(如战场要报、专题资料、公开报道等)与知识模板进行事件要素模式匹配,抽取生成事件e。基于模式匹配的事件提取流程,如图1 所示。

图1 基于模式匹配的事件提取流程

在资料文本预处理环节,采用触发词集作为敏感词进行文本实体提取,进而针对性提取前件、后件概念本体,完成候选模式的生成,支撑后续模式匹配运算,将事件要素识别转化为分类问题,最终完成事件集的生成。

1.2 基于大数据的目标配合关系提取

长期积累的海量原始电子对抗侦察结论数据,最为客观地记录和反映了电磁目标体系内,各个目标的时、空、频活动行为和相互关系证据。采取电磁大数据挖掘分析技术,可针对已知事件场景(满足事件约束条件),从海量数据中挖掘存在目标间相互配合关系的证据,辅助构建事件-目标、目标-目标关系网络。

针对未知事件-目标关系情况,也即“事件-目标”的潜在关系提取,站在数据视角可转换为从海量数据中筛选一定范围内(事件发生的特定时间、特定区域、特定目标集等)数据,展开多目标数据潜在关系挖掘问题。

基于Hadoop+Spark 平台,采用时、空联合频繁项挖掘算法,航迹重合度计算算法,定期对增量数据开展时-空伴随关联等例行化多目标关系挖掘分析,对存在疑似强关联关系的目标组,进行时、空、频结论存储,并对多目标关系可视化展示,供情报专家研判和确认。多目标时空频疑似配合关系结论可视化,如图2所示。

图2 多目标时空频疑似配合关系结论可视化

1.3 非完全二分网络构建

根据前述基于知识模板或者大数据挖掘技术提取的事件-目标关系结论,即事件-目标RDF 关系元组,生成事件-目标关系非完全二分网络,如图3 所示。尽可能构建反映真实链接情况的网络,对保证后续预测分析的精准性至关重要。

图3 事件-目标关系非完全二分网络

具体方法是梳理军事事件,作为事件集的元素,并将事件元素相应涉及的目标纳入目标集,构建该事件元素及其涉及的目标的关联关系。最终形成事件集与目标集之间的二分关系网络。

构建二分网络时需要注意约束条件的选择,如是否同属于相同国别、剔除民用属性非军事目标等,以及可根据研究侧重点,改变或增加相应约束条件。

2 单模目标网络投影生成

通常在分析具有二分图结构的网络时,一般采取先将二分图投影为单模网络,再做网络分析处理的方式。事件-目标二分网络,按照参与了共同军事事件的目标,判定具有配合联系的原则,投影生成电磁目标体系的单模网络。即将事件-目标二分图先投影到目标或者事件集合中的顶点构成的单模图(UG)。

投影规则为:如果原来二分图中,目标集合中2 个或多个顶点都与事件集合中某个顶点相连,那么在目标单分图中这2 个或多个顶点之间建立连边;同样事件单分图的投影规则亦是如此。事件-目标二分图投影分解如图4 所示。

图4 事件-目标二分图投影分解

基于上述单模网络的投影生成方法,可以得到所关注体系目标网络拓扑结构的无权无向无环图。

3 电磁目标体系网络关系预测算法

3.1 链路预测算法

雷达、通信、导航、敌我识别等电磁目标作用距离远,电磁传播速度快,天然具备广域范围内组网体系化运用特征,尤其是网络中心战概念运用,电磁高维空间的目标运用关系(指挥控制关系、通信联通关系、信息流转关系等)叠加于战场三维物理空间,融合成为一张复杂的电磁目标体系网络。

鉴于战场情报对节点属性信息获取的困难性(敌我博弈、真假迷惑,往往导致节点的属性信息并不容易获取),设计基于电磁目标体系网络拓扑结构的相似性预测算法(共同邻居相似预测算法、共同邻居占比量相似预测算法)和资源分配评分预测算法,开展电磁目标体系网络潜在链路关系预测。

不妨假设目标-目标单模网络中的节点为,定义节点的邻居为(),则()=|()|为节点的度。

1)共同邻居相似预测算法

古语云“物以类聚、人以群分”,共同邻居(CN)相似预测算法认为节点之间的结构属性越相似就越有可能产生联系。其中基于局部信息的相似性指标(CN)也就是2 个节点如果有更多的共同邻居,则它们更趋向于产生联系。

CN 相似性预测指标,如式(2)所示:

2)雅卡尔相似预测算法

雅卡尔(Jaccard)相似预测算法,主要考虑2 个节点的共同邻居数与2 个节点所拥有的邻居数总和的占比值,该值也将会影响节点之间的相似程度。因此,在共同邻居(CN)算法的基础上,考虑两端节点自身的邻居数(节点度)的影响,形成了Jaccard 相似预测指标。

Jaccard 相似性预测指标,如式(3)所示:

3)资源分配评分预测算法

资源分配(RA)评分预测算法,考虑2 个节点产生连边,即交互联系意味着需要耗费能量。邻居越多自然平均分配到单个邻居上的耗费资源就会越少,基于该假设构建(RA)评分预测算法,根据共同邻居节点的度为每个节点赋予一个权重值,且该权重值为该节点度的倒数。

RA 评分预测指标,如式(4)所示:

3.2 AUC 评价指标

预测精度评价指标(AUC)从全局衡量链路预测算法的精确度。即测试集中的存在边的预测分数值比随机选择的一条不存在边的分数值高的概率。每次从测试集中选择一条存在边与随机选择的不存在边进行比较,如果测试集中存在边的预测分数值大于不存在边的分数值,就加1 分;如果相等就加0.5 分,否则不加分。独立地比较次,则AUC 为:

式中,为测试集中的存在边分数值大于不存在边的分数值的次数,为两者分数值相等的次数。

可见,如果所有的分数值都是随机产生的(好比抛硬币正反决定是否产生链路连接),那AUC=0.5;因此只要AUC >0.5 就说明算法比随机方法好,而AUC 值的大小程度衡量了预测算法在多大程度上比随机选择的方法精确。

假设一个包含5 个顶点和7 条连边的网络,称该7 条边为已存在边,而(1,2)、(1,4)和(3,4)就称为 3 条不存在边。

不妨把已存在边中的(1,3)和(4,5)这2 条边作为测试集,而把其他5 条已存在边作为训练集。假设一个链路预测算法为训练集之外的其他所有可能的5 条连边的打分如下:=0.4,=0.5,=0.6,=0.5,=0.6。网络训练和测试集设置示意图如图5所示。

图5 网络训练和测试集设置示意图

为了计算AUC,先比较2 条测试边的分数与3 条不存在边的分数。6 种比较情况如下:

从而求得:

4 应用实践

4.1 仿真场景

采用大量的文本资料情报素材和大量原始电子对抗侦察结论数据,提取各次事件涉及的目标,挖掘数据中隐含的多目标关系,构建事件-目标二分网络,经投影生成目标单模关系网络。提取生成某电磁目标体系的关系网络,具体涉及了89 个节点127 条边,若该体系为全连接网络则关系边总和应为3 916条边。

为可视化展示该电磁目标体系网络的特点,采用Pajek 分析工具可视化功能,直观描绘网络拓扑关系,如图6 所示。

图6 某电磁目标体系网络拓扑关系图

采取本文前述的3 种链路预测方法,将一部分真实链接(存在边)作为训练集,其他隐掉的真实链接和不存在边合在一起作为测试样本集。

为了仿真验证预测算法的性能,以及具备预测能力的条件边界。分别对不同场景(不同比例占比数量的存在边作为训练集),基于Matlab2012 采用蒙特卡洛模拟仿真方法,仿真10 000 次,并统计预测结果,分析不同方法的预测精度。

4.2 仿真结论

分别取90%、80%、70%的真实链接作为训练集进行测试,采取蒙特卡洛模拟仿真各10 000 次,其中受限于篇幅,各场景仿真结果前10 次的记录原始数据,如表1 所示。

表1 预测结果原始数据记录表(各场景前10 次记录)

3 种不同方法预测10 000 次原始数据的统计数据情况,包括预测结果数据的平均值、最大值、最小值和均方值等参数,如表2 所示。

表2 预测结果统计结论表

从上述统计信息可见,3 种场景下,CN 和 RA 预测算法,预测精度平均值均大于80%,最小值也超过58%(大于随机概率50%),具有预测效果和应用价值,而Jaccard 预测算法,预测精度低于随机概率,预测效果完全无效。

链路预测准确率,与训练集(存在边)的占比大小基本呈现出正相关关系。也即训练数据越多(对网络的真实链接掌握越多),预测准确率越高。

此外,训练集进一步降低测试具备预测能力的条件边界,当测试集占比降为58% 时,前述3 类算法预测精度瞬间降为不足10%,也即预测能力几乎消失。当训练集超过65%,CN 和RA 算法预测精度的最低值均超出随机选择概率(50%准确率),也即具备了链路预测能力,这也证实了复杂网络的涌现性。

基于目标共同邻居数量的相似预测和基于资源分配评分指标预测精度较高,最大值曾达到了95%,而Jaccard 预测算法几乎无效。反向可以揭示和说明,该类型电磁目标体系网络明显存在“大度优先”“马太效应”“HUB 超级节点”的网络结构生长与演化特征,在作战中对大度节点(如图6 中的节点38、40、51等)攻击或摧毁,将达到体系破击的效果。

5 结束语

复杂网络分析作为一门新兴学科,是对复杂系统的抽象和描述。链路预测的准确性,本质是反映了我们对该复杂网络结构生长和演化机理的洞察程度。换言之若能够高精度地预测某复杂网络体系的链路生长或消失,则意味着已深入洞悉了该网络的内在机理,基于此,所开展的系列电磁目标体系网络潜在关系预测,也将更具置信度。本文只是抛砖引玉,链路预测不光需要IT 算法工程师,更需要具有资深业务专家的介入,只有深入地洞悉了网络内在本质,才可能拨开战场迷雾,预测未来。后续该方法还可应用于知识图谱构建,可根据图谱中已存在的实体间的网络拓扑关系,去预测缺失的实事关系,辅助解决知识图谱不完整性的问题。

猜你喜欢
链路电磁节点
一种移动感知的混合FSO/RF 下行链路方案*
军用电磁屏蔽方舱的电磁屏蔽效能测试研究
基于移动汇聚节点和分簇的改进节能路由算法
电磁频谱战在悄然无息中激烈展开
CAE软件操作小百科(48)
基于点权的混合K-shell关键节点识别方法
一种IS?IS网络中的链路异常检测方法、系统、装置、芯片
基于热备份提升微波站点传输稳定性
浅谈基于P2P的网络教学系统节点信息收集算法