摘 要:航空通信网络服务按需拓展、网络环境动态多变、网络对象异构多样与网络干扰强度和样式急剧增加,要求通信网络系统具备自动性和智能性。本文构建意图识别和态势感知联合驱动的路由策略系统,为指挥人员提供路由策略方案,提升决策的时效性和准确性,提高系统在复杂环境下的适应性。所述系统包含网络态势感知、用户意图识别和路由辅助决策等模块。网络态势感知模块通过分析航空通信网络拓扑结构,利用收发数据包,获取网络中链路时延、带宽、丢包率等网络服务质量指标;意图识别模块依据海量的航空通信数据,利用机器学习算法,实时对已经接入网络的航空单位依据其通信数据特征进行识别分类,给出其在通信网络中需要的服务质量指标权重;辅助决策模块以提供最方便快捷的航空通信网络服务为目的,利用前两个模块所提供的实时数据,使用强化学习算法为端到端的网络通信提供最佳路由,保障信息高效无失真地传输。
关键词:意图识别; 态势感知; 辅助决策; 强化学习
中图分类号:E96 文献标识码:A DOI:10.19452/j.issn1007-5453.2024.08.011
基金项目: 航空科学基金(2018ZG81002)
高效的航空通信网络系统既要精准识别用户的行动意图,又要实时感知网络态势情况,能够迅速对路由策略调整,以保障信息传输的时效性。孙鹏飞等[1]提出零样本学习能力,能够快速应对场景中未知情况下的策略选择。Niem?ller等[2]将用户的高级意图转化为可执行的网络策略和配置,使网络自动化管理成为可能。本文所提出的路由策略系统,通过结合意图识别与态势感知来驱动路由策略的制定,从而生成更为完善和全面的决策方案。
在实际网络环境中,态势感知[3]被定义为对环境中实体的认知、对其含义的理解以及对其未来状态的预测。Endsley[4]在1995年将动态系统中的态势感知模型分为三个层面:感知层、理解层和预测层。在航空领域中,张耕强等[5]将软件定义网络(SDN)技术应用在移动自组织网络中,通过SDN控制器感知网络状态为网络中可能发生的拥塞/中断预先采取预防措施。Anicho等[6]在无人机网络中利用态势感知影响路由决策从而提高网络资源的利用率。在航空数据链方面,Link16[7]能够交换安全、抗干扰的通信,包括实时态势感知数据以及命令和控制信息,有利于共享数字语音、数据、文本信息等。基于模糊层次分析法的Link16[8],利用态势质量评估模型,通过对近距离空中支援典型场景的模拟,验证了该方法的简单性和有效性。通过上述分析,网络态势感知对航空通信网络的安全性提供了保障。基于此,本文利用收发数据包以感知获取网络中链路时延、带宽、丢包率等网络服务质量(QoS)指标,为安全高效的决策提供依据。
意图识别是场景态势的综合分析和场上情报信息的特征抽取,推断出用户可能采取的下一步行动。Lee等[9]提出利用深度学习和人工智能技术实现敌我识别、威胁评估等,以支持快速而准确的决策。王伟刚[10]从收集到的环境信息中进行知识推理,让指挥员了解网络态势,再通过多种因素的筛选得到可实施的最优方案。周扬等[11]从环境、任务状态等多方面的态势感知,设计分布式智能保障系统,利用智能化技术使系统具备学习、自动推理、辅助决策等能力,提升航空装备的运维效率、可靠性和安全性。基于以上分析,本文通过使用强化学习算法为端到端的网络通信提供最佳路由,保障信息高效无失真地传输。
本文从以下三个方面展开研究:(1)设计融合用户意图识别、态势感知和路由辅助决策的航空网络系统架构;(2)设计基于深度学习的意图识别模型;(3)研究基于强化学习的路由策略生成方法,快速形成备选决策方案。
1 系统架构设计
本文介绍了一种新颖的航空网络系统架构,包括意图识别、态势感知和路由辅助决策模块。该架构利用SDN控制器,增强了网络灵活性、可编程性和集中控制,如图1所示。意图识别模块对接入用户的通信数据包进行解析分类,不同接入用户对通信网络的服务质量有不同的要求,以辅助决策模块中策略的制定,驱动网络服务适应不断变化的需求。路由辅助决策模块根据不同用户的需求以及感知的网络状态信息,制定出符合用户意图的可执行的策略,进而通过流表处理模块下发到物理网络进行具体实施。态势感知模块监控并收集网络上每个节点的资源使用情况以及网络拓扑变化等信息,并将感知到的信息传输给意图识别模块和路由辅助决策模块,以确保系统中各模块实时了解网络状态。
2 应用场景及态势感知方法
2.1 应用场景
本文聚焦于航空通信网络中,多型号和多部队的联合协作应用场景。在此网络中,地面支持设施(如地勤人员)被抽象为固定节点;具有通信枢纽功能的空中指挥机和预警机等被视为机动节点;而执行具体任务的歼击机、强击机等航空单位则被划分为终端节点。网络的拓扑结构被简化为如图2所示,其中,骨干链路具有较高的带宽,优于支线链路。在时延设定上,为简化仿真过程,终端与机动节点间的链路时延不予考虑,而其他链路的时延则设定在0.5~8ms之间的随机值。
2.2 网络态势感知模块
网络态势感知模块旨在通过SDN控制器处理上传报文以进行测量和网络中相应参数的计算,并将参数传递给网络意图识别模块和路由辅助决策模块,以支持更加精准和高效的网络管理与决策制定。态势感知模块主要采用Ryu控制器测量链路带宽、链路时延、丢包率等参数。
(1)链路带宽获取
在Ryu控制器中,通过发送OFPT_STATS_REQUEST和OFPT_FEATURES_REQUEST请求统计信息,可以分别获取交换机端口的流量统计和端口特征(如带宽和工作方式),并记录特定时间t1到t2的间隔的总字节数变化,其中,b1为t1时刻的总字节数,b2为t2时刻的总字节数,当前时刻的流量带宽记为Bt,其计算公式为
3 基于深度学习的意图识别
在航空通信网络场景下,意图的精准识别对策略制定是至关重要的,是影响获胜的关键因素。意图识别模块主要是对接入用户的身份识别。具体来说,意图识别模块通过解析接入用户的通信数据包参数进行解析分类。不同接入用户对通信网络有不同的要求。面对多层次意图的识别,通过场景态势特征识别出敌方意图,形成局部敌方意图概念集合,再对概念集合进行分析抽象,完成对敌意图精准识别。该模块实现流程如图3所示。设计采用离线和在线相结合的方式来完成意图的准确剖析。离线数据训练可充分结合历史数据信息做出准确的识别,在线数据训练能更实时地反映当前情况。
3.1 规则定义
网络用户根据其QoS需求被划分为三个主要类别:WWW、FTP-DATA和MAIL。具体而言,WWW类别的用户主要关注于实现低延迟,以优化远程控制和交互式页面加载的体验;FTP-DATA类别的用户则注重获得高带宽,以支持大量数据的快速传输;而MAIL类别的用户对于时延和带宽都有一定的要求,这对于视频会议和直播等应用尤为重要。此外,用户角色通过{IP,级别,类型}的组合进行定义,支持基于(级别,类型)的查询以确定角色值。在代理训练的强化学习过程中,延迟、带宽和丢包率的权重参数被用作相应的奖励权重,以指导学习过程。
3.2 访问控制
该模型以用户类S(发送用户)、用户类D(接收用户)以及任务为输入,并让角色集、权限集和任务集以数据库形式录入处理单元进行处理。在此模型中,角色集与任务集和用户类相关联,且最终的QoS需求与任务相关。用户以IP地址输入,匹配其对应的角色种类和等级,从而确定角色值。利用用户S和用户D的角色值,在权限表中确定权限,进而在任务集中获取相应的任务列表。任务列表包括可执行和不可执行任务,其中可执行任务可以匹配相应的QoS指标,而不可执行任务则无法获得该指标。
3.3 特征提取
本模块中,采用监督学习算法利用网络流量数据集对访问用户身份进行分类。特征选择遵循特定原则,以提高准确性并降低训练复杂性。该原则包括选择与用户行为高度相关的特征,确保SDN网络内特征测量的简便性以及优先考虑从数据流初始阶段提取的特征,避免依赖于全流程观察851043ebc5d4d267103f6897996e5af6ceb83ec75e0daacf7532913da9cbed45。特征选择在粗粒度和细粒度两个层面上进行。粗粒度选择通过互熵和信息增益的比值来确定特征重要性系数;细粒度选择基于重要性阈值和互信息阈值的特征子集中进行降维和冗余减少。
3.4 分类识别
该部分采用Tri-training算法对接入用户5e0bd0a90252df7046be6b2964b45eed59b4a3adb03fdb73a81056a2ff31bc2b进行分类。Tri-training是对Co-training算法的改进,使用三种不同的基分类器:决策树、随机森林和朴素贝叶斯。这些算法在网络流量分类中表现出较高的准确率。训练数据集包含少量有标记的样本和大量无标记样本。算法通过这些数据学习生成分类模型。在协同训练阶段,通过基于分类器的测试误差比较来评估未标记样本的标记置信度。预测阶段,通过集成所有成员分类器的决策来进行用户类别的输出。
4 基于强化学习的路由策略生成
采用强化学习设计路由策略生成。该部分利用数据分析快速生成替代决策解决方案,增强人员的策略响应能力。采用Dyna-Q算法[12],该算法在强化学习领域将学习与规划的过程巧妙结合。通过利用现实世界的经验与模拟获得的经验,使用Q-Learning来更新相同的价值函数,从而实现对动作选择策略和动作价值估计的系统性改进。航空通信网络中,通过强化学习寻找最佳路由时,综合考虑延迟、带宽和丢包率等QoS指标对于准确的信息传输至关重要。
5 仿真与性能分析
5.1 网络态势感知仿真实现
仿真实现中,使用Mininet网络仿真工具进行网络拓扑的搭建,为每一个交换机添加一个主机,使得拓扑可以模拟用户从任何一个节点接入,并与任意一个节点进行通信。网络控制器采用Ryu控制器,通过与Mininet连接实现网络拓扑可视化;并借助Ryu模块化开发特性,实现对上文提到的网络拓扑、时延、丢包率和带宽等参数的测量。基于Ryu模块化的开发,使用Ryu-manager命令启动network_ awareness.py、network_delay_detector.py、network_monitor.py三个Ryu APP,分别获取拓扑图的连接情况、发送数据包的时延、收发速率、带宽等信息。由于使用单台计算机进行仿真,因此只测量带宽和时延,丢包率暂时不考虑。
5.2 QoS意图识别模块仿真实现
本部分旨在根据目标和源报文特征分析网络流类型,提供计算奖励函数的参数。输入用户为拓扑图1号节点,向14号节点发送若干数据包,同时采用Wireshark软件进行抓包分析。所得特征值见表1。将特征值送入分类器中,得到识别结果为WWW类别,得到最终的权重参数见表2。
5.3 路由辅助模块仿真实现
该部分强化学习被用于在特定网络拓扑环境下寻找最佳路由。采用了Q-learning和Dyna-Q-learning两种强化学习方法进行仿真,目的是从1号节点到14号节点传输/执行。设置带宽和时延的权重各为0.5,学习率为0.1,折扣率为0.1,以及最大迭代次数为100。通过不断迭代,系统逐渐找到最优路径并保存在路径列表中。在SDN环境下,通过编写Ryu控制器脚本,实现了将强化学习与流表下发结合,从而在静态拓扑网络中选择基于时延和带宽的最佳路由。通过在Mininet上运行自建拓扑并采用ping工具发包,实现在Ryu终端观察到最佳路由。
5.4 仿真性能分析
(1)流量提取算法的选取
在选择流量分类算法的过程中,常用的数据集是来自剑桥大学的Moore数据集,由249个流量统计特征组成。本文选择数据覆盖率较好的Data01数据集。它结合并选择性地采样流量统计特征来构建Moore测试数据集。该数据集通过包含ATTACK、P2P、DATABASE、MULTIMEDIA和SERVICE类别的所有样本以及从较大的WWW、MAIL、FTP类别中随机抽样来确保相对平衡。使用WEKA平台中的各种算法进行特征选择,然后使用C4.5决策树方法进行建模和分类。WEKA是一款开源数据挖掘软件,提供各种数据分析和建模工具。我们对比分析了6种方案,得到了不同方法下的建模时间和准确率,见表3,CFS表示一种特征选择方法;BF是一种搜索策略;IGA是交互式遗传算法;GRA和RANKER均是特征选择方法。
由表3分析可以看出,经过特征选择后各方案的整体准确率较原始数据集都有大幅度提高,且建模时间大大减少。其中采用IGA+RANKER方案所选取的特征子集的整体准确率最高,采用IGA+RANKER+CFS+BF方案所选取的特征子集的建模时间最少。IGA+RANKER方案比IGA+ RANKER+CFS+BF慢0.02s,准确率增加了2.0901%。
(2)辅助决策模块算法性能分析
为了比较所采用的强化学习方法与传统路由算法的优缺点,本节试验中选取经典的Yen’s算法,该算法属于非强化学习方法,作为对比算法用强化学习方法与非强化学习方法在算法时延性能方面进行对比分析。选取10组源节点和目的节点,分别运用强化学习算法和Yen’s算法寻找最佳路由,得到结果如图4所示。其中x轴代表10组试验序号,y轴为路径端到端总时延。
图4分析结果表示,强化学习算法得到的端到端时延在多数情况下明显小于运用Yen’s算法所得到的端到端时延,因此强化学习的性能明显优于Yen’s算法。
6 结束语
本文在航空通信网络场景下,设计融合用户意图识别、网络态势感知和路由辅助决策三个模块的航空通信网络架构。通过态势感知获取网络中带宽、时延和丢包率数据;进而引入深度学习采用离线和在线相结合的方法实现用户分类识别;通过强化学习计算出最优路由辅助策略,辅助增强指挥人员的决策能力。最后,仿真试验验证了引入智能方法给网络带来的性能增益,论证了本文所提出的航空通信网络架构的可行性和有效性。
参考文献
[1]孙鹏飞, 欧阳亚文, 戴新宇, 等. 基于隐式网络和显式网络相似性学习的零样本意图识别[J].中国科学: 信息科学, 2021, 51(11): 1853-1866. Sun Pengfei, OuYang Yawen, Dai Xinyu, et al. Similarity learning with implicit-network and explicit-network for zeroshot intent detection[J]. Scientia Sinica Informationis, 2021, 51(11):1853-1866. (in Chinese)
[2]Niem?ller J, Mokrushin L, Mohalik S K, et al. Cognitive processes for adaptive intent-based networking[J]. Ericsson Technology Review, 2020, 2020(11): 2-11.
[3]Munir A, Aved A, Blasch E. Situational awareness: techniques, challenges, and prospects[J]. AI, 2022, 3(1): 55-77.
[4]Endsley M R. Toward a theory of situation awareness in dynamic systems[J]. Human factors, 1995, 37(1): 32-64.
[5]张耕强, 谢钧, 杨章林. SDN在战术MANET路由中的应用[J].计算机系统应用, 2022, 31(4): 309-321. Zhang Gengqiang, Xie Jun, Yang Zhanglin. Application of SDN in tactical MANET routing[J]. Computer Systems & Applications, 2022, 31(4):309-321. (in Chinese)
[6]Anicho O, Charlesworth P B, Baicher G S, et al. Situation awareness and routing challenges in unmanned HAPS/UAV based communications networks[C].2020 International Confer‐ence on Unmanned Aircraft Systems (ICUAS). IEEE, 2020: 1175-1182.
[7]宁晓燕, 王影, 孙志国, 等. 多音干扰下Nakagami-m信道传输 Link16数据链的性能分析[J]. 系统工程与电子技术, 2023, 45(2): 566-571. Ning Xiaoyan, Wang Ying, Sun Zhiguo, et al. Performance analysis of Nakagami-m channel transmission Link16 under multi-tone interference[J]. Systems Engineering and Electron‐ics, 2023, 45(2):566-571. (in Chinese)
[8]Chen L, Wang S, Zhao L. Confidence-based fuzzy assessment model of LINK16 situational quality[C]. International Conference on Computer Application and Information Security(ICCAIS 2022). SPIE, 2023.
[9]Lee C E, Baek J, Son J, et al. Deep AI military staff: Cooperative battlefield situation awareness for commander’s decision making[J]. The Journal of Supercomputing, 2023, 79(6): 6040-6069.
[10]王伟钢. 战场决策过程中辅助决策功能分析[J]. 航空科学技术, 2017, 28(6):4-8. Wang Weigang. Function analysis for decision aid during the process of battlefield decision[J]. Aeronautical Science & Technology, 2017, 28(6):4-8. (in Chinese)
[11]周扬, 曾照洋, 周岩, 等. 航空装备智能保障系统研究[J].航空科学技术, 2020, 31(12):68-73. Zhou Yang, Zeng Zhaoyang, Zhou Yan, et al. Research on intel‐ligent support system of aviation equipment[J]. Aeronautical Science & Technology, 2020, 31(12):68-73. (in Chinese)
[12]李芃. SDN网络中基于机器学习的网络资源分配研究[D]. 南京:东南大学, 2018. Li Peng. Research on network resource allocation based on machine learning in software define network[D]. Nanjing: Southeast University, 2018. (in Chinese)
Intent Recognition and Situation Awareness Driven Routing Decision System
Huang Jiaorui1,Zhou Shan2, Yang Chungang1, Mi Xinru1
1. Xidian University, Xi’an 710071, China
2. People’s Liberation Army 93658, Beijing 102300, China
Abstract: Aerospace communication network service on-demand expansion, dynamic and changeable network environment, heterogeneous and diverse network objects and sharp increase in network interference intensity and style require communication command decision-making system with automaticity and intelligence. This paper constructs an intent recognition and situation awareness jointly driven routing strategy system to provide solutions for commanders, enhance the timeliness and accuracy of decision-making, and improve the adaptability of the system in complex environments. This system contains modules of network situation awareness, user intent recognition and routing assisted decision-making. The network situation awareness module analyzes the topology of the aerospace communication network, and uses sending and receiving packets to obtain network service quality indicators such as link delay, bandwidth, packet loss rate, etc.; the intent recognition module, based on the huge amount of aerospace communication data, utilizes machine learning algorithms to identify and classify aerospace units that have already accessed the network in real time based on the characteristics of their communication data, and gives the weights of the service of quality indicators that are needed for their communication network; the assisted decision-making module provides the most convenient and fastest aerospace communication network services for the purpose of utilizing the real-time data provided by the first two modules, using reinforcement learning algorithms to achieve optimal routing for end-to-end network communication, and guaranteeing efficient and no-distortion transmission of information.
Key Words: intent recognition; situation awareness; assisted decision-making; reinforcement learning