面向大规模校园WiFi 网络服务质量边缘监控技术

2023-11-27 08:18:46沈佳杰沈敏虎向望赵泽宇张凯
福州大学学报(自然科学版) 2023年5期
关键词:网络故障探针管控

沈佳杰,沈敏虎,向望,赵泽宇,张凯

(复旦大学校园信息化办公室,上海 200433)

0 引言

WiFi 网络被广泛应用于校园传输用户网络数据[1].通过分布式部署多个无线接入点,用户可以在无线信号覆盖范围内接入校园网络.由于WiFi 网络具有较为复杂的传输协议,实时监控网络运行状态,在网络发生故障时及时定位网络故障的位置,成为保障WiFi 网络正常运行的关键.校园WiFi 监控系统需要获取在线运行的网络设备性能,判断当前的网络运行状态[2].然而,随着WiFi 网络规模的扩大和其承载应用类型的增加,现有基于网络设备的监控方案难以满足网络运维人员对校园WiFi 网络的精细化管控需求.

在监控大规模校园WiFi 网络的过程中,网络运维人员需要及时了解网络运行的实时状态,并根据网络测试的需求定制测试样本,高效完成特定的网络测试任务.当网络发生故障时,网络监控方案需要快速定位网络故障发生的位置,帮助网络运维人员查明网络故障发生的原因.构建面向大规模校园WiFi 网络的边缘监控方案将会面临以下挑战.1) 高效获取网络运行状态信息.为保障用户端设备能流畅地访问各项校园网络服务,网络监控系统需要实时根据大量网络探针设备返回的测试结果信息,分析WiFi 网络用户边缘侧的网络服务质量.2) 快速定位网络故障发生的位置.当网络发生故障时,网络监控方案需要及时定位WiFi 网络发生故障的区域,分析可能导致网络发生故障的网络设备,快速排查导致网络发生故障的原因.

为保障用户端设备访问校园WiFi 网络的服务质量,本研究提出面向大规模校园WiFi 网络的边缘监控方案.根据用户测试需求,使用容器技术将多个测试组件打包生成测试样本,并将其分发到位于WiFi网络各处的网络探针设备,收集这些网络探针的测试结果数据,监控网络运行的实时状态.当WiFi 网络发生故障时,将本方案与网络拓扑信息结合,以期高效定位网络发生故障的位置,确定导致网络故障的原因.本研究对WiFi 网络监控领域做出以下贡献.在此基础上,实现原型WiFi 网络边缘监控系统,在复旦大学WiFi 网络中分布式部署树莓派单片机,将其作为无线探针设备,实时监控校园WiFi 网络运行状态.

1 WiFi 网络监控和故障定位

1.1 WiFi 网络测试与故障定位问题

图1 为WiFi 网络监控系统的示意图.为保障网络运维人员能准确掌握WiFi 网络的运行状态,网络监控算法被广泛部署到校园网络.通过采集WiFi 网络设备的运行状态,WiFi 网络监控系统能向网络运维人员报告当前网络的运行状态.

图1 WiFi 网络监控系统示意图Fig.1 Paradigm of WiFi monitor systems

然而,传统WiFi 网络监控系统难以复现用户端设备出现的网络间歇性故障.此外,在分析校园各处网络设备性能的过程中,需要定期采集网络设备的运行状态,这将带来额外的通信开销,系统的WiFi 网络性能因此降低.

1.2 WiFi 网络监控系统的目标

为高效管控WiFi 网络,网络运维人员需要实时获取WiFi 网络的运行状况,及时解决网络故障问题.具体说来,WiFi 网络监控系统有以下目标.

1) 准确获取WiFi 网络实时运行状态.WiFi 网络监控系统需要采集分布于WiFi 网络各处的网络设备所返回的测试结果数据,帮助网络运维人员实时监控网络的运行状态,了解用户端设备访问WiFi 网络的服务质量.

2) 快速定位WiFi 网络故障发生位置.当WiFi 网络发生故障时,结合网络拓扑结构信息,WiFi 网络监控系统需要准确定位网络故障发生的具体位置,快速找到导致WiFi 网络故障的原因.

1.3 相关工作

WiFi 网络被广泛部署到校园网络,以完成各项智慧校园信息化服务.为实现智能化服务,WiFi 网络提供多种不同的校园网络服务,包括网络接入服务[1]、校园人员定位[3]、室内人员定位[4]、人员流动感知[5]、人员聚集感知[6]、交通客流统计[7]、人流分类管控[8]、智能人员考勤[9]和路段空间平均速度检测[10]等应用.在此基础上,位置指纹定位[11]等技术被引入到校园WiFi 网络中,用于改善在不同WiFi 网络应用场景下的用户服务质量.

为监控校园网络运行状态,采用多种监控方案来保障网络服务质量,包括网络主动感知[11]、流量特征分析[12]、虚拟接入网络构建[13].为保障WiFi 网络用户接入服务质量,基于WiFi 网络性能测试结果[14],大量研究工作致力于优化密集用户接入WiFi 网络环境下的园区网络服务质量[15].在充分采集校园网络流量数据的基础上,研究学者使用WiFi 网络日志数据来构建各种大数据校园信息化应用[16],包括学情分析、行为轨迹分析和离校预警等应用服务.

为提升WiFi 网络承载的多种在线应用服务质量,网络运维人员提出多种性能优化方案来保障网络传输性能,主要研究问题包括信道能量分配优化[17]、蜂窝网联合优化[18]、频谱资源调度[19]、网络服务质量预测[20]、协作频谱感知和发射功率优化[21]、移动边缘计算环境下WiFi 网络计算卸载优化[22]和WiFi 网络环境下人员定位技术[23].虽然已有大量研究工作优化无线WiFi 网络性能,在大规模WiFi 网络中依然存在网络连接失效[24]等网络故障问题.

为保障校园网络系统的稳定运行,本研究提出面向大规模校园WiFi 网络的边缘监控方案,从而实现从用户终端侧对网络运行状态的实时监控.通过收集部署在WiFi 网络各处网络探针返回的测试结果,网络监控方案能准确地获取用户端设备的网络服务质量信息,快速执行网络测试任务,定位网络故障发生的位置,分析网络故障发生的原因.

2 大规模校园WiFi 网络的边缘监控方案

2.1 基于容器的测试样本分发方案

图2 为WiFi 网络测试样本的生成和分发过程.为兼容不同类型的网络探针设备,使用容器技术生成测试样本,并将其分发至网络探针设备,以满足WiFi 网络的测试需求.当用户将测试需求发送到管控服务器,管控服务器会生成测试样本,并将其分发到网络探针执行测试程序.测试样本分发过程包括以下步骤.1) 根据用户提交的网络测试请求,管控服务器从测试组件库中选择测试组件生成测试样本,并将其缓存在本地存储空间;2) 根据网络测试需求对网络探针进行分组,将已生成测试样本分发到给定分组网络探针设备,完成WiFi 网络监控任务.

图2 WiFi 网络测试样本的生成和分发过程Fig.2 Process of generating and dispersing test samples of WiFi networks

2.2 WiFi 网络故障位置定位方案

当网络探针设备发现WiFi 网络故障时,本方案将定位WiFi 网络出现故障的位置.图3 为WiFi 网络故障定位过程.通过采集WiFi 网络覆盖范围内各个楼宇和区域的WiFi 网络性能,能在以下方面查找网络故障的原因.

图3 WiFi 网络故障定位过程Fig.3 Process of failure localization for the WiFi network

1) 收集部署在不同楼宇区域网络探针设备返回的测试结果数据,据此监控WiFi 网络的运行状态,当校园WiFi 网络发生故障时,及时定位网络故障发生的位置.

2) 结合网络拓扑信息,根据网络探针返回的故障信息,分析导致网络故障的原因,并将分析结果发送给网络运维人员.

2.3 原型WiFi 网络边缘监控系统设计

图4 为原型WiFi 网络边缘监控系统的软件架构.由于复旦大学各个校区WiFi 网络包括27 000 多个无线接入点,网络探针设备分别部署于复旦大学邯郸校区、江湾校区和张江校区,用于检测校园网络服务性能,分析WiFi 网络运行状态,定位网络故障原因.WiFi 网络边缘监控系统包括以下部分.

图4 原型WiFi 网络边缘监控系统的软件架构Fig.4 Software architecture of the edge monitor system for the WiFi network

1) 分发测试样本到网络探针设备.边缘监控系统接收来自网络运维人员发送的监控请求,生成测试样本,并将其传输到网络探针设备.

2) 实时监控WiFi 网络运行状态.收集网络探针返回的测试结果数据,并将这些结果记录到本地存储系统,以备网络运维人员查询.

3) 快速定位WiFi 网络故障.当WiFi 网络发生故障时,根据网络探针返回的测试数据,及时向网络运维人员反馈网络故障信息.

3 测试实验

3.1 实验环境和参数设置

实验使用1 台配备双10 Gbit·s-1网口(2×10 Gbit·s-1)管控服务器来负责测试样本分发操作,并使用部署在复旦大学各处的20 台树莓派3B+作为网络探针设备来执行网络测试任务.网络探针设备均通过千兆网口(1 Gbit·s-1)连接复旦大学各校区本地的校园接入网络.管控服务器使用Docker 平台作为容器镜像的生成工具.在镜像生成过程中,将特定数据量编制好的网络测试程序通过Dockerfile 配置文件,复制预先准备的测试样本镜像文件,并统计镜像文件生成所消耗的时间.为防止单次测试导致的误差,本研究独立执行10 次测试实验,以获取的平均值作为实验结果.

为验证本研究提出方案的有效性,将所提出的网络监控方案部署至复旦大学校园网络系统,监控WiFi 网络的运行状态,分析测试样本分发操作和网络故障定位操作的性能.

1) 测试样本分发过程中包含测试样本生成和传输两个阶段,因此,在测试样本大小和网络探针数量不同的情况下,分别测试边缘监控方案的样本生成和传输性能.

2) 在故障分析过程中,管控服务器需要向网络探针设备发送测试样本,接收网络探针返回的数据,结合网络拓扑结构,定位校园网络故障.在网络测试分析过程中,管控服务器需要向网络探针写入配置参数,读取网络测试结果数据.实验将测试网络探针数量不同的情况下,小数据量控制命令读写操作的性能.

实验专注于测试边缘网络系统各项操作所消耗的时间,以检验所提出的边缘测试方案的执行效率.这里设置默认测试样本大小为100 MB,管控服务器到无线探针设备的读写数据量为16 KB.测试实验主要统计以下两项性能参数.

1) 消耗时间.将特定操作所消耗的时间记为执行时间.这里主要统计测试分发过程中测试样本生成和传输消耗的时间,及在WiFi 监控过程中读写控制命令消耗的时间.

2) 吞吐率.在测试实验中将单位时间处理的数据量记为吞吐率.由于测试样本的分发过程涉及到多播操作,实验将统计数据分发过程和数据传输过程中的吞吐率定义为网络探针设备接收到的数据总量除以完成这些分发和传输操作所消耗的时间,将测试样本生成过程中的吞吐率定义为生成的测试样本数据量除以测试样本生成操作所消耗的时间.

3.2 测试性能结果分析

测试边缘监控系统分发测试样本的性能,包括生成测试样本和发送到网络探针的执行效率,结果如图5 所示.图5(a)为测试样本分发过程消耗的时间.随着测试样本数据量的增加,测试样本分发过程中各部分的时间也将增加.在实际网络测试过程中,网络监控系统需要根据网络测试需求,调整测试样本所包含测试组件的数据量,从而快速完成网络测试任务,满足WiFi 网络监控需求.图5(b)为测试样本分发过程的吞吐率.由于单台树莓派的网络带宽资源有限,测试样本分发操作的效率受制于网络探针设备的带宽资源.为满足网络测试需求,管控服务器可以根据测试需求将必要测试组件打包生成测试样本,保证网络监控过程中测试样本分发操作的执行效率.

图5 传输数据量对测试样本分发操作性能的影响Fig.5 Performance of dispersal process with different data volumes of test samples

在多个网络探针设备同时存在的情况下,测试管控服务器分发测试样本到网络探针设备的执行效率,结果如图6 所示.图6(a)为网络探针节点数量不同的情况下,测试样本分发过程消耗的时间.随着网络探针数量的增加,管控服务器需要向网络探针设备发送的数据量增加.因此,测试样本分发过程和测试样本传输过程需要消耗更多的时间.图6(b)为网络探针节点数量不同的情况下,测试样本分发过程的吞吐率.由于管控服务器通常有足够的网络带宽完成测试样本的分发操作,随着网络探针数量的增加,数据传输操作和数据分发操作的吞吐率将增加.通过并行化分发测试样本到网络探针设备,本方案可以使用部署在WiFi 网络边缘的多个网络探针设备完成测试工作,快速执行大规模WiFi 网络测试任务,从而满足预定的网络测试需求.

图6 网络探针节点数量对测试样本分发操作性能的影响Fig.6 Performance of dispersal process with different number of probes

3.3 网络探针设备的读写开销

由于在网络监控过程中,管控服务器需要修改网络探针设备的配置参数,并从网络探针设备接收测试结果数据,用于分析网络状态.在此过程中,管控服务器需要向网络探针设备发送小数据量控制命令读写请求.图7 为网络探针设备数量不同的情况下,管控服务器向网络探针设备发送小数据量控制命令读写操作的性能.图7(a)为小数据量控制命令读写操作消耗的时间.当前网络探针设备使用小型存储卡来保存用户数据.在数据写入的过程中,网络探针的本地存储系统需要分配存储空间来保存新的数据,通常会受到磁盘I/O 瓶颈的影响,造成较大的数据写入延时.图7(b)为小数据量控制命令读写操作的吞吐率.由于控制服务器有充足的网络带宽资源,可以满足多个网络探针的并行化数据读写操作.随着需要读写网络探针设备数量的增加,小数据量控制命令读写操作的吞吐率也随之增加.因此,本方案能支持多个网络探针设备并行化执行WiFi 网络测试操作,快速获取网络测试结果.

图7 网络探针设备数量对控制命令读写操作性能的影响Fig.7 I/O performance of control commands with different number of probes

综上所述,面向大规模校园WiFi 网络的边缘监控方案能快速生成测试样本,并发送到特定的网络探针设备,执行特定的网络测试任务.在此基础上,本方案能快速写入网络探针的运行参数和读取网络测试结果,从而定位WiFi 网络故障发生的位置,分析导致网络故障的原因.

4 结语

提出一种面向大规模WiFi 网络的边缘监控方案.通过在无线网络边缘侧部署无线探针设备,高效获取当前网络的运行状态.通过使用容器技术,有效兼容不同类型的网络探针设备.结合WiFi 网络拓扑结构信息,快速定位网络故障发生的位置.在复旦大学WiFi 网络中部署该边缘监控系统,结果表明,本方案能显著提高测试样本的分发效率,帮助网络运维人员快速找出导致WiFi 网络发生故障的原因,有效保障无线网络服务的稳定运行.

为更加全面地分析WiFi 网络的运行状态,未来计划通过管控大量网络探针,提升WiFi 网络测试效率,快速定位WiFi 网络故障.

猜你喜欢
网络故障探针管控
EyeCGas OGI在泄漏管控工作中的应用
多端联动、全时管控的高速路产保通管控平台
管控老年高血压要多管齐下
VxWorks网络存储池分析在网络故障排查中的应用
基于信息流的RBC系统外部通信网络故障分析
多通道Taqman-探针荧光定量PCR鉴定MRSA方法的建立
Wireshark协议解析在网络故障排查中的应用
BOPIM-dma作为BSA Site Ⅰ特异性探针的研究及其应用
失控还是管控?
军工文化(2015年10期)2015-05-14 07:03:14
透射电子显微镜中的扫描探针装置
物理实验(2015年9期)2015-02-28 17:36:47