大型IP 网络时延的主成分分析

2021-05-17 08:00韦烜黄晓莹
电信科学 2021年4期
关键词:贡献率时延平面

韦烜,黄晓莹

(中国电信股份有限公司研究院,广东 广州 510630)

1 引言

随着各类新型业务和应用的不断涌现,通信网络向全业务、全IP 化演进成为大势所趋,身负承载重任的IP 网络面临着巨大挑战,其承载性能的好坏直接影响业务开展,并最终决定网络的核心竞争力。网络时延是衡量网络通信性能优劣的关键指标之一,对实时性要求敏感的交互式音/视频流业务对IP 网络的时延性能与服务质量提出了更高的要求。在此背景下,IP 网络的时延性能评测和优化迫在眉睫,如何科学合理地评估现有网络的性能指标,并以此为基础对现有网络进行优化改造、建设更优质的新网络以满足上层业务的需要、提高用户体验,成为网络规划建设工作中需要重点考虑的问题。

目前,针对IP 网络时延的研究主要集中于时延的原因分析、时延的测量方法、时延对业务的影响、通信技术层面如何降低时延等方面,而对于如何客观评价整网的时延性能、时延与网络结构之间的深层关系、如何通过网络结构的优化改善时延性能等方面的研究尚比较欠缺。本文尝试通过主成分统计方法对大型IP 网络的时延进行研究分析,旨在挖掘网络时延的深层原因及其与网络各节点间的相互依赖关系,并搭建一个相对合理的网络时延评价体系。

2 网络时延概述

2.1 网络时延及其构成

IP 网络时延通常指一个报文或分组从网络的一端传送到另一端所需要的时间,网络时延的构成如图1 所示。它主要由节点时延和传输时延构成,其中节点时延又包括处理时延、排队时延和发送时延。

处理时延主要指检查数据分组头部并决定将该分组发往何处所需要的时间,同时还包含检查比特差错等其他因素所需要的时间;排队时延是数据分组等待链路上前面数据分组传输完毕所需要的时间,一个特定数据分组的排队时延取决于先期到达的正在排队等待链路传输的数据分组的数量;发送时延是路由器将数据分组的所有比特发送到链路所需要的时间,它等于数据分组长度除以链路传输速率。传输时延是数据分组从路由设备一端传输到另一端所需要的时间,它等于两台路由器之间的距离除以链路传输速率,而传输速率取决于链路的物理媒质(光纤、双绞铜线等),广域网中传输时延为毫秒量级。

通常,发送时延与传输时延是网络时延的主要组成部分,对于报文长度较大的情况,发送时延是主要矛盾;对于报文长度较小的情况,传输时延是主要矛盾。而对于大型的IP 网络而言,由于端到端距离跨度长达数千千米甚至上万千米,此时传输时延将成为最需要关注的主要矛盾。

图1 网络时延的构成

2.2 网络时延对通信性能的影响

网络时延是衡量网络通信性能优劣的关键指标之一,一般而言,时延越小越好,但时延只能降低却不可能消除,并且受通信设备处理能力及网络拓扑、传输媒质等物理条件的限制,网络时延只能在一定范围内进行优化和改善。

不同的业务和应用对实时性要求不同,从而对网络时延的要求也不同。例如交互型直播视频类业务,对时延的要求较高;而文件传输、邮件等应用,对时延的要求则较低。在进行网络设计和优化时,通常会考虑不同业务的需求及其业务等级,优先保证高优先级业务的时延性能。一个设计不合理的网络,网络时延容易出现异常或超限的情况,由此可能造成网络拥塞、数据丢包甚至网络瘫痪,从而影响数据传送的效率和有效性。

3 PCA 基本原理

主成分分析(principal component analysis,PCA),是数据挖掘中一种常用的降维算法,是一种多变量的统计方法。PCA 通过正交变换将一组可能存在相关性的变量重新转换为一组线性不相关的综合变量以代替原来的变量,其基本思想是将原来n维特征映射到p维特征上(p<n),这个重新构造的相互独立p维特征则称为主成分。

PCA 提取较少数量的主成分以减少数据空间的维度,被提取出的主成分必须能够最大限度地包含原始数据的特征,同时最小限度地损失原始数据的信息量,以期在降维的同时发现原始数据的最主要特性及高纬度背后更丰富的内涵。PCA每一个主成分的贡献率可用其方差来度量,第1主成分Comp.1 是所有变量的线性组合中方差最大的,其次是第2 主成分Comp.2,依次类推,n维变量最多具有n个主成分,一般提取方差累计贡献率在80%以上的前p(p<n)个主成分即可。

通常,主成分分析方法主要包括以下5 个步骤。

步骤1对原始数据进行标准化处理,使之零均值、归一化以消除量纲不同的影响。

步骤2计算指标变量的相关系数矩阵(或协方差矩阵)并求解特征值和特征向量。

X的相关系数矩阵为R=(rij)n×n,其中相关系数rij的计算式如下:

Z1称为第一主成分,Z2称为第二主成分,…,Zn称为第n主成分。

步骤3计算主成分的方差贡献率及累计贡献率,并依据方差累计贡献率选择前p个(p<n)主成分。

根据研究问题的实际情况,通常选取方差累计贡献率大于80%的前p个主成分代替原来的n个指标变量,从而实现数据的降维。

步骤5结合主成分综合得分及实际情况,做进一步的统计分析。

4 大型IP 网络时延的PCA 分析

4.1 大型IP 网络时延简介

对于大型IP 网络而言,端到端距离跨度少则数千千米、多则数万千米,此时网络时延将成为评估和考核网络性能的一个重要指标。通常运维部门会利用相应的技术手段实时监测并定期采集记录网络各节点间端到端的时延,并形成时延矩阵报表。通过对这些网络时延数据的统计和分析,可以及时评估网络的运行状况并发现异常情况,进而采取相应的处理措施。

为了适应业务的飞速发展和网络扁平化的演进,近年中国电信在原有IP 骨干网基础上启动网络新平面的建设工作,同时原有旧平面将逐步缩容并分批退网,该过程将持续3~5 年,最终实现业务的无缝切换和高效承载。本文将以中国电信新、旧平面全国28 个地市到IP 骨干网9 个大型节点的时延矩阵数据为基础,通过主成分分析方法对IP 骨干网的新、旧两个平面的网络时延矩阵进行研究分析,试图找出网络时延与大型节点之间深层的相互依赖关系,并对其中相对重要的节点提出优化改造建议;同时通过主成分分析搭建更科学合理的时延评价体系,评估和分析新平面相对旧平面网络时延的改善情况,并借鉴旧平面运营经验进一步为新平面的时延优化和网络建设提供有价值的参考。

4.2 网络时延的PCA 分析过程

4.2.1 时延数据标准化处理

大型IP网络的时延矩阵经标准化处理后见表1、表2,其中表1 对应网络旧平面的时延矩阵,表2 对应网络新平面的时延矩阵;其中A1~A28代表分布于全国各省份的28 个地市,X1~X9 代表IP 网络的9 个大型节点;表中每行指示了某地Am(m=1, 2, …, 28)到各大节点Xn(n=1, 2, …, 9)标准化后的网络时延,每列指示了全国28 个地市到某大型节点Xn(n=1, 2, …, 9)标准化后的网络时延。

4.2.2 时延相关系数矩阵

网络旧平面相关系数矩阵见表3。

网络新平面相关系数矩阵见表4。

两个节点之间的相关系数越接近1 则相关性越高。由表3 可见,网络旧平面中节点X1、X2间的相关度很高,节点X3、X7、X8、X9 间的相关度很高,X5、X6 间的相关度也较高。由表4可见,新平面中各节点间的相关性整体较旧平面有一定增强,其中X1、X2 间的相关度仍很高,X3、X4、X7、X8、X9 之间的相关度较高,X4与以上其他几个节点的相关性较旧平面有增强。大型节点相互之间的相关性说明,这些节点并非相互独立,而是密切关联的,结合网络实际情况分析,节点间的关联性大体与它们之间的链路数量、带宽大小、距离远近等因素呈正相关的关系。

4.2.3 主成分个数的选取

通过求解相关系数矩阵的特征值及特征向量,得到图2 的碎石图,图2(a)对应网络旧平面的碎石图,图2(b)对应网络新平面的碎石图。图2 中每个圆点对应时延相关系数矩阵的每个特征值,这些特征值由大到小排序,形成断崖式的碎石图。由碎石图可见,可以选取前两个或前三个特征值所对应的主成分来进行后续的分析。

表5、表6 是网络旧平面和网络新平面的各主成分的方差贡献率,其中第一行是各主成分的标准差,第二行为各主成分的方差贡献率,第三行为主成分的方差累计贡献率。

表1 旧平面标准化后的时延矩阵

表2 新平面标准化后时延矩阵

表3 网络旧平面相关系数矩阵

表4 网络新平面相关系数矩阵

图2 碎石图

由表5 看到,网络旧平面第1 主成分Comp.1贡献率为57%,前两个主成分的累计贡献率为81%,前3 个主成分的累计贡献率为90%。由表6可知,网络新平面第1 主成分Comp.1 贡献率为65%,前两个主成分的累计贡献率为80%,前3 个主成分的累计贡献率为91%。

结合碎石图考虑,前两个主成分方差累计贡献率已达到80%,新、旧平面统一选取前两个主成分来进行分析,图3 是前两个主成分的载荷图。

由图3 可见,对于网络旧平面,第1 主成分Comp.1 中,9 个大型节点的载荷在0.15~0.43,说明9 个大型节点的权重存在差异,节点X3、X7、X8、X9 的载荷比较高,说明这4 个节点比较重要;第2 组成分Comp.2 中,节点X1、X2 扮演主要的正向作用,X6 扮演主要的负向作用。对于网络新平面,第1 主成分Comp.1 中,9 个节点的载荷分布较旧平面更均衡些,说明各节点的重要性差异不大,但节点X3、X7、X8、X9 与网络旧平面一样,载荷也比较高,说明它们在新平面中也同样比较重要;第二主成分Comp.2 中,网络新平面与旧平面有所不同,新平面中节点X5、X6 扮演着主要的正向作用,没有节点扮演主要负向作用。

4.2.4 计算主成分得分

利用以上步骤得到的各主成分的载荷,可以写出各个主成分的表达式。以第1 主成分Comp.1为例,写出第1 主成分Comp.1 的计算式。

网络旧平面第1 主成分Comp.1 的表达式为:

表5 网络旧平面主成分贡献率

表6 网络新平面主成分贡献率

图3 前两个主成分的载荷图

网络新平面第1 主成分Comp.1 的计算式为:

为了更直观地对28个地市的网络时延进行综合评估和对比,定义主成分综合指数Comp.,用每个主成分对应的方差占所提取主成分总方差的比例作为该主成分的权值系数,计算主成分综合指数Comp.。对应于提取前两个主成分的情况,主成分综合指数的计算式如下:

利用主成分表达式及主成分综合指数表达式,可以计算得到各地市的主成分得分及主成分综合指数。前两个主成分的得分及综合指数如图4、图5 所示。

图4 网络旧平面主成分得分

图5 网络新平面主成分得分

由图4、图5 可见,新、旧两个平面中,地市A22、A23、A24 的第1 主成分Comp.1 得分较其他地市都要大;第2 主成分Comp.2 旧平面各地市的差异起伏较大,而新平面各地市表现较平稳。旧平面中,由于第2主成分Comp.2的占比不算小,因此主成分综合指数Comp.介于第1 主成分Comp.1 与第2 主成分Comp.2 之间,与第1 主成分Comp.1 的偏离度稍大一些;而新平面中,由于第2 主成分Comp.2 的占比较小,因此主成分综合指数Comp.与第1 主成分Comp.1 的重合度很高。

两个网络平面在前两个主成分样本的分布如图6 所示,两个平面的样本分布并未呈现出规律性的结构,说明很难对它们进行归类。但旧平面的A22、A23 和新平面的A23 远离其他地市,它们的第1 主成分Comp.1 特别大,说明这几个地市的时延受第1 主成分Comp.1 的重要节点X3、X7、X8、X9 的影响很大,在优化这几个地市的时延时建议着重优化X3、X7、X8、X9 节点所对应的设备及链路。对于第2 主成分Comp.2 较大的地市,如旧平面的A5、A10、A19、A24,建议重点优化第2 主成分Comp.2 的大权重节点X1、X2 和X6所对应的设备及链路。

图6 各地市网络时延分布

4.3 时延评价及建议

为了更好地对各地市的IP 网络时延进行分析和评估,可以基于主成分分析结果建立一个针对网络时延的评价体系。这个评价体系与通常采用的平均值、中位数等简单指标来评估的系统不同,可以更科学、更准确地揭示网络时延的真实情况,以及各地市时延与各大型节点之间的内在关联关系。

两种方法对两个平面中各地市网络时延进行排序如图7 所示,由图7 可知,新、旧两个平面两种方法的网络时延排序情况在头、尾两端一致性比较好,但中间区域则出现较大差异,如图7(a)旧平面的A1、A2、A4、A15、A16、A28 等地市,图7(b)新平面的A1、A2、A4、A15、A17、A20、A26 等地市,而采用主成分分析结果的排序更符合网络情况的客观实际。因此,这两种方法的差异表明,通常所使用的平均值评价方法对于多指标、复杂变量系统是不适用的,需要寻求更适合的方法(如主成分方法)来进行分析。

为了研究新平面相对旧平面的网络时延的改进情况,用以上得到的新平面的主成分综合指数Comp.减去旧平面的主成分综合指数Comp.,得到两者的差值并画图,对应图8 中的深灰色柱子,而图8 中浅灰色柱子则对应新平面网络时延平均值减去旧平面网络时延平均值所得到的差值。从左往右按主成分综合指数Comp.差值从大到小排序,即新平面相对旧平面时延性能的改善程度由差到优排序,最左边最差的地市是A23,即新平面的网络时延相对旧平面未减反增,最右边改善最好的地市是A22,即新平面的网络时延相对旧平面大为减少了。主成分综合指数法评价结果显示,新平面相对旧平面网络时延得到改善的地市占了多数。

主成分综合指数法及平均值法得到的网络时延改善情况对于大多数地市是吻合的,但也有一些地市两种方法得到的结果是相反的,如A15、A17、A1、A2 等,而事实证明主成分分析方法的结果与网络实际情况及其他相关指标所得到的结果是一致的。为何会出现这样的差异?这说明常规利用平均值进行评估判断的方法是存在问题的,这种方法可能因为数值的平均化而掩盖了事物的主要矛盾,而主成分分析方法则通过抓住事物的主要矛盾和本质关联得以很好地避免此类问题的出现。针对多指标、复杂变量评估系统的情况,主成分分析方法可以提供更科学合理的参考依据。

图7 各地市网络时延排名情况

图8 两种分析方法下网络时延的改进

通过前面的分析可知,大型节点X3、X7、X8、X9 在两个平面的第1 主成分Comp.1 的权重占比较大,旧平面的X1、X2,新平面的X5、X6在第2 主成分Comp.2 中占比较大,因此在实际工程建设中进行网络时延优化时,应重点对这些权值较大的节点进行调整和改造,如更新设备、增加带宽等,尤其是第1 主成分Comp.1 权值较大的节点;对于新平面时延性能大大劣于旧平面的地市A23、A24 等,建议通过增加到大型节点X3、X7、X8、X9 的直达方向以减少流量绕转、适当扩容带宽以降低拥塞可能性等方式进行改造;对于新平面其他地市的时延优化,建议着重优化X5、X6 节点将更容易达到较好的结果。另外,通过对新、旧平面的PCA 分析得知,增加大型节点之间的连接和保持节点间的均衡性有利于网络时延性能的提升,网络扁平化依然是未来网络发展的方向。

5 结束语

网络时延是衡量网络通信性能的关键指标之一,对于具有多变量、多指标的复杂的大型IP 网络时延,简单的平均值分析方法不再适用,而主成分分析方法则为此提供了一种更科学的统计方法及分析思路,它能够挖掘网络时延的深层原因及网络各节点间的相互依赖关系,最终获取网络建设、改造优化的有效建议。目前,本文仅对历史网络时延矩阵进行离线的分析,今后可考虑将主成分分析方法应用到针对网络流量、网络时延、网络丢包等网络性能的实时在线监测中,同时可结合网络拓扑结构、现网流量流向、路由、距离等相关因素进行更广泛深入的分析,发挥数据挖掘统计方法的更大效能,进一步提升网络运营的效率和质量。

猜你喜欢
贡献率时延平面
一种通用的装备体系贡献率评估框架
立体几何基础训练A卷参考答案
基于GCC-nearest时延估计的室内声源定位
基于改进二次相关算法的TDOA时延估计
关于装备体系贡献率研究的几点思考
参考答案
FRFT在水声信道时延频移联合估计中的应用
基于分段CEEMD降噪的时延估计研究
关于有限域上的平面映射
В первой половине 2016 года вклад потребления в рост китайской экономики достиг 73,4 процента