近日,某专线用户向我们反映该机构查看视频图像出现了卡顿的现象,得知这一现象后,我们开始着手排查。
首先梳理下网络拓扑结构(如图1),通过图1我们可以看到,在数据机房使用全光口交换机作为业务汇聚,连接EPON设备,然后再使用全光交换机将数据传输至专线单位。了解了网络拓扑结构后,登录到全光口交换机上,使用命令show interface gigaethernet 1/13 查看端口的利用率(如图2)。
图1 网络拓扑结构示意图
图2 查看交换机端口利用率示意图
通过图2可以看到,连接专线单位的交换机端口利用率是62%,也就是620M(千兆口),这个流量并没有达到阈值,那为什么会出现视频卡顿呢?为了给专线用户提供更好的网络服务,我们做两手准备,即准备给该专线单位链路进行扩容,在此同时也继续排查故障原因。就在到达该专线单位机房准备进行设备配置的时候发现了端倪,该单位新增了一台交换机A用于连接交换机B(如图3)。
仔细观察该机构所有的网络设备均连接在交换机A上,而交换机B的以太网口均没有使用,两个交换机之间连接使用的是五类网线。众所周知超五类网线传输的带宽是100M,而该专线单位大概有200多路摄像头,每路摄像头按照5M来算的话,也有1 G,使用1根只有百兆的网线来传输,势必会引起数据传输拥塞,从而造成视频画面卡顿。
我们决定将所有A交换机上的网线转移至B交换机上,继续保留B交换机连接全光口交换机。为了提高该单位视频监控传输通道的带宽,我们将在1 G的基础上再增加1 G,即采用链路聚合的办法将物理上的两个端口逻辑的绑定在一起,形成了2G的通道,从而达到了带宽扩容的目的,也在一定程度上起到了负载分担和链路备份的目的。接下来开始配置设备,首先配置的是全光口交换机,具体配置命令是:
上面的配置完成了全光口交换机上链路聚合的配置,接下来配置专线单位的B交换机。具体配置命令即:
这是专线单位交换机链路聚合的配置命令,值得一提的是,链路聚合分手动聚合和动态聚合两种,不同厂家的设备互联实现链路聚合的话,需要使用手动聚合的方式,这里使用的也是手动聚合的方式。这样我们就完成两端设备链路聚合的配置工作,接下来查看全光口交换机聚合组和端口的利用率。
通过对端口13和22端口利用率的查看,端口流量都在320M左右,两个端口进行端口汇聚后我们看到trunk 1/3的端口利用率是32.5%,这个利用率是端口13和22端口利用率的平均值,流量是325*2=650M,这个数据和没有进行端口汇聚前,总流量基本相同,然后这650多兆的流量让端口13和22共同分担,保证了带宽的冗余性。
从我们得知网络故障后开始排查,先后采用了查看交换机端口利用率的办法,然后在专线单位机房发现了故障原因,最后通过调整网络结构和配置链路聚合的办法,既优化了网络结构,又增加了链路带宽,达到了两全其美的效果。后期我们得知,该专线单位先前使用的A交换机是一个二层交换机,最近为了业务的发展需要使用三层交换机B,该单位网络管理人员为了省事并没有将B交换机完全替代A交换机,而是使用了一根网线将两个交换机串联起来使用,然后将三层交换机B连接全光口交换机。这样就出现了文章开头的这一幕。
通过这次排查故障,作为网络运维人员,在工作上一定要按照规范来实施,如果背道而行的话,就会给网络埋下安全隐患,危及网络的稳定性。其实,在网络运维过程中还要具有前瞻性,就如上面我们利用链路聚合的办法将链路带宽做到了冗余和备份,实现了高性能和低成本的双收益,既保障了专线用户对高带宽的需求,又实现了低成本的运作。