不同设备链路聚合互联故障

2018-11-06 08:32
网络安全和信息化 2018年7期
关键词:缺省交换机报文

链路聚合概述

链路聚合,是将多个物理接口捆绑成一个逻辑接口的技术。该技术可以实现增加带宽、提高链路可靠性和负载分担的功能,在高可靠、高性能网络设计中应用广泛。

链路聚合在各个厂商技术文档名称稍有出入,思 科Cisco称channelgroup,华为 HUAWEI称 ethtrunk,华三 H3C称 bridgeaggregation,锐捷RUIJIE聚合组称port-group。

基于IEEE802.3ad标准的LACP(Link Aggregation Control Protocol,链 路汇聚控制协议)是一种实现链路动态汇聚与解汇聚的通用协议,为交换数据的设备提供一种标准的协商方式。协议报文直接封装在Ethernet Header里,协议 号 :0x8809。Ethernet Header里的Destination MAC = 01:80:c2:00:00:02,这个是保留的、特殊组播地址。可以尝试使用抓包Filter, Destination MAC= 01:80:c2:00:00:02捕获。

图1 链路聚合三种工作模式

LACP协议通过LACPDU(LinkAggregation Control Protocol Data Unit,链 路汇聚控制协议数据单元)与对端交互信息。使用某端口的LACP协议后,该端口将通过发送LACPDU向对端通告自己的系统优先级、系统MAC、端口优先级、端口号和操作Key。对端接收到这些信息后,将这些信息与其他端口所保存的信息比较以此选择能够汇聚的端口,从而双方可以对端口加入或退出某个动态汇聚组达成一致。

链路聚合分类

链路聚合有三种工作模式,如图1所示。

1.手 工汇聚,不启动LACP协议,聚合组、组成员接口的加入或删除完全由手工来配置。该模式下所有活动成员接口(selected)都参与数据的转发,分担负载流量,因此称为手工负载分担模式。

2.静态LACP聚合模式下,启动LACP协议,手工配置聚合组,聚合组成员接口的加入或删除,都是由手工配置完成,并且还要通过LACP协议交互确定这些手工添加的聚合组成员接口是否可以真正被聚合在一起。端口有两种状态:Selected或Standby。Selected端口和Standby端口都能收发LACP协议,但Standby端口不能转发用户报文。该模式由LACP协议确定聚合组中的活动和非活动链路,又称为M∶N模式,即M条活动链路与N条备份链路的模式。

3.动态LACP聚合模式下,不需要创建聚合组,也不需要指定哪些接口作为聚合组成员接口,两台设备会通过LACPDU协商自动完成链路的聚合操作。聚合组内的各成员端口上均启用LACP协议,其端口状态(加入,离开)通过该协议自动进行维护。端口可能处于两种状态:Selected或 Standby。Selected端 口和Standby端口都能收发LACP协议,但Standby端口不能转发用户报文。表1为三种模式的区别。

手工汇聚链路聚合和静态LACP聚合都是人为配置的聚合组,不允许系统自动添加或删除聚合端口。不同的是,手工汇聚下不启用LACP协议报文参与活动接口的选择,而静态LACP聚合启用LACP协议。动态LACP聚合和静态LACP聚合原理类似,只是动态LACP聚合中所有端口都是通过协议确定,而不像静态LACP汇聚通过协议在指定端口中确定汇聚相关端口。

常见交换设备支持的链路聚合模式及缺省模式

1.思科Cisco (缺省模式为Cisco私有协议pagp)

手 工 汇 聚,channelgroup组号mode on。

LACP 协议聚合,厂家命名为,自动聚合模式-LACP协议,有两种模式:

(1)Passvie被 动 模 式(只收不发协商消息)

channel-protocol lacp;

channel-group组 号mode Passvie

(2)Active 主动模式(又发又收协商消息)

channel-protocol lacp;

channel-group组 号mode active

私有协议:自动聚合-PAgP 协议,有两种模式:

(1)auto:被 动,相 当LACP的Passvie模式(只收不发)。

channel-protocol pagp;

channel-group 组号mode auto

(2)Desirable:主动,相当于LACP的Active模式(会发也会收协商消息)。

channel-protocol pagp;

channel-group组 号mode desirable

2. 华为(缺省模式:手工汇聚模式)

手工汇聚,厂家命名为,手工负载分担模式 ,默认。

LACP 协议聚合:厂家命名为,LACP模式(对应上面的静态LACP聚合模式)。

mode lacp

私有协议:无

3. 华三H3C(缺省模式:静态聚合模式即手工汇聚模式)

手工汇聚,厂家命名为,静态聚合模式。

表1 三种模式的区别

link-aggregation group组号 mode manual

LACP 协议聚合:厂家命名为,动态聚合模式。

link-aggregation group 组号mode dynamic

私有协议:无。

4. 锐捷RUIJIE(缺省模式:静态链路聚合即为手工汇聚模式)

手工汇聚,厂家命名为,静态聚合模式,默认。

LACP协议聚合:厂家命名为,动态聚合(LACP)模式(对应上面的静态 LACP聚合模式),有两种模式:

(1)port-group组 号mode passive(只收不发)。

(2)port-group组 号mode active(又发又收协商消息)。

私有协议:无

由于各厂商设备缺省的链路聚合模式不同,常导致聚合组互联失败。建议:①同种设备,网络组建后并且不会经常的扩展,增删聚合成员的时候,或者设备不支持LACP协议,可以直接采用缺省汇聚模式。②不同网络通信设备(比如Cisco、H3C、华为交换机)间链路聚合,推荐优先采用静态LACP聚合模式。

配置故障举例

1.华为和思科聚合组互联

现象:默认配置下,互联端口物理状态均为Up,但聚合组建立不起来。

解决方案:查阅手册得知,思科的默认的聚合协议是私有协议pagp,而华为为手工负载分担模式。更改如下后,两设备均采用静态LACP聚合模式汇聚互联成功。

system-view

[HUAWEI] interface eth-trunk 1

[HUAWEI-Eth-Trunk1]mode lacp

[HUAWEI-Eth-Trunk1]trunkport ge 1/0/1 to 1/0/2

[HUAWEI-Eth-Trunk1]commit

CISCO(config)#i nterface port-channel 1

CISCO(config-if)#exit

CISCO(config)# interface range gigabitEthernet 0/1,gigabitEthernet 0/2

CISCO(config-ifrange)#channel-protocol lacp

CISCO(config-ifrange)#channel-group 1 mode active

CISCO(config-ifrange)#exit

2.华为交换机与华三交换机链路聚合后无法学习到对端的MAC地址

现 象 :display ethtrunk 命令查看链路聚合状态,发现接口为状态为Up,但是eth-trunk状态为Down。

解决方案:查看产品文档发现,华为交换机配置链路聚合有两种模式,分别是manual和 lacp-static,现在华为交换机采用默认配置,则为manual;而对端华三交换机使用的是dynamic模式。更改如下后,两设备均采用静态LACP聚合模式汇聚互联成功。

[H3C] interface Bridge-Aggregation1

[H3C--Bridge-Aggregation1] port linktype trunk

[H3C--Bridge-Aggregation1] undo port trunk permit vlan 1

[H3C--Bridge-Aggregation1] port trunk permit vlan 2 to 4094

[H3C--Bridge-Aggregation1] linkaggregation mode dynamic

[HUAWEI]interface Eth-Trunk1

[HUAWEI-Eth-Trunk1]port link-type trunk

[HUAWEI-Eth-Trunk1]port trunk allow-pass vlan 2 to 4094

[HUAWEI-Eth-Trunk1]mode lacp

3. 华三交换机之间手工汇聚互连时断时续

现象:两台设备均为华三交换机,其中一台聚合口采用光口(光纤)连接到中间设备(交换机),通过中间交换机把光口转换电口后,再用网线连接对端聚合交换机。查看链路聚合状态,发现两端状态不一致。一端聚合组成员接口上状态都是Selected,另一端聚合组其一成员接口Unselected。

解决方案:取消缺省聚合模式,两端均采用动态聚合模式(LACP)模式即可解决。之所以出现这种情况,是因为交换机采用缺省聚合模式,没启用LACP协议,不能感应对端设备接口的状态,从而导致部分流量仍旧的往不通的接口上转发。

[H3C] interface Bridge-Aggregation1

[H3C--Bridge-Aggregation1] port linktype trunk

[H3C--Bridge-Aggregation1] undo port trunk permit vlan 1

[H3C--Bridge-Aggregation1] port trunk permit vlan 2 to 4094

[H3C--Bridge-Aggregation1] linkaggregation mode dynamic

4.华为交换机间链路聚合,中断其中一条线路,部分地址无法Ping通。

现象:两地机房两台华为核心交换机,采用电信、移动双线LACP模式聚合互联,配置成功。某天其中电信线路故障,短期内部分业务不通。

解决方案:经排查发现两端交换机采用LACP模式互联,但没设置接收LACP协议报文的超时时间。一旦对端链路聚合组的某个成员接口发生自环或其他故障,而本端Eth-Trunk不能及时感知对端成员口状态的变化,就会导致本端转发数据时仍按照本端链路组中活动接口进行负载分担,造成发生故障链路上数据流量的丢失。缺省情况下,Eth-Trunk接口接收报文的超时时间是90秒。

通过命令行[HUAWEI-AEth-Trunk1]lacp timeout fast,可极大减少部分业务中断时间。配置此命令后,本端将接收报文的超时时间通过LACP报文通知对端,对端发送LACP报文的周期改为1秒。LACP协议报文的超时时间为LACP报文发送周期的3倍,即接收LACP协议报文的超时时间为3秒(默认配置为slow,对端发送LACP报文的周期为30秒,接收LACP协议报文的超时时间为90秒。)

总结配置链路聚合注意事项

1.聚合链路两端的物理参数和逻辑参数必须一致,聚合的链路的数目、速率、双工方式、端口类型、流控都要一致。

2.注意设备间链路聚合协议的一致性。

3.在设备支持的前提下,建议采用静态LACP聚合模式,以便能感应对端设备接口的状态,避免继续向不通链路转发数据。

4.采用LACP聚合模式,注意对数据转发的性能优化,通过命令改小LACP接收的超时时间,尽可能减少部分流量的中断时间。

猜你喜欢
缺省交换机报文
基于J1939 协议多包报文的时序研究及应用
基于“缺省模式”设计平台的控制系统研发模式重塑
CTCS-2级报文数据管理需求分析和实现
浅析反驳类报文要点
基于地铁交换机电源设计思考
修复损坏的交换机NOS
缔造工业级的强悍——评测三旺通信IPS7110-2GC-8PoE工业交换机
ATS与列车通信报文分析
基于条件随机场的评价对象缺省项识别
罗克韦尔自动化交换机Allen-Bradley ArmorStratix 5700