刘克刚
摘要:当前,互联网业务受核心网MTU配置影响较大,本文针对MTU问题导致用户访问Internet资源异常。对MTU故障进行剖析,采用逐层深入排查的思路进行了解决,为处理类似问题提供了较好参考价值。
关键词:MTU;PTN;互联网
中图分类号:TN911 文献标识码:A 文章编号:1007-9416(2019)03-0028-01
0 背景
随着互联网业务普及,核心网参数的合理配置对于互联网业务起着越来越大的作用。在日常维护工作中,互联网故障除了由于设备等硬件设施引起外,部分参数配置不当也会导致故障的发生,因此加强对核心网关键参数合理性的研究就显得十分必要。
1 事件描述
某院总部200M互联网项目中,要求省内各区县单位的外网能够统一访问到总院平台网站,客户在防火墙上已预先分配新的端口给联通接入,割接完成后通过ping测试已确认成功接入互联网,在各区县单位访问该院平台网站测试中发现该平台网站无法打开。
该院采用的组网方式是通过MPLS-VPN方式,在客户端部署一套瑞斯康达分组设备,下联接客户端防火墙,上联与就近联通机房的中兴UTN设备对接,通过中兴UTN网络落地到城域网机房的中兴UTN设备,再由中兴UTN设备下挂的瑞斯康达分组设备对接华为9300上城域网。
在承载业务时,发现到总院网站业务小包能过,大包不能过,通过PC对ping,发现仅能通过1472帧长的报文,但对于小包无任何丢包现象,且延迟、抖动均正常。
2 问题分析
根据组网结构,分析原因最有可能在于整个传输通道MTU值限制问题,按照以下思路逐层深入分析。
2.1 故障原因分析
(1)是否网络拥塞或者有误码导致。
(2)是否为UTN带宽不足导致拥塞导致;在测试中,除了HTTP有问题外,其它业务正常。考虑到HTTP业务使用TCP协议,并且一般都设置了禁止分片,报文都是以最大1500bytes长度进行封装发送。此项目中采用MPLS-VPN组网,其中在报文中还需要多插入8字节MPLS标签,因此怀疑可能由于报文长度超过链路MTU值后在传输过程中被丢弃,而导致HTTP业务异常。
2.2 故障原因验证
(1)确认设备状态是否正常:对相应PTN告警、端口和分组设备进行了查询,没有发现异常告警。
(2)确认开通带宽是否符合链路要求:通过PTN网管检查对接PTN之间链路带宽为GE,滿足业务带宽开通需求。
(3)确认是否由于链路MTU问题导致业务异常:分析组网可以发现,由于在传输过程中使用了MPLS-VPN的方式。需查询各个接口的MTU设定,如异常需增大MPL-VPN网络中各节点设备MTU值。
2.3 接口所需最小MTU值的计算
普通以太口:1500(IP MTU)+14(以太网头部)+4(CRC)=1518bytes
MPLS L3 VPN网络中以太接口:1500(IP MTU)+8(2层MPLS标签)+14(以太网头部)+4(CRC)=1526bytes
MPLS L3 VPN网络中以太子接口:1500(IP MTU)+8(2层MPLS标签)+4(VLAN ID)+14(以太网头部)+4(CRC)=1530bytes,如果PTN节点MTU值设置太小,将导致报文丢失,用户无法上网。
2.4 处理结果
由于下联分组设备的MTU默认9000,通过将上联PTN设备的MTU值修改为9000后,各单位外网业务访问总院平台网站恢复正常,根据以上测试结果最终定位故障原因是链路MTU过小导致。
2.5 经验教训及推广
对于MTU值问题处理,需要分析数据包传递的全路径上的MTU值设置,通用处理步骤如下:
(1)首先分析数据转发路径。检查数据包传递的全路径上各设备的出接口MTU值,站点间传输设备的MTU值也需要检查。
(2)逐段ping大包测试。大包长度分别为大于、小于、等于接口MTU值。如果ping长度大于接口MTU时不通,小于等于接口MTU时能通,可初步认为是MTU问题。
(3)分析报文头格式,各类报文的格式。根据出问题的报文的最大长度修改MTU。
在修改MTU值时,需要注意不同厂商设备MTU值的定义,再次ping大包测试。
3 结语
该类核心网参数配置不当导致的互联网故障比较典型,虽然不涉及到硬件故障但影响面却很大,通过逐层分析、分段排查的思路进行故障分析,最后定位故障原因,为处理类似互联网故障提供了一个十分良好的参考,具有十分重要的意义。
Research on Internet Fault Handling Caused by Improper MTU Configuration
LIU Ke-gang
(China Unicom Ltd.Chongqing Branch,Chongqing 401331)
Abstract:At present, the Internet service is greatly affected by the MTU configuration of the core network. This paper aims at the problem of MTU, which leads to the abnormal access of users to Internet resources. The MTU fault is analyzed, and the idea of layer by layer in-depth investigation is adopted to investigate, which provides a good reference for solving similar problems.
Key words:Maximum Transfer Unit;Private Telecommunications Network;Internet