移动TCP成功率提升专项分析报告

2015-04-15 09:35桓汗晶北京中创信测信息技术有限公司监测系统产品部产品经理
信息通信技术与政策 2015年10期
关键词:全网核心网IP地址

桓汗晶 北京中创信测信息技术有限公司监测系统产品部产品经理

中创信测技术专栏

移动TCP成功率提升专项分析报告

桓汗晶 北京中创信测信息技术有限公司监测系统产品部产品经理

编者按:移动用户上网过程中的关键流程有很多,其中TCP建立涉及到服务器和无线网络之间的配合,任何一步的失败都会导致后续业务资源无法获得,因此显得尤为重要。北京中创信测信息技术有限公司检测系统产品部桓汗晶撰写了《移动TCP成功率提升专项分析报告》一文,该文依托中创信令监测系统,通过统计移动某地的TCP建立成功率,从多维度进行分析,定位了TCP建立指标存在的问题,并通过各种优化措施进行提升,有效地提升了用户上网感知,可供相关技术人员学习参考。

TCP建立是移动用户上网过程当中的关键流程,由于TCP建立涉及到服务器和无线网络之间的配合,任何一步的失败都会导致后续的业务资源无法获得。本文依托中创信令监测系统,通过对移动某地TCP建立成功率进行统计,从SGSN、TCP目的服务器和用户IP段多维度进行分析,定位了某地TCP建立指标存在的问题,通过各种优化措施,提升了某地TCP的建立成功率指标,有效地提升了用户上网感知。

信令监测 TCP 用户 IP缓存服务器

1 引言

TCP_LINK_SETUP(TCP三握手)指用户终端与访问网址的TCP传输链路的连接过程,是用户在业务下载或上传前的重要流程。TCP三握手的成功率和时延的好坏会直接影响用户的上网感知,本报告将对TCP三握手的性能进行多维度的评估,重点分析SP和核心网侧问题影响TCP性能的情况。

2 TCP三握手整体性能

为了更好地分析TCP三握手性能,将TCP三握手性能分为网络侧和无线侧性能两部分。其中,网络侧性能真实反映网络侧IP的响应性能情况,无线侧性能则与终端和无线环境关系密切。TCP建立详细流程如图1所示。

统计2015年4月21—5月3日某地全网TCP三握手成功率指标情况,具体如图2所示。

从图2可以看到,对比跟踪多天TCP三握手成功率指标发现,某地全网TCP三握手成功率较低,在70%左右,其中无线侧成功率保持在91%~93%之间,核心网侧成功率较低,在72%~78%之间。由于核心网侧TCP三握手成功率较低,从而导致某地全网TCP三握手成功率较低。

图1 TCP三握手流程

3 TCP三握手成功率分析

从前文可知,目前某地的整体TCP建立成功率仅为70%,其中核心网侧的TCP建立成功率较低,下文主要从3个维度对TCP建立失败率较高进行分析。

3.1 SGSN维度分析

从SGSN维度分析,统计各个SGSNIP的TCP建立成功率指标,具体如图3所示。可见,除112.59.129.134和112.59.129.149的核心网侧响应成功率较低外,其余SGSN级分布指标正常,未发现明显异常。需核实112.59.129.134和112.59.129.149核心网TCP三握手响应成功率的低问题。

无线侧三握手成功率中SGSN_IP地址为112.159开头地址三握手成功率高于IP地址为10.174开头的地址成功率,表明3G无线网络质量明显高于2G网络。3G的112.59.129.134地址无线侧响应成功率较其余地址明显下降,需进行重点分析。

3.2 访问目标IP维度分析

针对某地全网访问目的服务器进行分析,发现多个访问量很大的目的服务器,其TCP三握手成功率很低,主要为核心网侧响应成功率低导致(见表1)。

从表1可以看到,IP归属为某省移动,具体是IP地址为120.203.214.139、120.203.214.143、120.203.214.152、120.203.214.156、120.203.214.161、120.203.214.184、120.203.215.2、120.203.215.3和120.203.215.4的TCP三握手次数较多,但其成功率均很低,需重点进行关注。

关于失败情况较高的网络侧IP归属情况及网站分布情况较为复杂,总体可分为以下几类:

●IP归属移动网内的,建议对该些IP地址服务器性能及网络连接情况进行检查。

图2 某地TCP建立成功率指标

图3 SGSN维度TCP三握手成功率

表1 某地TCP目的服务器TCP指标

●IP归属于联通、电信、北京世纪互联以及国外,建议对其路由情况进行检查。

●IP归属节点为高业务SP服务器的,由于该类业务访问量巨大造成整体TCP性能成功率低,建议协调SP进行优化。

3.3 用户IP段维度分析

通过从用户IP维度进行分析,统计用户数TOP50的用户IP段TCP性能分布情况,具体如图4所示。

由图4看出,TOP50用户IP地址段的TCP三握手性能相对稳定,未出现明显异常IP段。

图4 用户IP段TCP建立成功率

但对某地全网用户IP段进行分析发现,定位某地存在多个用户IP地址段TCP三握手成功率为0,且访问用户数较多,需排查是否为欠费IP地址段造成。统计TOP15问题IP地址段,具体如表2所示。

表2 TCP15问题用户IP段

从表2可以看到,存在多个IP地址段发起TCP三握手请求次数用户较多,但用户无法正常进行TCP连接,TCP成功率几乎为0,其中172.20~172.29、10.135、10.136、10.227和10.228涉及用户10000户左右,10.180涉及用户数较少为440左右。统计这些地址段24h的尝试次数,具体如图5所示。

从图5可以看到,10.135、10.136、10.227和10.228地址段的TCP三握手次数明显和业务量存在关联,在凌晨时段,TCP三握手尝试次数基本为0,但在5点后随着业务量上升,TCP尝试次数明显增加。但172.20~172.29地址段全天基本保持稳定。

4 TCP处理优化方案

4.1 TCP问题定位

●确认用户IP段172.20~172.29为停复机用户IP段,对用户感知无影响。

●经确认用户IP段10.135、10.136、10.227和10.228为诺西GGSN两块板卡存在故障,已进行排障处理。

●经确认,地址120.203.214.139、120.203.214.143、120.203.214.152、120.203.214.156、120.203.214.161、120.203.214.184、120.203.215.2、120.203.215.3和 120.203.215.4确认为某省蓝汛Webcache服务器,定位为蓝汛Cache加速采用在本省DNS上通过泛域名转发至蓝汛DNS解析,最终由Cache提供服务,存在部分非HTTP业务的精细域名解析至蓝汛的Cache平台,而Cache却并未对这些业务提供服务,结果Cache服务器发送大量TCPReset报文至用户端,从而影响TCP三握手连接成功率。

图5 问题用户IP段TCP申请数24h趋势

4.2 TCP问题优化

●问题用户IP段优化效果

经确认用户IP段10.135、10.136、10.227和10.228为诺西GGSN两块板卡存在故障,有关单位已于2015年5月9日18点对其进行了相关关闭操作,以避免用户由于占用问题用户IP段导致TCP三握手失败的用户投诉,这可以有效减少TCP无效请求约500万次左右,并可减少某地市5万户左右的上网故障,有效提升用户感知,具体优化效果如图6所示。

从图6可以看到,2015年5月9日进行相关操做之前,这4个用户IP段的日SYN尝试次数为100万次左右,而在进行相关操作后,这4个用户IP段的日SYN次数基本为0。

●蓝汛缓存服务器处理效果

经确认,地址120.203.214.139、120.203.214.143、120.203.214.152、120.203.214.156、120.203.214.161、120.203.214.184、120.203.215.2、120.203.215.3和120.203.215.4确认为蓝汛Webcache服务器,由于这部分服务器IP访问量较大,对全网TCP成功率影响较大,若能提升这部分服务器IP的TCP成功率,某地全网TCP成功率能够提升10%左右。对蓝汛缓存服务器的TCP业务量情况进行跟踪,详情见图7。从图7可以看到,经过不断调整,蓝汛缓存服务器的TCP尝试次数呈现下降趋势。

图6 问题用户IP段优化效果

对蓝汛各个服务器IP的TCP成功率进行跟踪,详情见图8,从图8可以看到,分3批次对各个服务器IP进行优化操作后,蓝汛缓存服务器的TCP成功率提升明显。

——在2015年5月14日对120.203.215.2和120.203.215.4进行优化后,其成功率分别由10%提升至90%左右,并在后期保持稳定。

——在2015年5月15日对120.203.214.156进行优化后,其TCP成功率由10%左右提升至85%以上,并在后期保持稳定。

——在2015年5月16日对120.203.214.139、120.203.214.143、120.203.214.152和120.203.215.3进行优化,其TCP成功率均得到明显提升,并保持稳定。

4.3 全网TCP成功率优化效果

在对问题用户IP和蓝汛缓存服务器进行处理后,对某地全网整体的TCP成功率变化进行跟踪,具体如图9所示。

图7 蓝讯缓存服务器TCP建立次数趋势

图8 蓝讯缓存服务器TCP建立成功率跟踪

图9 某地全网TCP建立成功率趋势

●从对TCP整体成功率进行跟踪的情况来看,2015年5月9日对问题用户IP进行处理后,TCP成功率由68%提升为70%左右,提升2%左右。在2015年5月14日对蓝汛缓存服务器进行优化后,TCP成功率由72%提升为77%左右,提升5%左右。

●从对网络侧成功率进行跟踪的情况来看,处理问题用户IP后,由于问题用户IP的TCP尝试次数占全网次数较少,网络侧成功率基本维持在75%左右。从2015年5月14日起,分3批次对蓝汛缓存服务器进行优化后,网络侧成功率逐步由77%左右提升为83%左右,提升6%。

阿尔卡特朗讯优化英吉利海底隧道铁路通信服务

阿尔卡特朗讯近日宣布为欧洲隧道公司部署其敏捷光网络技术,助其将所有运营通信服务与应用融合于一体化的数据网络。

阿尔卡特朗讯久经考验的环保光网络技术将被部署在南北向的隧道上,确保在恶劣环境中保持性能稳定高效。根据双方签署的为期超过五年的合同,阿尔卡特朗讯还将提供培训、网络维护及系统支持服务。

为欧洲隧道公司部署敏捷光网络技术提供了一个极佳的例证:展示了铁路运输行业是如何向波分复用(WDM)光及IP技术迁移,以满足多样化业务需求的。此外,与欧洲隧道公司的协议也进一步凸显了,除传统电信运营商领域外,阿尔卡特朗讯在业务多样化方面的努力。

Mobile TCP Success Rate Improvement Analytical Report

TCP setup is a critical process of mobile users accessing Internet.Because TCP setup refers to the cooperation between the server and wireless networks,any-step failure will lead to the subsequent service resources unavailable. This article relies on ZCTT signaling monitoring system,by the statistics of GSM network TCP setup success rate, makes multi-dimensional analysis,including SGSN,TCP destination server and user IP segment,and positions Fuzhou TCP setup indicators problems.Also by various optimization measures,enhance the indicators of Fuzhou TCP setup success rate,and effectively improve the Internet users’perception.

signaling monitoring,TCP users IP,cache server

猜你喜欢
全网核心网IP地址
《唐宫夜宴》火遍全网的背后
双十一带货6500万,他凭什么?——靠一句“把价格打下来”,牛肉哥火遍全网
铁路远动系统几种组网方式IP地址的申请和设置
GSM-R核心网升级改造方案
电力系统全网一体化暂态仿真接口技术
5G移动通信核心网关键技术
王天戈首支中文单曲《心安理得》全网首发
公安网络中IP地址智能管理的研究与思考
核心网云化技术的分析
《IP地址及其管理》教学设计