GPON网络故障自动排查技术

2018-03-27 11:15王飞中国移动通信集团陕西有限公司
传播力研究 2018年32期
关键词:定界帐号级联

王飞 中国移动通信集团陕西有限公司

鉴于互联网服务差异及资源端到端质量不稳定,上网体验问题已成为制约全业务快速发展的瓶颈。由于不能常态化实时测量全量用户的感知变化,“连而不通、通而不畅、畅而不稳”的状况仍不断上演。如何重现用户的上网过程,依托用户真实访问数据提前发现感知短板,并提供事前优化,已成为决定宽带运营商公司全业务竞争力的关键因素。

千兆无源光网络,简称GPON网络。该网络故障自动排查技术依赖用户真实的上网数据采集分析,并解决用户上网路径的自动识别,通过建立“用户上网设备级联模型”,对宽带服务过程中涉及的用户异常掉线、宽带认证性能、互联网传输质量、DNS解析、用户流量、用户真实访问延时、下载速率等端到端多环节指标标的采集、关联分析,可建立起多维的宽带端到端质量评估体系及预警机制。

一、设定目标

依托于自身实践经验及市场上的分析需求,本次设计的GPON网络故障的自动排查方案的目标体现在四个层面:

(1)自动核查用户上网级联关系,根本解决用户端口资源信息不准确问题。

(2)通过基于用户真实上网行为,形成全网覆盖的端到端质量指标分析能力。

(3)提供基于大数据的多维度分析能力,实现网络指标与感知指标质量差关联分析。

(4)依赖“用户上网设备级联模型”整合排障信息,力争一键式排障处理。

二、主体技术方案

(一)宽带质量差的成因探讨

对于GPON网络而言,宽带运行质量差主要体现在网络侧接入差、用户侧体验差、业务内容设置差等三个维度,下面展开一一阐述。

(1)用户侧质量差原因

用户侧质量差原因主要体现在用户家用无线路由质量差、用户主动设置或被篡改成异网DNS、电脑环境问题、家庭组网环境等层面。

(2)网络侧质量差原因

网络侧质量差原因依据网络类型的不同,也存在一定的差异。

PON接入网:光猫收光强度超过阀值、PON收光异常、PON下联用户过载、PON流量过载等;

城域网:BAS下联口流量过载、光模块异常、BAS地址池过载等;

集中支撑类:NAT地址过载问题、认证掉线问题、DNS解析不佳等。

(3)业务内容侧质量差原因

用户侧质量差原因主要体现在GPON网络用户对已经引入内容仍异网访问;忙时Cache压力大,造成感知差;用户个性访问,内容未疏导;内容源或链路质量差等层面。

(二)改善质量差的定位设计思路

从用户帐号视角“端到端”整合的“用户侧、网络侧、内容侧”全景信息,形成用户帐号维度贯穿的运维数据中心。在此基础上提供质量差发现、排障定界、故障影响分析等定位设计思路。

(三)定位难点分析

笔者结合自身实践调研,发现GPON网络定位不精确的难点主要体现在三个层面:

(1)用户侧问题突出,可监测指标少

用户侧终端类型和组网环境差异大,问题最为突出,上门排查成本高。

(2)需要全网、全时监测上网过程,确保每个用户访问过程可复现

针对用户侧故障排查,每一个用户都是一个监控点,传统的拨测手段受到监控点数量和拨测样本的限制,无法重现用户真实访问感知。排障处理需要全网、全时、全过程监测上网过程,确保每个用户访问过程可复现。

(3)帐号级联设备及端口准确性是关键

网络指标与业务感知指标的协同分析的根本是,网络指标与告警源于设备、端口,如何通过用户上网路径核查,将网络指标贯穿到用户帐号纬度,是指导用户质量优化和故障定界的关键。

(四)问题突破的思路

以GPON网络定位难点作为解决问题的切入点,有的放矢从三个层面展开问题突破思路的制定。

(1)帐号上网路径自动核查,解决级联设备及端口准确性问题

采用“MAC/VLAN端口信息”识别手段,与PPPOE+技术互为补充,自动构建基于现网数据的“账号-〉ONU及端口 -〉PON 口 -〉 OLT-〉 BAS”上网路径视图。实现用户账号所在ONU端口精准核查,保证有源设备级联信息的百分百准确。

(2)用户感知多法测量,确保全网、全时监测用户上网过程

大数据也要效益比,选择共性、可测量的感知指标(上网延时、速率、流量等),实现全网用户帐号溯源的关联分析。在成本可控前提下,实现全网用户全时全量监控。

(3)通过大数据分析,拓展用户侧指标监控能力

通过上网数据特征分析,实现用户家用路由器厂商分析、下挂用户数分析、长时间未重启家用路由器分析;通过感知数据聚类对比,实现用户个体感知与同ONU、同PON口、同OLT感知对比分析,以排除线路共性因素,定位用户侧质量差原因。

(五)定界的方案分析

依托用户上网资源模型,从“宽带帐号”视角整合设备告警、流量拥塞、认证失败、异常掉线、网络性能、用户感知的全景指标,方便运维人员快速定位故障,简化后续流程。

(1)图形化端到端呈现,整合用户侧质量差要素

提供用户上网级联设备图像显示,可直观展现用户上网所经过主要设备及端口状态(包括:帐号、家用路由器、ONU/端口、OLT/PON口、BAS/端口、内容源分布)。同时通过设备及链路图标颜色变化,显示各质量差故障设备点。

(2)分段分项定界,实现质差问题原因判定

按照用户侧、网络侧及内容侧三个方面,展开基于问题的成因分析。

首先,需要对用户家庭侧环境数据整合与定界。它主要的方案设计如下:

① 用户本人信息:用户上网级联关系核查、接入带宽核查、当前访问速率、当前下载速率。

② 家用路由器信息:是否为路由器接入、路由器厂商、家庭下联用户数。

③ 接入 ONU 质量信息:ONU 基本信息、ONU 光功率、ONU 下挂用户整体访问延时、下挂质差用户占比。

④ 异常掉线信息:采用可视化分析方式,整理异常掉线所出现的原因,来进行整合分析。

其次,网络侧质量数据整合与定界。

① 接入PON质量信息:PON口信息、PON口光功率、PON下挂用户数、PON下挂用户数、PON口下挂用户整体访问延时、下挂质差用户占比、PON口流量与峰值占比。

② 接入OLT质量信息:OLT基本信息、OLT下挂用户数、OLT下挂用户整体访问延时、下挂质差用户占比、OLT上行流量与峰值占比。

③ 访问行为及业务体验数据整合与定界:用户访问量统计、访问资源分布分析、移动网内访问延时分析、外网访问延时分析、下载带宽分析等。

最后,从业务内容侧展开质量差的根源分析。通过对用户业务质量相关的全景数据的深度分析,实现质差问题原因的初步判断。如“PON用户数过载、ONU光衰过大、家用无线路由器质差、PON口流量拥塞、异网访问占比高、内容源问题”等为切入点展开分析。

三、结束语

GPON网络故障在很大程度上影响了网络接入的稳定性、用户体验的顺畅性及业务内容的优化。因此在进行研究故障自动排查技术时,需要做到:首先,在构建数据中心时,依托级联模型,从用户维度贯穿“用户侧、网络侧、内容侧”全景信息,构建运维数据中心,发挥其自身实质作用;其次,两端两载一服务:建立“两端、两载、一服务”的贯穿客户感知和网络指标全局评估体系,保障运行的完整性;然后,要防患于未然,对宽带质量差的根源进行预判,常态下采集用户真实体验数据,提供质差用户及质差设备提前发现;最后展开基于Wifi网络分析优化:测速工具内嵌Wifi网络分析功能,可指导装维人员对家庭Wifi网络信号情况进行分析和问题定位。唯有多重并举,才可以很好的解决GPON网络故障,实现自动排查技术的精确定位。

猜你喜欢
定界帐号级联
RTK技术在土地勘测定界中的应用研究
一类DC规划问题的分支定界算法
基于外定界椭球集员估计的纯方位目标跟踪
基于级联MUSIC的面阵中的二维DOA估计算法
基于可控整流的级联SVG直流侧电压平衡控制
LCL滤波器在6kV级联STATCOM中的应用
H桥级联型STATCOM的控制策略研究
专家支招4类网上帐号最易被盗
基于MapGIS土地勘测定界中分类面积统计的应用