[古秋锦]
在无线网络优化中场景中,导致用户质量感知投诉的原因是多样的,主要包括覆盖、容量、干扰、故障等。一般情况下,基站射频设备、主控板、基带板等硬件设备出现严重告警时,操作维护平台都会及时发现并处理[1]。然而,对于这些硬件设备出现一些隐性故障时,将很难被发现,直接导致无法及时修复故障问题,从而出现大面积用户感知异常,一直以来都是一个网络优化研究的难点。
结合相关问题,现分别从单小区/整站共性问题确认、传输问题排查、参数变更/故障原因排查、上/下行网络链路问题确认以及最终问题根因确定等5个步骤,介绍一种4G站点主控板隐性故障的排查方法[2]。
以 “深圳金銮国际E-HLW”站点为例,根据主覆盖区域用描述的无法进行数据业务和语音业务情况,用五步法进行排查。对问题小区进行KPI指标统计发现:“深圳金銮国际E-HLW-1”从4月10日开始,4G无线接通率、上行用户平均体验速率以及Volte丢包率明显劣化,与投诉时间点相匹配[3],如表1所示。
结合相关问题,对“深圳金銮国际E-HLW”站点开展单小区/整站共性问题确认、传输问题排查、参数变更/故障原因排查、上/下行网络链路问题确认等排查,最终问题根因确定、五步法进行排查[4]。
首先,统计“深圳金銮国际E-HLW”整个站点所有小区4月初的“VoLTE上行丢包率”、“上行用户平均体验速率”明显出现同步劣化。综上,该投诉非单小区异常,属于共站小区的共性问题[5],如图1、图2所示。
图1 VoLTE上行丢包率变化
图2 上行用户平均体验速率变化
接着,结合网管相关“E-RAB建立失败”原因统计中,传输资源不足、传输层问题导致的次数都是0次,初步排除由于传输问题导致整站小区的劣化,如表2所示。
表2 深圳金銮国际传输指标变化
同步在网管确认,“深圳金銮国际E-HLW”站点小区指标劣化期间,无参数调整记录、站点无影响业务的历史告警。
结合问题小区 RRC失败的原因集中在“UE无应答而导致RRC连接建立失败次数”、“其它原因导致的RRC连接建立被拒绝的次数”两个原因值。“深圳金銮国际E-HLW-1”小区RRC失败和E-RAB失败原因值统计[6],如表3所示。
表3 深圳金銮国际接入指标情况
空口“UE无应答”信令跟踪截图,如图3所示。
图3 UE无应答信令跟踪
查询“深圳金銮国际E-HLW-1”小区“下行MR覆盖”为98.60%左右,在指标劣化情况时无明显劣化情况,相关指标如图4所示。
图4 深圳金銮国际下行MR覆盖
查询“深圳金銮国际E-HLW-1”小区“上行干扰平均值和最大值”在指标劣化前后明显发生变化,干扰变强了8 dB左右。相关指标如图5所示。
图5 深圳金銮国际上行干扰变化
综上,初步判定空口“UE无应答”信令主要由于终端收到RRC CONN SETUP消息,并发出RRC CONN SETUP CM消息后,由于上行质量异常、基站侧无法接收到相关消息,导致RRC连接“UE无应答”超时[7]。
进一步查询,深圳金銮国际E-HLW-1小区PUSCH上弱覆盖占比、平均值、最大值等指标,在投诉出现前后均明显劣化,如表4所示。
表4 深圳金銮国际投诉前后指标变化情况
从上/下行PRB利用率差值来看,“深圳金銮国际E-HLW-1”小区上行质量异常,导致上行数据重传较多、上行PRB利用率明显大于下行PRB利用率现象,如图6所示。
图6 深圳金銮国际上/下行PRB差值
将“深圳金銮国际E-HLW”站点的“时钟检测增强开关”设置为ON后,站点同步出现主控板(UMPT)单板硬件故障告警。详细截图如图7所示。
图7 深圳金銮国际重要告警查询结果
综上,“深圳金銮国际E-HLW”站点小区语音业务、数据业务使用异常的投诉,主要是由于主控板(UMPT)单板硬件故障,引起上行链路质量突发劣化导致[8]。
4月24日,维护同事现场更换“深圳金銮国际E-HLW”站点主控板后,整个站点小区“上行干扰电平”、“上行PRB与下行PRB差值变化”、“上行RTP丢包”、“无线接通率”和“上行速率指标”等指标均恢复到投诉出现之前的水平,达到预期优化效果,回访投诉用户均得到数据业务和语音业务感知均恢复正常的回复[9],详细优化前/后各项指标对比,如图8、图9、图10、图11、图12所示。
图8 上行平均值、最大值优化对比
图9 上行PRB与下行PRB差值变化对比
图10 上行RTP丢包对比
图11 无线接通率对比
图12 上行速率变化
同类问题点如深圳南光城市花园,现场测试负1楼、负2楼停车场室内4G小区占用“深圳南光城市花园E-HLW-1”,终端信号RSRP在-78~-92 dBm左右,下载速0.22 Mbit/s,上传速率0.12 Mbit/s,上传下载速率慢,无法正常通话,用户感知差[10]。
按照 “五步排查法”进行隐性故障分析,最终定位亦是由于站点“深圳南光城市花园E-HLW”主控板(UMPT)单板硬件故障,导致用户上/下行速率感知异常引起投诉。经更换板件后,“深圳南光城市花园E-HLW-1”小区各项感知指标恢复正常,投诉问题得到解决,达到预期效果,如表5所示。
表5 深圳南光城市花园换板前后指标
在无线网络优化中,若无线基站硬件设备出现一些隐性故障时,将很难被发现,直接导致无法及时修复故障问题、出现大面积用户感知异常,一直以来都是一个网络优化研究的难点。结合4G站点主控板存在隐性故障导致周边用户感知差投诉问题,针对性的从单小区/整站共性问题确认、传输问题排查、参数变更/故障原因排查、上/下行网络链路问题确认以及最终问题根因确定等5个步骤,形成一种4G站点主控板隐性故障的排查方法。同时,同步对全网同类问题进行排查和应用,应用效果明显。