刘婉妮,王 欢
(1.西安欧亚学院 陕西 西安710065;2.大唐移动通信设备有限公司 北京100083)
TD-LTE系统eNodeB基站故障分析与研究
刘婉妮1,王 欢2
(1.西安欧亚学院 陕西 西安710065;2.大唐移动通信设备有限公司 北京100083)
目前我国各运营商正在如火如荼的进行TD-LTE系统建设,大规模的TD-LTE基站建设,随之而来的是基站故障种类和数量也随之增多,为了更好的打造TD-LTE精品网络,分析、排查、解决基站的故障就显得尤为重要。本文通过工程实践,针对EMB5116 TD-LTE基站设备的常见故障,总结基站的故障处理流程,并以案例形式分析GPS类故障、射频类故障、传输类故障等常见故障的定位与处理方法,从而快速准确的排查处理故障,保证网络平稳可靠运行。
TD-LTE;EMB5116;基站;RRU
4G网络建设是中国各运营商2014年工作的重中之重。但是随着TD-LTE通信技术的迅速发展,中国的通信市场规模进一步扩大,设备复杂度不断提高,大量新业务层出不穷,导致运营商在管理和维护网络的工作量越来越大,代价越来越高。其中基站的故障会直接影响到TD-LTE网络的建设及网络质量,为了能更好地监控网络运行情况,提高网络维护的效率,提高服务质量,保证基站子系统 高效、可靠、和安全地运行,方便基站维护人员更好的了解系统地的运行状况,基站系统必须有一套准确、可靠、实时的故障诊断和处理机制。为统一网络管理平台提供准确、可靠、故障诊断结果,帮助维护人员尽早地发现和定位问题,保持基站良好运行,分析、排查、解决基站的故障就显得非常重要。
目前的4G系统中,分布式BBU+RRU基站站型得到了较大规模应用,与TD-SCDMA相比,TD-LTE建立了扁平网络架构,取消了RNC(中央控制节点),只保留RAN节点—eNodeB,减少了设备的投入,NodeB和核心网采用基于IP路由的灵活多重连接——S1-flex接口,相邻eNodeB采用Mesh连接——X2接口,TD-LTE系统的一个典型组网示意图如图1所示[1]。目前,LTE现网中用到的基站设备不尽相同,其中EMB5116 TD-LTE是大唐移动通信设备有限公司开发的一种适应多种应用环境下的紧凑型基站产品,具有体积小,安装条件简单,支持挂墙、机柜等方式,配置灵活多样等特点,可用于室内分布应用及室外宏蜂窝应用,单机柜标准容量最小配置10M带宽,最大可支持120M带宽。通过基带拉远技术,既可以支持本地覆盖,也可以支持远端覆盖,从而解决站址问题[2]。由于现网中大量应用了EMB5116 TD-LTE,为了保证TD-LTE网络的顺利运营,因此对EMB5116故障的分析和解决就显得尤为重要,本文便以大唐移动的 EMB5116+ TDRU342DH为例,对其常见故障及故障定位方法进行探讨。EMB5116 TD-LTE基站系统结构如图2所示。
本项目主要解决TD-LTE网络系统在建设期及运维期存在显性或隐性的系列故障,为运营商定位与解决故障提供一种快捷的检测的方案。即系统出现故障时,能及时判断故障产生原因及故障部位,即准确定位故障部位,需采取的检测方法;同时支持所有目标对象的检测与数据获取,从而得达到快速诊断故障的目的。其要解决的关键问题:一是当系统出现故障时,如何对故障进行快速定位,即定位方法的确定。二是故障定位后,如何有效地进行故障处理。基站故障的发生可能仅一类或多类故障的综合,也有可能由一类故障引起其它故障。因此,在进行故障处理时,要根据故障现象分析可能原因,有针对性地逐步排查,提高故障处理效率[3]。
规范的流程是保证故障处理效率的基础,本人及项目组成员通过工程实践,对日常故障案例进行总结,确定基站故障处理主要分为以下4步骤,其流程如图3所示。
图1 TD-LTE系统组网示意图Fig.1 Schematic diagram of TD-LTE system network
图2 EMB5116 TD-LTE基站系统结构图Fig.2 The system structure diagram for EMB5116 TD-LTE eNodeB
图3 基站故障处理流程Fig.3 The handling process of eNodeB
第一步:信息收集。故障处理前,需要通过相关途径收集故障信息,包括故障现象、故障发生的时间地点频率、故障的范围影响、故障发生前设备运行状态、故障发生前对设备进行了哪些操作、故障发生后采取了什么措施、故障发生时设备是否有告警、故障发生时是否有单板指示灯异常等。收集故障可通过以下途径:询问申报故障的人员,询问设备操作维护人员、观察网管软件的告警信息等。了解清楚相关情况后才能决定下一步工作,切忌盲目处理。
第二步:故障诊断。收集故障信息后,需要对故障现象做出判断,并确定故障的范围和分类。常见故障类别为传输类故障、电源类故障、时钟类故障、射频类故障、操作维护类故障、业务类故障。
第三步:故障定位与分析。故障定位是通过一定的方法或手段分析、比较各种可能的故障原因,不断排除非可能因素,最终确定引发故障的具体原因。常用的故障定位方法有:原始信息分析、对比/互换分析、测试/环回分析、仪器仪表辅助分析、接口跟踪分析等。设备类故障原因相对业务类故障简单,虽然故障种类多,但是故障范围较窄,系统会有单板指示灯异常、告警和错误提示等信息。用户根据指示灯信息、告警处理建议或者错误提示,可以排除大多数的故障。
第四步:故障排除。故障排除是指采取适当的措施或步骤清除故障、恢复系统的过程。如检修线路、更换单板、修改配置数据、倒换系统、复位单板等。根据不同的故障按照不同的操作规程操作,进行故障排除。故障排除之后还应注意以下几点:1)故障排除后需要通过查询设备状态、查看单板指示灯和告警等方法确认系统已正常运行,并进行相关测试,确保故障已经排除,业务恢复正常。2)故障排除后需要进行备案,记录故障处理过程及处理要点。3)故障排除后需要进行总结,整理此类故障的防范和改进措施,避免再次发生同类故障。
案例一:GPS无法锁星
故障描述:TD-LTE系统是一个时钟精度要求非常高的同步系统,如果时钟无法同步,基站长时间获取不到参考时钟,会导致基站系统时钟不可用,此时基站业务处理会出现各种异常,如小区切换失败、掉话等,严重时基站不能提供业务。目前时钟信号主要采用GPS信号源,该接收系统大部分安装在室外,所以在工程现场由于工程施工问题导致的时钟信号质量不符合要求从而导致无法锁定时钟的故障比较常见。使用本地维护工具LMT-B查看GPS锁星数为0,表示基站未检测到卫星,需要进行故障处理。
可能原因:GPS连接线缆故障、机柜侧避雷器故障、星卡故障、主控板故障、GPS天线位置安装不合理等。
定位方法:1)检查GPS天馈安装环境。检查安装环境是否满足要求,周围是否存在可能的干扰、多个蘑菇头的放置;用一个圆柱形通口的金属罩罩住GPS天线,对比GPS锁星情况,确定是否有外界干扰;用GPS手持仪测试锁定情况,与基站GPS锁定情况做对比,确定是否有外界干扰[4]。2)排查工程问题。常用方法有:电压排查法测量GPS天馈系统的各段电压值,来判断哪一部分有故障;电阻测量法检查GPS天线是否正常,拔下基站侧的GPS天线,将万用表达到欧姆档,测量GPS天线的针芯和外面的铜皮,如果阻值为200~1 000 Ω,说明天线蘑菇头正常。如果阻值很小,为几欧姆,说明天线短路。如果电阻值很大,几百K,则说明天馈可能开路,需要查看蘑菇头的线缆是否正常;检查天馈部分各接口是否连接可靠,室外部分的防水是否良好;检查功分器和馈线长度。3)检查设备问题。查主控板锁相环状态,若下电复位不能解决需要更换主控板。
案例二:射频驻波比告警
故障描述:RRU常见的故障之一是驻波比告警故障,其是当天线阻抗和馈线特性阻抗不匹配时,造成天线不能全部吸收馈线传输过来的高频能量,部分能量形成反射波,如果反射波过大(即驻波比过大),会造成发射功率波动,覆盖范围收缩[5]。通过LMT-B或OMC查看射频通道驻波比,一般大于1.5即会产生驻波比告警。
可能原因:某多通道RRU出现部分通道下行驻波比告警后,先排除是否配置功率异常小,再检查是否由于工程质量因素引起馈线与RRU馈线口接头处松动引起驻波比升高、馈线与RRU馈线口连接错误;天线本身破损、漏水或者渗水;射频模块故障等。
定位方法:常见故障定位方法有以下几种:1)驻波比测试仪测试法:使用Sitemaster仪器测试馈线侧驻波比,从而确定驻波比产生的原因,是天馈侧问题还是RRU本身硬件问题。2)交换馈线法:交换主、分集馈线,初步判定驻波比告警的故障情况。3)直接接小负载或者小天线法:判定是馈线侧问题还是RRU本身问题导致的驻波比告警。4)手触摸法:用手感觉接头温度来判断接头处是否有驻波,如果接头处温度明显偏高,说明接头处驻波较大。5)敲击法:使用小而轻的工具,如螺丝刀的柄轻轻敲击馈线头,如果驻波比明显变化,则馈线头制作可能存在问题。6)逐段排除法:从天馈跳线、馈线和天馈等逐段进行驻波比排除,如果遇到RRU天馈口后某处驻波比不正常,说明馈线侧或者连接头有问题。7)目测法:直接用目测天馈跳线头是否有内芯的损坏,生锈腐蚀或者天馈头能够随着馈线芯一起动、或者连接头明显连的不紧等都会导致驻波比告警[6]。
案例三:SCTP链路故障告警
告警描述:当基站检测到SCTP链路无法承载业务时,产生此告警。该故障会导致SCTP链路上无法承载信令。
可能原因:物理连接不通导致传输不可用、和对端设备配置参数不一致、到对端的路由不可达、网线连接错误、SCTP的承载链路故障、对端设备故障等。
定位方法:1)查看网管中心的告警台,若有S1链路告警、MME链路告警等可断定为基站物理传输连接不通。此时需上站检查一下基站传输连接是否掉了或松了,如告警不能恢复,则考虑更换光模或传输介质。2)若排除物理传输连接不通,则需检查SCTP链路两端的配置参数与规划数据是否一致,如IP地址、VlAN地址等。3)远程检查承载该故障SCTP的链路是否配置了到对端的IP路由。4)和承载网络的网络管理人员联系,确认承载网络中设备的网线连接是否和配置一致。5)检查对端传输设备是否故障。
目前,我国各运营商正在如火如荼的进行TD-LTE系统的建设,分布式BBU+RRU基站站型得到了广泛应用,BBU和RRU间通过光纤进行连接,相比采用电缆连接的普通基站可以较好地降低馈线的成本和工程施工难度,但这种集成化、专业化的基站,同时又增加了故障的隐蔽性和处理的复杂性[4]。因此需要运营商和各设备厂家的工程人员和维护人员不断地总结经验,制定出行之有效的解决方案应用于实际网络建设中,从而切实降低运营商人力、车辆的投入,缩短基站故障历时,提高故障检测效率,更有效地达到通信网络保障的目的。
[1]王映民.孙韶辉.TD-LTE技术原理与系统设计[M].北京:人民邮电出版社,2010.
[2]大唐移动.EMB5116+TD_LTE设备手册[Z].北京,2009.
[3]丛冶.CDMA2000基站故障诊断系统的设计与实现[D].黑龙江:哈尔滨工业大学,2007.
[4]王洪军.中兴NODE_B基站故障探讨[J].中国学术期刊电子杂志社,2009,3(1):105-107. WANG Hong-jun.The study on NODE_B base station fault of ZTE[J].China Academic Journal Electronic Publishing All Rights Reserved,2009,3(1):105-107.
[5]刘扬.TD-SCDMA系统NodeB故障研究与分析[D].天津:天津师范大学,2009.
[6]大唐移动.EMB5116基站告警处理手册[Z].北京,2009.
Analysis and research on TD-LTE system of eNodeB base station fault
LIU Wan-ni1,WANG Huan2
(1.Xi'an Eurasia University,Xi'an 710065,China;2.Datang Mobile Communications Equipment Company,Beijing 100083,China)
Currently operators in china are in full swing for the construction of TD-LTE systems,As large-scale construction of TD-LTE base stations,the base station fault type and quantity also increase,in order to build better TD-LTE network,to analysis,investigate and solve the base station fault is particularly important.through the engineering practice,according to the common faults of EMB5116 TD-LTE base station equipment.The article sums up the process of fault handling on the base station,and then analyzes the positioning GPS fault,RF fault,transmission fault and processing method in the form of case,in order to quickly and accurately solve the problems,ensure the network stable and reliable operation.
TD-LTE;EMB5116;base station;RRU
TN914
A
1674-6236(2015)07-0175-03
2014-06-26 稿件编号:201406170
陕西省科技自然科学基础研究计划项目(2013JM8023);陕西省教育厅项目(12JK1064)
刘婉妮(1981—),女,陕西礼泉人,讲师。研究方向:移动通信、交换网技术、多媒体技术。