李恒久
【摘要】 随着移动互联网的飞速发展,智能手机的大量普及,人们对于手机随时在线、对于无线网络质量等有了更高的要求。作为网络能力和网络质量重要保证的无线网络的维护中,“三超”断站已成为目前影响移动网络稳定运行的主要因素,传输网作为基站通信的基础承载方式,传输网是否通畅直接关系到基站运行质量的好坏。为提升移动网客户感知,提高移动网络质量,结合现有网络状况,针对“三超”断站问题原因中占主要因素的传输网存在的一些问题,提出一些思考与探讨。
【关键词】 “三超” 传输 断站 故障
一、前言
在移动互联网飞速发展、智能手机的大量普及的今天,手不离机、习惯性地无论有事没事都要随时刷下手机,成为“手机控”们典型行为,一旦手机无法连线网络、收不到信号时他们则会若有所失、烦躁不安、手足无措。而手机购物、手机银行、手机钱包等移动支付等金融类应用从电脑到手机的迁移,以及手机QQ、微博、微信等社交类应用要求数据业务永远在线,则对网络的稳定性和质量保障提出了较语音、短信更为苛刻的要求。
除了核心网络的高维护保障要求外,保障基站的稳定运行、降低基站断站率,则是移动通信网络维护的基础目标。减少基站的断站,保持网络的完成性与稳定性,才能提高移动网客户的感知,而“三超”断站在全部中断基站的占比尤为突出。根据统计数据,“超频”断站占总断站次数的15%(占VIP断站的24.4%);“超短” 断站占总断站次数的46.6%(占VIP断站的52.7%);“超量”断站则会引起区域性网络售影响。如何解决“三超”断站问题,也成为各大运营商运维工作重点。在“三超”断站的故障原因分析中,因传输(设备和线路)故障引起的“三超”断站占40%乃至更高。因此如何减少传输原因引起的“三超”断站的故障成为目前主要问题。
二、“三超”断站的定义
“三超”断站,指目前现网基站断站中“超频、超短、超量”类的基站中断。
1、“超频”断站:指每月累计中断10次及以上的基站。
2、“超短”断站:指故障历时≤10分钟的基站中断。
3、“超量”断站:指某一故障原因同时导致的10个基站及以上的基站中断。
三、预防“三超”断站日常巡检措施
为预防“三超”断站的发生,在基站日常巡检和维护作业计划执行过程中,应重点加强下内容的巡检:1、检查基站交流电各项指标及各设备空气开关性能是否满足要求;2、检查开关电源参数设置、模块数量配置是否满足要求;3、检查基站蓄电池容量是否滿足要求;4、检查空调使用性能是否满足机房环境温度要求;5、检查各传输端子接触是否良好,测试传输误码,传输质量是否满足要求。
四、引起“三超”断站的主要原因分析
通过提取全省一个月“三超”断站原因进行分类分析(表一),主要有传输问题(31.3%)、市电故障(24.4%)、配套问题(22.3%)、主设备故障(7.6%)、物业问题(5.4%)、不明原因(4.3%,主要是“超短”断站)、其它原因(4.7%)。可以看到,传输问题占比第一成为主因,占“三超”断站近三分之一,特别是在“超量“断站中更是超过了58%。传输故障一般分线路故障和设备故障,对于基站故障而言,传输线路故障是传输故障类原因中的主要问题。
五、传输问题在“三超”断站中的具体体现
5.1“超频”断站方面
从表一的数据可以看到。“超频断站”问题主因是配套问题,传输故障引起的占比较低。
5.2“超短”断站方面
传输问题主要体现在光功率与尾纤方面,当光功率衰耗过大甚至处于临界值时,两个网元之间就可能出现闪断的情况,有时尾纤与法兰盘没有接紧等也会出现闪断的情况。
发生此类问题,需要对光功率衰耗大的进行统计排查,找出衰耗点及时安排时间进行整治,使光功率处于正常范围,同时督促操作人员平时连接尾纤时一定要仔细把尾纤接紧,避免一些不必要的故障发生。
5.3“超量”断站方面
传输在“三超”断站问题中体现最为明显的就是超量的问题,造这种情况往往是传输环结构性问题,如大环、超大环、长链、单节点下挂设备过多等,必须进行整改。
六、传输故障原因分析和解决措施
6.1传输组网结构性问题
6.1.1网络结构安全性差
有些网元下挂支链较多,或者就是一条长链,没有组成环网,一旦发生光缆线路中断或网元脱管,所下挂的全部基站都将断站,由此导致“超量”断站发生。需重新改链组环。
6.1.2环网线路出现同路由问题
有些环网在网管拓扑上看是成环的,但是在实际的物理路由来看,其实是一种“假环”。如图一所示,假设此环是双节点环网,1、3为节点网元,1-4之间的线路和3-6之间的线路如果在同一路由甚至同一光缆上,当这个段落的线路中断时,就会导致4、5、6这3个网元脱管掉站。如是单节点环,情况更为明显,只要每2个网元中间有一段重复路由,当此段发生线路中断,都会造成该环上的大量网元脱管,基站批量中断。
图一 假环
解决此类问题关键在于规划时尽量避免重复路由的产生,现网已存在的,尽量整改或者重新组环。
6.1.3部分环网上网元太多
存在部分环网上网元数量过多,给超量断站带来很多隐患,需重组环网,将大网元逐步割接至几个小的网元,在降低“超量”断站风险的同时也提升环网的接入能力。
6.1.4部分环网上存在单节点环,网络不安全
在此类环上,只环上小节点出现问题,所涉及到的网元将全部退服。此类问题的处理方法,主要寻找新的路由,将一些单节点环逐步重组改成双节点。
6.1.5双节点环时隙交叉配置出问题
双节点环时隙交叉配置当其中一节点出现问题,造成整个环网脱管掉站,并未起到双节点环应有的保护作用。在目前本地网SDH传输网中,大多数复用段节点网元都存在时隙交叉配置现象,如要杜绝此类故障的发生,需进行复用段节点网元配置优化,全网数据都需进行重新规划,彻底解决隐患。
6.2线路故障
由传输环网结构性问题引起的断站,其触发点主要体现在传输线路中断上。在实际工作中,光缆建成后,线路的维护管理尤为重要。當发生光缆线路中断时,要求维护人员在最短时间定位故障位置,排查出故障原因,及时处理抢通。根据实际工作经验,发生线路故障的原因主要有以下几方面:
1、通信光缆受外力影响引发的阻断。
目前,国内通信光缆线路绝大多数用的是架空和直埋,无论是架空还是直埋,不可避免都会受到外力的影响导致线路中断,例如:汽车违章超高、道路建设路基增高造成架空光缆高度不够、土建施工,建房、农田建设、兴修水利等都会引起光缆中断。
2、人为破坏。
由于对光缆线路维护宣传力度上还有不足,社会对光缆认识和重视度不够,还有一些不法分子错将光缆认作铜缆,盗割后发现时光缆又丢弃等,时有光缆被剪断等现象。
3、自然灾害引发信息线路阻断。
在通信光缆下堆放垃圾、草堆、易燃物导致火烧引起线路阻断,或清明、冬至、七月十五等祭祀活动引发山火,另外还有山洪、水灾、暴雪、台风等自然灾害引起线路中断。
4、工程施工不规范遗留隐患。
在光缆架设过程中,光缆发生弯曲或打折,或接头盒安装不规范,留下隐患,时间一长,导致内部纤芯中断。
5、一些特殊原因引起的中断。
跟光缆所处坏境有关,例如:在山林中的光缆时常被松鼠咬断等。
6、割接导致。
线路整改割接时,割接方案审核不严,资料不清,准备不充分,割接人员未提前摸清光缆,导致非割接计划内的光缆误被割接中断。
7、其它原因。
除上述原因,还有一些其它因素,如打鸟、在光缆近距离燃放烟花爆竹、打井、取土等。
针对上述问题,主要的措施是组织做好宣传,增强民众保护光缆的意识,加大巡检力度,紧盯施工动态,做好施工现场的看护,发现隐患及时处理,对操作人员进行培训,增强其规范操作意识,梳理建立线缆资源资料档案,做好标识,针对特殊情况如鼠患严重的区域替换铠装光缆等。
6.3传输设备故障
1、硬件故障。
此类问题解决比较简单,主要是加强监控,发现告警及时查看,及时更换故障板件。日常要加强预检预修,做好设备巡检和倒换测试,严格按照作业计划开展日常维护;关键网元的备品备件准备充分并做好现场管理;加强传输设备环境的保障,做好机房空调维护,保障环境温湿度,做好机房清洁,避免恶劣环境影响设备正常运行。
2、设备配置问题。
传输设备有些板件需要有1+1或N+1冗余,但为了降低投资成本,有些设备的冗余备份板件被简配,一旦硬件故障或运行不稳定,直接影响业务。此类问题的根本性解决还是要在工程设计和规划上,做好一定量的冗余,以在设备在故障时能够倒换到冗余板件上,避免影响业务。数据配置,做好规范,避免时隙交叉配置,定期开展数据检查,做好数据优化。
3、尾纤、法兰盘故障。
此类问题较多见,发现问题就要及时清洁或更换处理。在选购时要注意选购质量过硬的产品。施工要规范,特别是要紧固好,标签要清晰。
4、光功率不足。
这种情况通常可能是由于光纤质量不好(某个地方弯曲太厉害或者光纤头子有灰尘),或者是传输距离太远引起光衰耗过大,还有可能就是OLT侧光模块老化,设备发光强度不够。此类问题需要进行针对性地解决,光纤质量不好要直接整改,距离太长则要增加中继站。模块故障要及时更换。这些处置方式都要尽量在故障没有太扩大的情况下及时解决。定期检查光功率,发现到达临界值或在不断下降,就要着手检查并及时处置,避免随时间推移最终影响业务。
6.4典型故障案例
典型案例一:某基站8月份出现5次断站,且闪断12次。处理过程:前期出现闪断,通过查询历史告警,未发现有效性告警信息,到基站机房内也未查出断站原因。再次发生断站后,网管出现光路故障告警,维护人员到现场后逐步从设备端到传输端再到线路进行排查,最终发现线杆上光缆接头盒固定线缆断开,尾纤弯折角度较大,且有断纤现象,重新熔纤后,站点恢复。
典型案例二:9月某基站发生超频断站。处理过程:经查,该站为6月份新开3G站点,出现频繁断站后,从网管仔细查询告警,并比对前期的告警和RNC上的历史告警,发现该站点之前也有中断过,但中断时间较短。通过这一现象,基站专业联系了传输专业核查传输网管历史告警,发现每天断站伴随着传输信令中断,有光路过欠告警。经故障排查,发现该站点为630设备所带,传输距离较远,中间光路跳转过多(两端间经4次跳转),光衰过大。在中间段新增传输设备后,光路过欠告警消失,基站恢复稳定运行。
典型案例三:12月23 日9时55分,某分公司10G传输南环交换局—宁国五里铺开发区段光路因同缆的宣城—宁国二干光缆被市政施工挖断而中断,在该处传输故障抢通过程中,10时53分,该10G环宁国五里铺开发区(收)—绩溪城关(发)单纤光路中断(松鼠咬),造成10G传输南环开环,环上宁国五里铺开发区网元脱网,其辖带2/3G累计169个基站大面积中断,通过调换备用纤芯, 10G南环光路交换局—五里铺开发区段光路单向恢复,10G传输业务恢复,大面积中断的169个2/3G基站恢复。后期将该大环整改分裂为多个小环后,隐患消除。
七、结束语
基站发生“三超”断站的原因有多种,以上仅就作为主因的传输原因进行了分析和探讨,并通过实施专项整治取得了一些成效。对于动力配套原因、市电故障等也占较大比例的问题进行专项整治,对“三超”断站进行名单制管理,逐个解决,切实减少了断站,特别是“三超”断站的发生,有效提高了网络安全与客户感知度,也为如火如荼开展中的4G网络建设和维护做好保障。
联系人:张丽娟
中国联通安徽省分公司运行维护部
电话:0551-65280368
手机:18655150883
地址:合肥市政务区祁门路1669号
邮编:230061