刘 明
(华为技术有限公司全球技术服务部,广东 深圳518129)
重大节日一般是指某个国家或者地区的传统节假日、宗教节日、或者重大的体育盛会等,例如中国的春节、穆斯林朝觐hajj节、奥运会或者足球世界杯等。在这些重要节日期间,往往会出现大量用户同时试呼,话务量激增的情况,从而有可能导致信令负荷增加,网元接口拥塞,网元处理器负荷过载等问题。鉴于通信设备的综合性和复杂性,通信保障不仅仅涉及单个设备或者单种网元,因此需要建立一整套完备的通信保障解决方案。
重大节日通信保障是一个庞大复杂的系统工程,往往涉及多网元,多种传输介质,多设备供应商,而且可能出现时间跨度较大的复杂情景。根据涉及的重要活动,可以将保障工程分为如下几个重要部分:制定整体保障计划、确定保障人员组织机构、准备人力资源、评估现网网络、准备物料资源、调整现网网络、制定应急解决方案、保障演练、保障实施和职守、总结保障经验教训、恢复配置数据、后勤保障系统、风险和问题管理。同时,按照时间跨度,又可以将重大节日通信保障按照时间进度划分为三个阶段:保障准备、保障执行、保障完成,如图1所示。其中风险和问题管理、后勤保障系统是贯穿保障始终的两个模块。风险和问题管理是指在保障项目中对识别的风险和问题如何进行有效的闭环管理。所有的风险和问题必须以表格的形式记录和跟踪,每个问题都要落实到责任人,对于闭环的问题必须两次检查,检查人员必须不同于问题处理责任人,这样才能确保问题被彻底、正确的处理,避免个人处理的遗漏,对于无法闭环的问题和风险一定要给出规避方案并评估可能带来的影响,而且需要在各个保障小组中进行通报。在保障的不同阶段,各保障小组定期回顾问题的进展情况,需要总体决策的问题要及时上报。当然,良好的后勤保障系统对整个保障项目的支撑是必不可少的,车辆调度,保障人员日常安排,测试终端准备等都需要专门的小组进行负责。
任何一个重大节日通信保障必须有一个全面完备的通信保障计划。这个整体计划需要涵盖人员到位计划,物料到位计划,网络评估优化整改计划,保障演练计划,保障现场职守计划等。重大节日的通信保障项目往往时间紧迫,有一定的时间要求。所以合理安排上述计划可以保证各个模块的保障动作按时按点完成,从而确保整体保障项目的顺利实施。
图1 重大节日通信保障关系框图
清晰的保障人员组织结构可以极大地提升保障效率。保障项目自始至终面临很多问题,这些问题可能是技术问题,可能是组织沟通问题,也可能是来自保障项目外的其他问题。因此,一个有序的组织和明确的分工可以避免保障期间的紊乱以及带来不必要的干扰,从而保证整个通信保障项目顺利实施。如图2所示的人员结构中,技术问题处理组负责各不同种类网元的技术问题处理;内部事务处理组负责处理不同设备提供商之间的组织和协调;对外事务处理组负责保障项目之外的事务性工作;后勤保障组负责保障项目整体的后勤支持工作。保障项目总体决策组和总项目经理负责对四个小组上报的问题或者紧急情况进行统一协调处理和任务分配,是保障项目的最高决策机构。
在保障人员组织结构确定之后就需要开展人力资源准备工作了,按照需要人员的技能级别提出涉及每个处理组的人员构成和人数要求,并将这些人员逐一进行落实。将落实的人员逐一安排到各个小组,使其担负起相应的职责,并制定各小组组长或负责人,对小组内问题统一管理。最后需要建立统一的资源人员清单,包括联系方式等关键信息,并将清单在所有保障人员中进行传达,从而建立稳定的沟通。
对现网网络的整体评估是网络保障成功的关键,通过网络评估可以了解整体网络目前的运行情况和潜在的风险。例如现网设备数量是否能够承载高话务量的冲击,现网软硬件版本在高话务量下是否存在隐患,板件负荷是否可能过载,信令链路和话路是否会拥塞,网元各接口之间是否会出现拥塞,单网元各个处理模块之间是否均衡等。这些问题在平时低话务量情况下可能不会显现出来,但是在重大节日的高话务量冲击下就有可能爆发,从而导致不可挽回的影响。目前各个设备提供商一般都有专用的网络评估工具或者健康检查工具。使用这些工具可以很快检查出现网设备的问题,并根据输入的预测用户数或话务量输出预测评估报告。根据评估报告和专业判断就可以确定未来网络调整的基本思路和物料需求。
物料的准备在现网网络评估之后就需要准备了,根据网络评估的结论,可能出现网络设备扩容,网元板件更换,信令链路和话务电路增加等。物料资源准备时一定要考虑到物料的可获得性和物料运送到保障现场的时间。如果由于物流不畅或者其他原因导致物料无法及时到达,会使整个通信保障非常被动。尤其是对跨国的物料运输,由于周期较长,要充分考虑到物料准备、发货、清关的周期,尽可能选择合理的运输方式保证物料及时准确到达。另外,也可以对现网的备件和现存物料指定专人梳理以备不时之需。
根据网络评估和现网健康检查的结果,需要对现网网元软硬件进行一些调整。主要包括网络版本升级,网络补丁升级,网络设备板件扩容,信令链路扩容,话务电路扩容,软件licence扩容,软件参数调整,话务均衡,低速信令改高速信令,承载网IP化改造等操作。网络调整是基于网络评估的结果进行的,是保障执行阶段的重要步骤,直接影响后续的保障效果,而且对现网的调整需要在节日前全部完成,操作的频繁度会大幅增加。因此合理安排操作计划就显得非常重要。要尽可能避免同一时间对一个网络的多个网元同时进行调整;如果涉及对同一个网元的两次操作,一定要保证有足够的时间间隔进行观察监测。
制定清晰有效的通信应急预案,可以保证在突发事件情况下有效地组织资源,按照流程合理的处理危机,保证通信畅通。重大节日的应急预案一定要经过运营商和设备提供商共同评审,并且经过模拟预演,否则关键时刻一个预案要点的失误将造成满盘皆输的局面。预案必须是逻辑清晰的,可执行的,分层分级的。
重大节日的通信保障职守阶段会直接面临高话务冲击,突发问题的出现。所以在职守阶段,一定要建立合理的分工合作机制和突发问题集中决策机制。分工合作机制是指将保障职守人员分成若干小组,匹配不同的任务。例如实时监控小组专门负责监控网络上各网元的告警信息并及时知会其他小组;信息收集小组专门针对出现的紧急问题收集现网相关信息,将信息提交给问题分析处理小组;紧急技术问题处理小组专门负责处理和解决技术问题;性能分析小组专门负责对高话务下的网络性能进行实时的评估和分析,进行参数优化。各个小组是分工合作、统一行动的。任何针对网络的操作都需要知会到其他小组。突发问题集中决策机制是指当遇到重大的紧急突发问题,涉及多个网元或者多个设备提供商,此时某一个小组可能无法解决该问题,需要上升到保障项目总体决策组,由该小组的技术专家一起讨论制定相应的解决方案或者启动应急预案,并指定各小组操作执行。
保障完成后,一定要对本次保障过程中遇到的问题进行总结。这些从实战中获取的知识是非常宝贵的,将这些知识进行总结和有效管理不仅可以对该重大节日的话务模型有所了解和掌握,而且可以应用到来年的节日通信保障中去,使得下一次的保障更加有的放矢,更容易成功。
保障执行阶段可能由于应急需要对现网的某些软件参数或者数据配置做调整。所有的重要调整都是需要进行记录和备案的。这些调整过的参数或者配置可能只适应于极端情况下的应急处理,在日常的设备运行过程中并不适用而且可能带来潜在的风险。因此,在保障执行后需要统一对这些参数进行恢复。恢复之前一定要经过技术团队的审核。
保障重大节日通信通畅的重要性不言而喻。通信保障是一个复杂的系统工程,涉及人力资源、项目管理、技术支援、物资调动、关系协调等方方面面。因此,清晰全面的保障计划,强有力的计划执行以及有效的沟通是通信保障成功的关键。针对保障准备、保障执行、保障完成三个不同阶段的不同要求,一定要将各个阶段的重点保障动作进行落实,避免遗漏和疏忽。只有这样,才会在高话务量来临,突发问题出现的情况下做到游刃有余,胸有成竹,顺利完成保障任务。
[1] 郭 宝,高 谦.GPRS通信保障及应急方案分析[J].现代通信,2007,(3):77-80.
[2] 高 岩.通信行业应急保障预案体系探讨[J].通信世界,2005,(39):22-22.