张 略,邱丽霓
(国网福建信通公司,福建 福州 350001)
随着智能电网的建设,大容量骨干OTN传输等通信系统的运行,电力通信网在网络技术多样化、网络结构复杂化、网络规模巨型化,以及对网络所承载业务质量要求不断提高的同时,在电力系统中的作用也日益重要。为了检验通信应急处置措施、应急汇报流程及应急预案的科学性和有效性;检验通信运维人员应对突发事件的应急处置能力和效果,提高运维人员通信应急保障能力和工作水平,各通信运维单位均建立了通信常态应急演练机制,由于通信系统是生产系统,传统的通信传输网络反事故演习活动主要采用“模拟操作”的形式[1]。具体地说,演习导演组根据预设的反事故演习脚本发布模拟故障,参演通信调度给参演通信运维人员下达演习模拟指令,参演通信运维人员根据演习模拟调度指令现场模拟操作通信设备,并根据经验知识、运行资料、应急预案汇报模拟操作后本端的故障现象。“模拟操作”式演习的本质是,采用人脑、运行资料或应急预案中虚拟的通信网代替实际的通信网作为演习网络,这种传统的反事故演习一方面相对于实际通信网上的突发事件、故障处理过程不够形象,演习中的故障定位、故障处理、故障现象都受制于演习人员的经验知识,从而导致演习往往流于形式,效果并不理想;另一方面传统的反事故演习活动需要实际的网络环境调配,人为制造的现实故障以及其他人力、物力的全力配合。然而,现有电力通信网的运行维护工作面临着网络结构复杂、维护要求高、故障排查难等问题,继续组织传统的反事故演习活动将耗费巨大的人力、物力以及财力,甚至存在过于复杂,难以开展的风险[2]。
面对目前复杂多变的通信网环境,如何节省实际的反事故演习活动耗费的巨大人力、物力资源,而又达到贴近实际的反事故演习效果,使通信人员掌握和提高应急、抢修状态下的故障判断和处理能力,对于保障通信网的安全稳定运行起着不容忽视的作用。随着计算机技术的不断进步和通信技术的不断发展,利用计算机技术、通信网络管理技术、网络仿真技术研究通信网反事故演习系统,可以迅速提高通信人员故障判断和处理的速度和准确性,积累故障处理经验,全面提升业务技术知识和运行维护管理水平,保证通信网各类业务的信息畅通,为安全生产提供可靠的通信保证。目前迫切需要设计一套规范的反事故演习管理流程,并实现一种基于通信网仿真平台及通信网络告警关联分析,以图形界面为主,操作直观的反事故演习系统。
通信反事故演习系统软件部分由电力通信系统仿真平台、仿真平台管理、反事故演习应用、辅助支撑、模拟数据接口和呈现模块这几个部分构成,如图1所示。以下对其主要功能模块进行简介。
图1 系统软件结构图
在电力通信系统仿真平台中内嵌有一整套离线的资源数据,该套数据与通信资源管理系统中的资源数据一致,完整仿真整个电力通信网络的网络拓扑、网元、设备面板、机盘、端口等通信资源。仿真平台管理、反事故演习应用、辅助支撑等应用均采用本套数据。但演习过程中产生的告警信息、故障信息不会影响通信资源管理系统或其他通信生产运行系统的正常运行。
为保证模拟环境下的数据与电力系统现有在运行的通信资源管理系统中数据的同步,本系统配置了一个仿真数据接口模块,该模块采用定时同步的方式对电力通信系统仿真平台中的数据进行维护。
模拟通信反事故演习既可以在通信资源管理系统的仿真通信网络上进行,也可以在仿真网络基础上进行修改后的网络甚至新建一个模拟通信网络上进行。通过仿真平台管理模块可以对演习网络进行配置来更改或增删演习的通信网络的网元、光缆、逻辑系统等资源。该模块包括通信设备建模、通信网络建模及故障、告警模拟三个模块。在通信模拟管理平台中,通过通信设备建模模块能够配置现有通信网络中各种类型的设备,包括机框、机槽、机盘、端口以及业务等资源信息。从而实现在系统中新增、修改网元,维护并呈现各种通信设备的设备面板图和相关的资源信息功能。
电力通信传输网络结构复杂,电力通信传输网络主要逻辑系统有二纤双向通道保护环、1+1线性复用段保护、SNCP子网保护等,通一条业务路由也可能包括多个逻辑系统的组合,如环带链等,在不同的网络结构环境中,发生网络故障时,对应的网络现象和处理方法也不相同。例如当环状网络中一个网元节点故障后,将会中断路由经过该节点的无保护业务。无保护链网络一个网元节点故障后,对所有经过故障点的业务都有影响。环状网络在发生N-1或N-2故障时,影响的业务范围也不一致。在故障处理过程中,随着故障现象的消失,相应业务也应恢复。针对这些情况,通信网络建模模块能够在演习系统中配置实现各种复杂结构的通信网络。通信网络系统组织示意图见图2。
图2 系统网络拓扑示意图
通信故障处理是通信网络维护工作中的重点,通信运维人员对通信网络故障的定位、处理的技能、经验直接关系到通信网络维护的效率。通过对告警信号流的分析及故障处理的经验总结,为了达到清晰明了的模拟效果,故障、告警模拟模块可以根据通信网络反事故演习系统设置的典型故障(线路故障和设备故障:光缆、设备中断、业务板卡故障等)模拟产生相应的常见指标性告警。因在现实的工作环境中会出现对设备检修工作造成通信系统正常告警,故还可模拟检修(光缆检修和设备检修)造成的相应设备告警。该系统中所模拟的故障和告警对运营支撑系统中的故障和告警是相互独立的,不会对运营支撑系统造成影响,运营支撑系统中的实际设备告警也不会显示在反事故演习系统中。
反事故演习应用模块提供演习配置管理、演习执行模拟、导演实时监视、演习评价总结、演习数据管理等功能模块。
演习配置管理模块是演习预案的规划设计模块,此模块实现演习导演对于演习网络的故障配置功能,完成网络故障配置后系统通过故障、告警模拟模块自动模拟产生相应故障告警,导演界面和演员界面都可以查询告警信息。
演习执行模拟模块实现演习过程中演习人员模拟进行故障诊断处理的功能,提供对于网络中发生的模拟故障进行查看、分析、定位以及故障处理、编制故障处理报告等功能。在故障处理过程中,演习人员可以在仿真系统中通过进行拔纤、光源、光功率计测试、OTDR测试、更换板卡、光缆抢修、业务迂回等操作恢复通信系统正常运行状态。通过该模块提供的操作直观、形象,符合实际故障处理操作流程的使用界面,有助于提高演习人员故障处理、仪表操作的熟练程度和正确性。仪表操作界面示意见图3。
导演实时监视模块提供演习导演、观摩嘉宾对参演人员的当前故障处理情况进行实时查看,导演实时监视界面与演员演习界面类似但又有差别,例如导演在设置网络故障点后在导演界面还会在故障点显示故障图标“×”,而演员界面则不显示该故障图标等。导演还可通过查阅演员操作日志了解演员各项操作的耗时及顺序。
图3 模拟OTDR测试界面图
演习评价总结提供演习结束后进行评价总结的功能,系统对操作过程中误断运行纤芯、OTDR测试前未断开对侧运行设备纤芯、仪表使用时的量程、波长选择不当等误操作进行记录并自动扣分,扣分结果与导演、观摩嘉宾的人工评分按一定比例生成参演人员的演习成绩。
演习数据管理模块对演习的基础数据进行维护,数据维护包括评分规则维护和局站间距维护两个子模块。评分规则维护提供对参演人员的故障分析处理所进行的操作进行管理并对错误操作进行扣分标准设定的功能。局站间距维护提供模拟演习人员抵达现场所需的局站间的距离和耗时信息的管理功能。
辅助支撑模块提供系统用户的安全管理、角色管理、日志管理等功能,对系统用户的角色、权限进行管理,并以日志形式保存用户的登录信息、操作信息等。
经过试运行,该通信反事故演习系统在节省反事故演习所耗费的人力、物力资源的的条件下,提供了更贴近实际的网络环境,符合实际的演习流程方案。系统界面以图形为主形象地展现了对事故进行模拟、处理和评估的过程,为通信网运维人员提供有效的故障判断处理工具、为通信网培训工作提供方便的学习评估方式,使通信运维人员掌握和提高应对突发事件及故障处理时的故障分析、定位、处理能力,积累故障处理经验,提高故障处理速度,为减少或避免异常和故障发生后造成重大损失提供了最为有效的防范措施。达到了全面提升业务技术知识和运行维护管理水平,有效提高网络/业务规划和优化水平,为电网安全生产提供可靠的通信保证的目标。
[1] 王爱民.基于多Agent协作技术的通信反事故演习系统[D].南京:东南大学,2010.
[2] 宫平平.通信网反事故演习系统的设计与实现 [D].北京:北京邮电大学,2010.