余艳 张炳 易鸣 中国电信股份有限公司江西分公司无线网络优化中心 南昌市 330046
关键字:故障自动定位 集约化 市县环网
长期以来,传输故障工单都是基于告警派发,一线人员收到工单后,需要根据不同网元、单板、端口上报的告警信息人工分析故障原因和段落。自传输故障工单集约化管理后,各厂家网管发现的告警不再经各级监控中心转派,而是上报给服保系统直接派到各处理工位,节省中间转派环节时长,将故障处理时间更多的留给一线,但此举同时弱化了省、市相关专业管控条线对市县、县县网络中断故障的管控,长时间没人抢修、没有对故障进行应急调度,极易导致环网节点脱网,严重时还会导致整个县局几万甚至上十万用户业务全部中断,严重影响客户感知。
为提高故障处理效率,缩短故障判断时长,江西电信通过2年的迭代创新,开发出了系统故障自动定位系统,可同步监控不同厂家设备类型的网络故障,及时督促地市及时抢修,有计划的对其进行应急调度,确保市县节点不脱网,进一步打造高质量的网络,提升客户服务能力和水平,助力企业高质量跨越式发展。
因省内使用的传输设备和网管涵盖不同厂商设备,需在第三方网管上实时采集厂商网管的告警数据并加以分析,从而实现故障的自动定位。整个系统架构包括:厂家网管、采集控制层、数据适配层、综合网管数据中心。
(1)厂家网管:华为、中兴、烽火等厂家网管。
(2)采集控制层:通过接口对各厂家网管或者其他外部系统接入的配置、告警、性能、消息、日志、操作指令等数据进行采集。
(3)数据适配层:由于各厂家的数据格式不一样,需要根据采集同步到数据进行适配整合成传输综合网管系统能识别的数据格式。
(4)综合网管数据中心:对适配后的数据进行故障分析,将故障结果按照模板展示出来并通过短信平台发送出去。
图1 系统架构模型图
本系统主要通过对网管基础数据采集适配,实现了基础数据的还原,根据采集同步到的告警信息进行自动判断和定位。
各厂商网管与综合网管之间的接口采取了集团规范的I2接口,I2接口相比对corba接口增加了南向的内容,但同时也简化了corba接口的部分北向内容,因此需要由传输综合网管配置适配程序对同步到的配置数据进行适配转换,形成传输系统的资源格式。
图2 基础数据还原流程图
(1)对链型组网和环形组网的OTN网络,传输综合网管通过I2接口查询厂家网管拓扑子网、OMS通道,OTS通道信息,并分别还原出传输OTN环网、传输复用段、传输系统段等内容。
图3 还原出的OTN环网图
(2)对链形、相交环、相切环、叠加环、环带链等各种复杂组网方式的SDH网络,通过查询厂家网管的所有光纤连接信息、纤缆连接的A端和Z端端口、保护组保护关系(工作端口和保护端口),保存在传输综合网管数据库中,形成一个自有的资源池,在资源池的基础上制定判断逻辑进行反复搜寻和判断。
图4 还原出的SDH环网图
通过以上逻辑和方法判断形成的传输环网、复用段、系统段数据,增量更新资源池平台,并将还原出的传输环网与专业网管的网元、拓扑连接形成关联数据,用于传输环网故障定位分析。
基于还原出来的OTN、SDH传输环网、复用段、系统段数据,制定了故障定位总体流程,并对故障告警定位判断规则进行了分类细化。
(1)故障定位分析总体流程如下:
图5 故障定位分析总体流程
(2)故障告警定位判断规则如下:
当系统出现中断类的告警时,按照以下规则进行分析:
图6 复用段示意图
分析的中断类告警对象:OSC信号丢失,输入合路信号丢失,光线路信号丢失。
判断规则:
I:OSC信号丢失出现的段落为故障段落。
II:非OSC信号丢失的告警,互收告警的段落为故障段落,如A收B,且B收A。
III:非OSC信号丢失的告警,最靠近发端的段落为故障段落。
实现方式:首先,判断是否是中断类告警,若是,执行规则I,输出故障段落;若不是OSC信号丢失,执行规则II,再判断,是否输入故障段落;若未执行规则一和规则二,则执行规则三,对规则三的执行需要每次都进行追溯,直至找到最终段落。
(1)2019年在江西电信全省传输网络实施,目前主要用于市-县、县-县的传输故障及段落自动定位。2019年全省市县环网节点0脱网。实时中断情况及段落提示如下:
图7 综合网管故障定位结果图
(2)C3环网中断光缆故障时间达到考核要求,通过2019年10-12月数据分析发现,在创新C3传输环网故障快速定位手段后,C3光缆中断修复时长平均为311分钟,低于360分钟的考核修复时长。
图8 故障自动定位后修复时长对比图
我们将传输专业的基础数据还原方法推广到OLT双上联隐患排查行动中,助力企业2019年两千户OLT全部完成双上行隐患改造、千户OLT双上行隐患改造完成率达99.62%,顺利完成中国电信集团的考核指标。
图9 OLT双上联整治率图
江西电信为推进传输集约化维护,基于传输综合网管开发了故障自动定位系统,首次实现了跨厂家故障的统一智能分析和快速定位,有效的指导一线精准维护,进一步提高了传输基础网络的健壮性,更好的为客户提供高质量的服务。