黄宏栋,刘中健,詹鹏飞,孔镇
(1 中国移动通信集团广东有限公司,广州 510640;2 中国移动通信集团公司,北京 100032)
边缘节点定义为:子网路径对接的参考点为边缘节点。本文中的子网路径限定为子网中一个边界出口到另一个边界出口的连接(如图1)。具体到国际电路构成中的子网路径就存在封闭子网路径、半开子网路径以及全开子网路径,所谓封闭子网路径就是源目出口在同一个子网内且能够在现有网管中进行管理,半开子网路径仅部分能够在自有网管中进行管理(如离境系统),全开子网路径也即黑匣子路径,由第三方提供,无法在自有网管对其监管。
图1 子网路径
基于上面的定义,边缘节点根据电路的不同而不同,可以通过程序自动进行判断,如一般情况下半开子网路径与封闭子网路径的对接点为离境系统的边缘节点,封闭子网路径与封闭子网路径的对接点为两个骨干网的边缘节点,全开子网路径与封闭子网络经的对接点为骨干网与省干或其他租用电路的边缘节点。
国际业务电路由各运营商提供的域内电路(下称运营商电路)级联构成,如一条香港—法兰克福的电路由中国移动提供的以诸如香港—蒙古国x电路、俄罗斯电信电路以及其他运营商提供的运营商电路串接而成,最终形成一条从香港到法兰克福的端到端的国际业务传输通道。运营商电路是由运营商或服务商提供的域内电路,其定义为一序列子网路径聚合组成(如图2所示)。
路径由A端出口、Z端出口以及路由组成,路由由直达通道和交叉连接组成(如图3所示)。
段即通常所说的再生段和复用段,本文特指复用段。
图2 电路与路径示例
图3 路径
直达通道即两个相邻交叉矩阵之间的ODU通道,如波道为100 Gbit/s带宽OTN的相邻两个OTU4终结点之间的ODU4通道(未经解复用也未经交叉连接)以及ODU4通道解复用出来的ODU2、ODU1、ODU0子通道(未经解复用也未经交叉连接)。
在对华为、中兴和烽火OTN告警信号流进行分析后总结得出:在单个子网路径的情况下,本端支路侧引入的告警,在子网路径另一端支路侧产生对告或直接下插到客户设备,如图4(1)中A站的client(支路)侧接收到的R_LOS(信号丢失)、R_LOF(帧丢失)、MSAIS(复用段告警指示信号)在B站client(支路)侧出现REM_SF(远端信号失效),相应的在B站的客户设备上呈现出R_LOF和MS-AIS告警,而A站的client侧接收到误码则直接传送到B站客户设备。在子网路径中间部分检测到的通道级告警在本子网路径末端的支路侧不一定会有告警,而支路侧对接的客户设备会检测到告警,通道级性能告警在下游客户设备上的体现为检测到误码,在图4(1)中B站的WDM(波分)侧收到的性能告警DEG(劣化)、EXC(超门限)在B站支路侧没有告警,但B站客户设备上接收到信号误码,而B站的WDM(波分)侧收到的通道级故障告警AIS(告警指示信号)、LOM(复帧丢失)、LOF(帧丢失)、OCI(开放连接指示,一般是缺少交叉连接造成)、LOS(信号丢失)以及LCK(维护锁定)在B站支路侧也没有告警,但B站客户设备上接收到R_LOF告警。
国际电路通常由多个子网路径串联组成,上游子网路径的告警会影响下游子网路径告警的呈现,将电路按照上述模型切分成多条子网路径进行迭代分析。即将图4(1)中的客户设备替换为下游子网路径进行分析,如图4(2)。从图4(2)中可以看出,此时子网路径2的B站支路侧接收到从子网路径1传送过来的告警信号,然后子网路径2按照上述规则将告警传送到C站客户设备或下游子网路径的C站支路侧。
根据上述分析结论,本算法的核心思想为:通过检测支路侧告警来定位根源故障所在的子网路径,找到根源子网路径后根据告警信号流确定具体的“段”位置,结合光层告警信号流关系,找到真正的故障源。
(1) 当告警为OTU 级别以上的告警,设置该段子通道相关联的电路的通道级级电路级告警予以忽略,进行光层根源告警分析;
(2) 根据告警端口找到关联电路,切分成多个串联的子网路径;
(3) 定位故障所在的子网路径,具体分析见3.2;
(4) 定位根源告警所在的段;
(5) 分析光层故障(如果是光层故障)位置。
图4 级联子网路径电路告警信号流迭代分析
路由中每段是否存在支路告警,支路端口关键告警如表1所示。本次研究的对象为国际电路,目前承载在OTN网络上的国际专线主要以STM-64、10 GE WAN和10 GE LAN为主,因此本研究以这三大类特征研究为重点,关注的也为常见告警:非OTN信号支路侧信号以及子网通道级的OTUk层告警:OTUk_AIS、OTUk_LOM、OTUk_LOF、OTUk_TIM ODUk_PM_AIS和ODUk层告警:ODUk_PM_OCI、ODUk_PM_LCK、OTUk_DEG、ODUk_PM_DEG。
3.2.1 华为告警信号流规律总结
当告警发生在中间通道时(子网路径中间)时,在下游站支路侧要么没有告警,要么看不到告警(透传到下游相邻子网路径或客户设备),当告警从本站支路侧引入时,对端站支路侧没有告警或者包含告警REM_SF(远端信号失效)/REM_SD(远端信号劣化),故确定是否支路告警以A站支路侧告警检测为主,B站支路侧告警用于确认和复核,或在半开路径中用于确认是否为外部引起,如离境电路,可在境内落地支路口观测告警是否存在REM_SF或REM_SD。
表1 支路侧关键告警
3.2.2 中兴告警信号流规律总结
本站支路侧引入的告警在对端站支路侧体现为OPU_CSF或与本站支路侧一样,即复制了本站支路侧告警(如RS_DEG、B1_SD、MS-AIS),如果告警为中间通道引入,在下游站支路侧告警体现为包含ODU_AIS或没有告警。因此在程序处理时,处理方法与华为区别不大。
3.2.3 烽火告警信号流规律总结
烽火本站支路侧引入告警在末站支路侧告警体现为Port_OPU2告警,且告警体现为FDI、RS_LOF、RS_SD、REM_FAULT;中间通道引入的告警体现为PORT_ODU2(性能类)和PORT_OPU2:PLM(故障类)且在相关的线路侧有ODU级AIS告警,告警处理方法也与华为类似。
综上,区分告警属于本路径内还是其他路径引入是可以程序实现的,算法伪代码如图5。算法的思路为:
(1) 对电路组成中的每条子网路径,确定子网设备的提供商,根据设备商设置入支路口特征告警、出支路口特征告警以及通道特征告警。
(2) 检查子网路径的类型,设置子网类型参数。
(3) 根据子网类型和特征告警定位根源告警所在的子网。
对封闭类型:如果入支路口有路径特征告警或出支路口有路径特征告警,则检查上游子网路径,如有通道特征告警或出支路口有通道故障特征告警,在本子网查找根源告警。
对半开类型:如果出支路口有路径特征告警或前一段子网路径的入支路口检查到路径特征告警,判断为半开路径另外一端的问题,如果有通道特征告警或出支路口有通道故障特征告警,在本子网查找根源告警。
图5 算法伪代码
对全开路径,程序发出提示。
在确定根源告警所在的子网路径后,就可以通过分析通道告警确定告警的根源位置。
展开本段子网路径模型形成树形结构,依次为子网路径、低阶ODU通道、高阶ODU通道、OTU、OMS、OTS。
根据通道正向第一个主告警与反方向第一个BDI确定告警的所在的低阶直达ODU通道。
依次往高阶通道查找:正向第一个主告警与反方向第一个BDI确定告警的所在的该级直达ODU通道,直到没有更高阶的ODU或OTU告警或性能告警。
如果最后确定的告警位置为ODU层级,检查是否OCI、LCK或TIM,如果是,提示检查对应的交叉连接、锁定操作以及跟踪设置,如果是其他通道告警,提示检查其他如帧配置等并检查是否存在硬件故障。
如果前述步骤确定的告警位置为OTU层级,按照OTU→OMS→OTS依次检查告警或性能。
如果最后确定的告警位置为OTU层级,则建议检查单波性能和故障,单波性能可通过程序比较性能基线(参考值),看是否存在变动,如性能无变化,提升检查是否为硬件问题(如OTU4_LOF可能因为NS4板隐性故障引起)。
如最后确定的告警位于OTS段,则检查是否光缆中断或性能劣化,性能检查通过比较基线数据(参考值)或比较变动值发现。
国际传输专线组网具有其独有的特性,基于其特性,本文定义了便于机器判断的边缘节点、电路、路径以及段和直达通道,在这些基本定义的基础上,通过迭代分析告警信号流传递的规律,总结从电路层到路径层、通道层,然后到光层,依次分析告警或故障的根源因素,给出了机器可实现的故障定位算法。
[1] 凌海燕,刘志增,王毅,等. 国际传输系统的保护策略与应用[J]. 数字通信世界, 2013(10):60-62.
[2] 刘新宇. 国际SDH传输系统的设计规划与网络保护模式的探讨[D].北京:北京邮电大学,2010.
[3] 叶胤. 国际传输网络组网方案探讨[J]. 电信工程技术与标准化, 2008,21(5):47-50.
[4] 沈青,孟凡,王玮,等. 超高速、超长距传输系统性能分析[J].电信工程技术与标准化, 2017,30(7):78-81.