段超越,张志,晁夫君,刘迪
(中国电信股份有限公司山东分公司,山东 济南 250101)
山东省作为经济和文化大省,通信业务发展异常迅猛,对于运营商来说,随着5G的逐渐商用,不同的用户也对业务提出了差异化的需求。而新的业务需求对传输网的承载能力也提出了更高的要求。为满足业务低时延、大带宽、网络简化的发展需要,OXC+ROADM组网方式已成为未来网络发展的一个方向[1]。2019年10月建成全国首例OXC+ROADM组网方式的全光传输网络,覆盖全省17地市的所有核心机房全Mash组网,启用光层ASON技术,减少各站点的尾纤串接,方便运维,实现业务的灵活配置。
OXC(Optical Cross Connect,光交叉连接)技术采用全光背板创新架构,如图1,解决了ROADM技术的复杂连纤所有可能引发的尾纤错连、尾纤故障须现场配合配查导致故障排查时间过长等问题。ON32、OT3232、DAPXF等板卡高度集成,减少了机房占用面积,降低了能耗,可以实现业务重路由、故障定位与隔离等功能。减少了大量光层板卡之间的内部光纤连接,相比传统OTN组网方案具有简化运维、可靠性高、时延低、业务灵活调度等特点[2]。
ROADM(Reconfigurable Optical Add-Drop Multiplexer,可重构光分插复用器)是一种使用在密集波分复用(DWDM)系统中的器件或设备,其作用是通过网管远程的重新配置,可以动态上路或下路业务波长,实现波长无关、方向无关的灵活业务调度[3]。
ASON(Automatically Switched Optical Network)技术是指在传统OTN组网的网络中添加一个控制平面,实现光网络连接自动交换功能,控制平面元件根据网络资源使用一系列协议建立一个ASON域,动态的配置光传输网络,打破了传统网络中业务升级的很多限制,具有以下特点:①支持重路由和优化时波长自动调整,可有效解决波长冲突问题。②新建业务支持端到端的业务自动配置,并且可自动分配波长。③支持Mesh组网保护、拓扑自动发现,增强了网络的可生存性,丰富的路由选择策略使得网络可控可靠。④支持差异化服务,根据客户层信号的业务等级决定所需要的保护等级。⑤支持流量工程控制,网络可根据客户层的业务需求,实时动态地调整网络的逻辑拓扑,实现了网络资源的最佳配置。
传统OTN组网方式主要以环形和链形为主,配以OMSP保护或单板1+1保护等,经过多个站点的尾纤跳接和光电交叉转换,增大了维护难度和网络时延。为了测试OXC+ROADM组网方式与传统OTN组网方式是否提升网络维护的便捷性[4],在OXC+ROADM组网系统和传统OTN组网系统承载在相同站点与光缆路由的情况下对该网络分别从时延、功耗、保护倒换时间等进行了对比测试。
测试方式:如图2,开通A-B、A-C、A-D、A-E的业务,设定每个OMS段为固定的75km,进行仪表测试对比验证,精确到小数点后两位(单位ms),如表1。
表1 测试对比数据(单位:ms)
测试结果:OXC+ROADM组网时延在多数情况下小于传统OTN组网,分析主要原因:OXC+ROADM组网系统只在源宿端上下业务时进行了光电交叉转换,传统OTN组网为每个站点都需要进行光电交叉转换,而业务每经过一次光电交叉转换,业务时延会相对增加。OXC+ROADM组网系统系统承载的业务全程为光层的方向与波长调度,相较于传统OTN组网系统减少了光电交叉转换,从而降低了时延[5]。
测试方式:①调整测试系统处于正常工作状态,通过功率测试仪,记录此时设备的实际功耗P0;②添加1块板卡,调整系统处于正常工作状态,记录此时设备的实际功耗P1;③经过对机房列头柜电源读数,对比OXC设备与ROADM光层设备和传统OTN组网功耗;④选取某核心机房OXC设备与某城域网ROADM系统光层设备和进行功耗比对。⑤按照上述测量方法,依次增加单板,计量各系统的功耗值。
表2 测试中功能消耗表
测试结果:以上测试结果均为设备在轻载情况下的功耗,由测试结果可以看出ROADM与传统OTN组网方式功耗差异并不大,只有OXC设备功耗远小于其他组网设备功耗。
测试方式:①如图3,光层ASON特性下分场景配置一条A-D的银级智能业务:②业务路径为A-B-C-D,A-B配有OMSP保护,预置路径为A-E-F-G-D,波长选择Ch1,在D打环,A端挂表,观察业务连通性;③中断A-B的主用光纤,通过仪表观察业务是否恢复并记录恢复时间;④继续中断A-B的备用光纤,通过仪表观察业务是否恢复并记录恢复时间;⑤将预置路径删除;⑥将智能业务调整为不可变波长,继续②和③步骤,通过仪表观察业务是否恢复并记录恢复时间;⑦将智能业务调整为可变波长,继续②和③步骤,通过仪表观察业务是否恢复并记录恢复时间;⑧选取间隔网元跳数不同的A-B业务,按照上述步骤重新测试并记录恢复时间。
表3 测试时间中波长记录表
测试结果:OMSP光跨段保护倒换时间可以达到50m以内;银级智能业务的重路由时间为秒级,在业务量轻载的情况下增加预置路由对倒换时间提升有限,可参照网络资源自行选择。
通过测试对比能够看出OXC+ROADM组网方式在一定程度上提升了传输质量,使网络更加智能化、灵活度更高、维护更加便利。但是科学技术的发展本身也是一把双刃剑,在为我们提供更灵活、便利的同时也显现出了一些其他的问题:①设备的高度集成,方便的同时设备级也为现网带来了更大的网络风险;②网络的高灵活性对维护人员提出了更高的专业诉求;③OXC+ROADM组网与传统OTN组网的差异化,已不能用传统网络的维护方式来维护它,急需一套有针对性的维护策略[6]。
自OXC+ROADM组网系统验收入网已试运行9个月,维护期间遇到了诸多问题,相关案例及维护经验如下:
(1)问题描述:如图4,A站点为OXC站点,B站点为ROADM站点,B站收A站备用光路上报MUT_LOS告警,排查系统数据后发现告警是由于A站OXC设备某槽位ON32P单板备用通道发光跌落了20DB导致。
(2)原因分析:①检查设备后台日志,A站OXC设备某槽位ON32P单板备用光路业务信号单板侧衰减是20dB(阻断),而主机侧衰减配置数据为0。分析主机和单板操作日志,确定出现问题的时间段没有操作网元记录,并且主机没有给单板下发异常衰减配置(20dB),由此排除外部人工误操作可能性;②继续分析单板硬件,如图5,通过DFX接口回读衰减的DA值,与单板实际下发的驱动电流一致,由此确认硬件器件正常(图1);③如图6,为ON32P板卡的信号流图,分析ON32P单板历史光功率性能,发现OSC光口接收无光,上报OSC_LOS告警,确认是上游OSC光模块型号误配导致。
ON32P OSC VOA具备自动调节功能,当OSC模块在出现OSC_LOS告警的时候,会以一分钟的周期把自身VOA衰减设置一次最大值(20dB)和最小值(0dB),用于判断是输入光功率过高导致的OSC_LOS告警,还是光功率过低导致的告警,而现网出现问题的异常衰减值也比较有规律,均处于最大值和最小值,由此判定是OSC模块调节VOA时误调了主光路VOA衰减。OSC模块上的VOA和主光路VOA共用IIC总线,三个衰减都挂在同一个IIC上。软件在查询和设置衰减的时候,使用了信号量控制,但是代码排查发现软件获取了三个同名信号量。实际上,同一个IIC应该用一个信号量控制,用以保证不同任务访问和设置不会被相互干扰。而三个同名信号量,会造成互斥访问和设置失效而产生时序紊乱的问题,也就是说,ON32P单板会概率性出现设置OSC VOA实际上设置了主光路的VOA的问题。
搭建实验环境进行测试后发现,以较短的周期调节OSC模块VOA衰减,同时查询主光路衰减,ON32P单板都出现衰减异常变化,与现网现象基本一致。
(3)问题结论:ON32P单板软件控制VOA衰减设置的信号量互斥存在问题,导致在OSC_LOS时,原本应该调节OSC VOA,错误的将衰减值调节到了主光路的VOA,导致主光路VOA衰减值发生变化,影响对应链路业务。
(4)解决措施:板卡软件打补丁后恢复。
(1)问题描述:如图7有A-B-C三个站点承载一条A-C的100G电路,某日查看网管发现该电路单波处在重路由上。
(2)原因分析:查看原始路径发现B-C前一日凌晨有调整纤芯割接,网管重路由时间与调整纤芯时间一致。ROADM系统对光层段衰耗要求比较严格,当主通道性能浮动时,有几率会触发单波重路由,单波重路由在主通道性能恢复后无法自动倒回,需手动倒回。
(3)解决措施:ROADM网络对段衰耗要求比较严格,必须使用精细化的维护才能确保其网络优势的体现,日常维护和割接必须严格按照指标完成,跨段的问题累计将直接导致倒换的失败。针对这一问题,可利用华为网管SOM工具,导出光性能报表,重点关注光纤衰耗大于设计值的段落,并安排优化工作。为更好的确保网络业务的安全性,对业务使用率超过50%的OMS段在维护中也要多加关注[7]。
(1)问题描述:如图8有A-B-C三个站点,B-C段落承载6条100G业务,当B-C之间发生光缆中断时,导致现网6条100G业务中断,触发重路由,经维护人员核实6条业务却只恢复了5条。
(2)原因分析:建设网络初期考虑到后期维护和资源准确性的问题,规定在OXC+ROADM系统上开通业务时,将业务设置为禁止可变波长从路由。而B站只有两个OMS段出口,当B-C发生光缆中断后,B站发生光层ASON倒换,当协议发生后,因A-B原波长已经被占用而其波长不可变导致重路由失败。
(3)解决措施:将ROADM现网中所有智能路径更改为可变波长,建立资源管理系统,制定重路由倒回策略,故障恢复后业务必须倒回原始路由,如需固化,应将更改后路由更新至资源管理系统。
(1)问题描述:如图9为OXC+ROADM组网方式示意图,其中包含三种情况:①OXC直接对接ROADM站点,如OXC对接ROADM5;②OXC对接ROADM站点中间有一个中继站,如OXC对接ROADM1、ROADM2、ROADM3;③OXC对接ROADM站点中间有两个或多个中继站,如OXC对接ROADM4。
OXC+ROADM组网系统启用光层ASON后会发出8DB的白光,维护中我们发现与OXC对接的ROADM站点中间的OLA站都无法透传8DB白光,并且上报CPW_OMS_TEL_OCHMIS告警,由于光层ASON需要8DB白光对光路进行性能检测来确认光路性能。所以如果没有8DB白光,会出现两个问题:其他OMS段出现故障时,无法将业务重路由至该OMS段,比如:段落2发生光缆中断故障,需要将受影响业务重路由,但是因为其他段落的8DB检测白光无法透传,光层ASON无法获取该段落是否性能正常,所以无法重路由,导致业务中断。对现网的安全运行造成了一定的安全隐患[8]。
(2)原因分析:经过分析,设备硬件及软件均正常,8DB白光无法透传的原因为OXC设备与下游站点对接的DAPXF板卡波数参数不匹配,OXC设备的波数参数为C96,DAPXF板卡参数为C80,当波数参数不匹配时导致无法透传8DB白光。
(3)解决措施:将与OXC下游站点的DAPXF板卡波数参数与OXC设备对应。
基于OXC技术的Mesh化组网改变了传统的波分网络布局,虽然前期设备和光缆的投资增加了,但是给后期的系统扩容和业务开通提供了更大的便利。对于业务来说,从根本上解决了业务的保护问题,极大地提升了网络的安全性。相信随着维护经验的积累和资源管理系统的完善,很多问题也能够迎刃而解。也希望本文对维护及网络资源管理人员有所帮助,进而构建出更加“综合、高效、智能”的传输网络。