(成都师范学院 网络与信息中心,四川 成都 611130)
智慧校园体系构架中包含感知层、网络层、数据层等层次结构[1].业内专家的基本共识是其中的网络层必须以高速网络为支撑,能实现随时随地的高速接入、及时可靠的传输各种数据[2].这要求其应具备完善的数据传输保护与恢复机制,同时还应满足学校一些实际应用场景的需求,比如应支持虚拟专用网的能力等.
无源光网络(PON)“可以灵活地以树形、环形或混合型等拓扑结构组网,具有带宽高、传输距离远、与以太网有很好的兼容性,支持平滑演进等特点,能快速部署千兆业务.光配线网没有有源器件,建网及运维成本低,能简化校园网络建设工程”[3],是能满足智慧校园网络层需求且适应未来网络发展的一种技术.PON 的数据传输经常采用时分复用(TDM)机制,为了改善可靠性,其中包括自动保护倒换(APS)的光层保护方案是用于处理光纤和ONU 的故障的.ITU-T G.984.1 建议了TDM-PON 可能的保护方案①中华人民共和国通信行业标准“接入网技术要求—吉比特的无源光网络(GPON)第1 部分:总体要求”.,主要是加倍光纤和ONU/OLT 设备.由于要求很多的冗余器件和连到每个ONU 的备份光纤,这些方案都不是成本最佳的.主流的PON 保护方案具有集中性,依赖OLT 检测及恢复配线光纤断或ONU 设备故障.在OLT 这种集中处理是漫长、复杂的过程,且每个ONU 需要作很多改变.
为了支持虚拟专网能力,有人提出了基于环的PON 结构[4-6].由此带来的问题是对环内的节点和链路故障的影响巨大,故设计一个可自愈、基于环的PON 结构是非常重要的.该结构主要针对现在基于树状PON 的某些限制,包括支持专网能力和提供一个全分布、成本有效的APS 方案,此方案能保护节点(ONU)和配线/主干馈线光纤的故障,且能恢复所有的网络流量,包括上行、下行和LAN数据.此外,APS 方案也能保护包括配线/主干馈线光纤断和节点故障的同时发生双重故障的组合.简单自愈环的PON 结构的主要特色是在ONU 间支持一个全分布式的控制平面,一方面用于控制ONU 间的通信,另一方面利用控制平面可实现一个全分布式的故障检测和恢复机制.
图1 描述了简单自愈环的TDM-PON 结构,其中实线表示正常状态的结构,而虚线表示冗余的保护器件.保护结构除如下描述之外与正常状态的结构完全相同:(1)一个冗余的短配线光纤环和一个主干光纤;(2)OLT 处一个冗余的收发器对;(3)一个连到每个ONU 的APS 模块.
图1 简单自愈环的TDM-PON 结构
仅看图1 中的实线,一个OLT 经10~20 km 主干馈线光纤连到N 个ONU,一个3 口光环形器和一个短的配线光纤环.为了覆盖与传统基于树状结构覆盖相同的本地接入域,在干线端点的小环假设具有1~2 km 直径.一组ONU 通过闭环内的点到点链路来连接,且链路是单向的:下行和上行信号(组合信号)仅在一个方向传输.
图2 表示了一个详细的ONU 结构.每个ONU 用一个n:(1-n)的1×2 无源星形耦合器来连到环(A 点输入信号),发送数据经2×1 CWDM 组合器输出口进环(E 点输出信号).注意的是在每个ONU,除维持传统的收发器外(一个λup 上行发送器和一个λd 下行接收器),这种方式还需要一个调谐到λup 额外的接收器.有关正常状态的工作细节,参考文献[4].
图2 ONU 的结构
APS 模块是自愈机制的基本构建块,它执行故障检测和自动倒换处理,APS 模块连到工作和保护的输入(I 点)及工作和保护的输出(O点)光纤,如图2 所示.每个APS 模块安装一个商用低成本4×4 双向光交换(OS),它能从任一个输入口交换到任一个输出口.它也包括两个检测电路,每个电路由一个1×2 CWDM 滤波器,两个PIN 检测器和一个配置OS 的控制电路组成.第一个检测电路用于检测经分接很少部分(约1%)输入组合信号的输入上行和下行信号,第二个检测电路用于检测经分接很少部分(约1%)输出组合信号的输出上行和下行信号.从图1 可以看到,在正常工作模式中,组合信号(下行和上行信号)分别经口2-5,8-3 在输入和输出工作光纤(working fibers)上传送.
通常我们将故障情况分为三类,即主干链路故障、一般配线链路故障和一般节点(ONU)故障.在这里,一般配线链路定义为连接两个相邻ONU 的配线光纤段.所有连接相邻ONU 链路除如下两种情况外是一般配线链路,它们需要不同的检测和恢复机制:(1)连接第一个ONU(ONU1)和环行器的配线光纤段,这个链路称为第一链路;(2)连接最后一个ONU(ONUN)和环行器的配线光纤段,这个链路称为最后链路.在这里,一般节点定义为环上的任一节点.所有沿环分布的节点除最后一个ONU 外都是一般节点,它们仅需要不同的发现机制.主干连接处的全部链路和节点包括主干、第一和最后链路、第一个和最后一个ONU.
在一般链路的故障情况中,受影响节点的第一个控制电路(ONU 的检测和管理故障)配置OS,以至于输入信号经受影响ONU 的OS 口1-5,从输入工作光纤倒换至保护光纤.在一般节点故障情况中,输入信号完全旁路故障节点并传送到下一个节点.这通过经口2-6-7-4,将输入信号直接交换到故障节点的输出保护光纤来实现.
我们以EPON 为例来说明.所提的分布式方案利用一个TDMA 仲裁方式和OLT 执行仲裁处理.假设是一个基于周期的上行链路,周期的大小或者固定,或者限制在某些下和上边界间的可变长度,以适应动态上行流量的状态.在一给定周期的期间,每个ONU 发送它的控制(REPORT)消息(在它的分配时隙中),沿环从一个节点到下一个节点,在沿环一周后,最后由源ONU 将其去除.由于REPORT 消息在每个节点处理和再发送,ONU 彼此能直接通信它们的状态,交换信令和控制消息信息.
在正常工作状态下,REPORT 消息典型地包含根据当前ONU 的缓存占用率,要求下一个时隙的尺寸.在节点或者链路故障的事件中,REPORT 消息典型地包含到OLT 和涉及恢复处理的远端节点特定的指令.
由于上行信号总是出现在环和主干上(周期的控制消息总是传输,与是否存在LAN/WAN数据无关),一般的故障检测情况(一般配线链路和节点故障)将主要仅检测上行信号的有无.于是,全部ONU 连续地监视输入和输出光纤中上行信号的状态.如果给定一个ONUN的第一个控制电路检测出在输入工作光纤上无上行信号,一个一般配线链路假设是互连ONUN-1和ONUN的故障.另一方面,如果给定一个ONUN的第一个控制电路检测出在输入工作光纤上有上行信号,而第二个控制电路检测出在它的输出工作光纤上无相同的信号(经处理后,由ONUN再生和再发送),一个节点(ONUN)故障确定.所以一个节点故障由同一节点经连到该节点的APS 模块上安装的两个控制电路检出.然而,管理故障委托给下一个环上节点(ONUN+1).除最后一个节点需要不同的机制外,环上每个节点的检测和恢复机制是相同的.另一方面,连接OLT,ONU1和ONUN的三种特殊链路(干线光纤链路、第一和最后配线光纤链路)需要各自不同的故障检测机制.如表1 所示,第一个ONU检测和管理全部三类故障情况,每一类需要监视下行和上行信号.于是,仅ONU1需要监视下行和上行信号.
表1 ONU1 故障检测
恢复处理经三个共同运行网络节点的参与来实现,包括受影响节点(ONUN),OLT 和或者ONUN-1(一个链路故障情况)或者ONUN+1(一个节点故障情况).
成功完成一给定的一般链路恢复处理包含如下步骤:
(1)一旦受影响节点(例如ONUN)检测一给定的光纤断,为避免假的故障检测,它等待一预定的暂停时间;
(2)然后,ONUN同时执行如下三个功能:i)停止上行(LAN/MAN)流量的传输;ii)倒换到输入保护光纤;iii)用一故障指示告警消息泛洪网络(floods network),它包括到ONUN-1(倒换它的传输从输出工作光纤到输出保护光纤)和OLT(停止下行传输)两者特定的指令;
(3)ONUN保持用一故障指示告警消息泛洪网络,等待它的故障帧经ONUN-1的输出保护光纤返回到它;
(4)环上的每个ONU 接收故障消息后,停止所有上行流量传输,类似OLT 停止下行流量传输;
(5)一旦ONUN接收到返回它的故障帧(假设ONUN-1己经倒换到输出保护光纤),它开始用第二个请求下行同步帧的消息泛洪OLT;
(6)一旦OLT 接收到从ONUN来的同步请求,它重新开始下行传输;
(7)一旦ONUN接收到OLT 来的同步帧,它通过发送它的正常REPPORT 控制消息到其它所有的ONU 来开始一个新的周期,到此恢复处理己经完成;然后,所有的ONU 顺序地发送它们的REPORT,一旦所有的REPORT 交换后,开始新周期的DBA 计算,能计算新的授权及重新开始正常工作.
一给定的一般节点故障的恢复处理包含如下步骤:
(1)一旦连到一给定节点(例如ONUN)的APS 模块检测出它的故障,然后它配置OS 到旁路模式,直接地将输入信号经口2-6-7-4 交换到输出保护光纤.由于故障,ONUN不能发送任何数据到它相邻的节点(ONUN+1)或广播故障指示告警消息.
(2)当ONUN的APS 模块开始交换处理时,ONUN+1在它的输入工作光纤上,将检测不到上行信号,并错误确定为它和ONUN间的配线光纤断.
(3)然后,ONUN+1开始一般链路的恢复处理(上面3.1 列出的7 个步骤).
(4)再后,ONUN+1开始同时执行如下三个功能:i)停止上行流量的传输;ii)倒换到输入保护光纤;iii)用一故障指示告警消息泛洪网络(floods network),它包括到ONUN-1(倒换它的传输从输出工作光纤到输出保护光纤)和OLT(停止下行传输)两者特定的指令.
(5)ONUN+1保持用一故障指示告警消息泛洪网络,等待它的故障帧经ONUN的输出保护光纤返回到它.
(6)ONUN不能接收或处理ONUN+1的请求消息.然而,ONUN的控制电路己再配置OS 成旁路模式(交换到输出保护光纤),即ONUN的APS 模块间接地实现消息.
(7)一旦ONUN+1倒换到输入保护光纤,ONUN倒换到输出保护光纤(即ONUN被旁路),ONUN+1接收到返回它的故障消息(假设现在ONUN+1的故障已恢复).
(8)ONUN+1继续3.1 列出的步骤5-6-7.现在确认ONUN故障恢复(旁路).换句话说,当ONUN故障时,ONUN+1从事恢复处理的管理.
值得注意的是OLT 在一般链路和节点故障的检测和恢复处理中所承担的角色只限于:(a)接收和处理故障指示请求帧,以停止下行传输;(b)再开始同步帧.
三个特殊链路(主干光纤链路、第一和最后配线光纤链路)中每一个的恢复机制几乎是相同的,在每种情况需要连接的三个节点(OLT,ONU1,ONUN)共同参与,所有涉及的每一方必须倒换到保护光纤.要注意的是除OLT 现在的角色已扩展到包含除倒换它的传输到主干保护光纤外,一个一般链路故障恢复的七个步骤也应用于每种情况.这意味着现在由ONU1泛洪的故障指示告警消息必须包括一个到OLT 附加的指令,倒换它的传输到主干保护光纤.
然而,在第一链路故障情况中,ONU1仅能与OLT 通信,但是在其它两种情况(主干和最后链路故障)中,完全不能与OLT 通信.于是,在后两种情况,必须有另一种机制指令OLT 停止下行传输和倒换它的传输到保护光纤.要注意的是第一链路断不会停止到OLT 的上行信号流,但是在后两种情况的链路断会停止到OLT 的上行信号流.总之,有三种特殊故障情况会停止到OLT 的上行信号流,也就是最后链路故障,主干故障和最后一个ONU 故障.在所有这些情况中,OLT 能独立地检测无上行信号,自动停止下行传输和倒换它的传输到主干保护光纤.于是,OLT 必须依赖ONU1的请求倒换它的传输到主干保护光纤的特殊情况仅是第一链路故障.
第一链路故障:
(1)ONU1APS 模块的控制电路检测出无下行和上行信号,于是识别为第一链路故障(见表1);
(2)然后,ONU1同时执行如下三个功能:i)停止上行流量的传输;ii)倒换到输入保护光纤;iii)用一故障指示告警消息泛洪网络,它包括到ONUN(倒换它的传输从输出工作光纤到输出保护光纤)和OLT(停止下行传输和倒换它的传输到主干保护光纤)特定的指令.
(3)一旦所有涉及的每一方(OLT,ONU1,ONUN)倒换到保护光纤,与OLT 的上行和下行信号通道恢复.对其它两个特殊链路(主干和最后链路)故障的每个恢复处理,除步骤(2)iii)ONU1单独发送请求到ONUN外,与第一链路故障相同.目前还缺少到OLT 扩展指令的实现,应是由OLT 自动地完成.
最后一个ONU(ONUN)故障:
这个节点的恢复处理等同一个特殊链路故障.这是因为,如一个一般节点故障情况,ONUN故障由ONU1参与恢复处理的管理.当ONUN故障时,ONU1检测出无上行信号及有下行信号,于是设定故障是一个最后链路故障(见表1).然后,ONU1用一故障指示告警消息泛洪网络,它包括仅到ONUN的特殊指令(倒换它的传输从输出工作光纤到输出保护光纤).OLT 检测出无上行信号,自动停止下行传输并倒换它的传输到保护光纤.虽然由于本身的故障,ONUN不能接收和处理这个消息,然而如上述,ONUN的APS 模块间接地实现该消息.这是因为当ONUN的APS 模块检测出它的故障,再配置OS 至它的旁路模式,将输入信号直接交换到输出保护光纤.
针对当前基于树状的PON 结构的某些限制和不足,如受限的光功率预算,支持专用虚拟网能力、网络保护能力不足等,借鉴已大量在MAN/WAN 应用的SDH、OTN 等光环网的组网优势,提出了改善传统PON 性能的创新思路——基于环的TDM-PON.然而,由于是环结构,环内的节点和链路故障的影响是巨大的,设计一个可自愈的基于环的PON 结构是非常重要的,也是实际为智慧校园网络建设所用的关键.
为此,设计了一个简单自愈环的TDM-PON结构,其主要思路是在环中ONU 之间构建一个全分布式的控制结构.该结构既用于控制ONU之间的通信,也用于实现一个全分布式的故障检测和恢复机制.在该方案中,ONU 交换信令和控制信息,包括节点和配线/主干馈线光纤的状态,它们的队列状态和传输要求.提出的APS 方案能保护节点(ONU)和配线/主干馈线光纤的故障,能恢复所有的网络流量,包括上行、下行和LAN 数据.恢复时间远小于当前的集中式PON 的恢复时间,为当前PON 不理想的保护方案提供了新的解决思路,将有可能成为智慧校园网络层技术路线的候选方案.