沈 超,徐 俊,刘佳诞(无锡供电公司,江苏无锡214000)
EPON手拉手保护在配电通信网的应用及优化
沈 超,徐 俊,刘佳诞
(无锡供电公司,江苏无锡214000)
基于以太网原理对以太网无源光网络(EPON)的手拉手保护倒换特性进行详细的分析,以电力系统中实际EPON组网方案为模型,通过企业网络仿真平台(eNSP)模拟手拉手保护倒换过程中交换机、光线路终端(OLT)以及光网络单元(ONU)的网络行为。针对现网中EPON手拉手组网业务倒换速度过慢的情况给出合理的解释,在不改变EPON协议栈的情况下,采用端口隔离和免费地址解析协议(ARP)2种辅助功能对EPON手拉手保护倒换进行优化,实现业务倒换速度在毫秒级别,并采用实际系统进行验证。
EPON;手拉手保护;端口隔离;免费ARP
目前,配电通信网主要采用以太网无源光网络(EPON)技术进行组网,EPON技术结合了以太网技术和无源光网络(PON)技术,在多个城市配电自动化建设中得到了广泛应用[1-3]。为满足电力配电网对系统可靠性的特殊要求,EPON厂家提出了手拉手组网保护机制,采用主备冗余的思想确保通信系统在故障状态下的可靠运行[4,5]。随着EPON技术的深入应用,部分城市在组建配电通信网EPON网络中发现,当EPON主用线路发生故障或主用OLT发生故障后,手拉手保护并不能及时将业务倒换至备用线路,业务倒换时间为数分钟至数十分钟,严重影响了系统的实时性和可靠性。文中以EPON中的以太网技术为基础,采用仿真软件企业eNSP对手拉手保护过程中光线路终端(OLT)、光网络单元(ONU)的网络行为进行模拟,分析了业务倒换时间过慢原因,并采用端口隔离、免费地址解析协议(ARP)的方法对手拉手保护机制进行优化。
配网自动化组网中支持多种PON组网保护方案,包括Type B保护、EPON Type D保护 (GPON Type C保护)和独立上行保护,其中GPON Type C保护和EPON Type D保护原理相同。
电力系统中通常所说的手拉手保护是在EPON Type D保护基础上发展而来[6]。EPON Type D保护分为单归属和双归属,配电通信网中通常采用的是双归属模式,即上行冗余PON口分别在2台OLT上,如图1所示。在双归属的组网场景中,ONU具有双PON口,ONU与OLT之间的2条PON线路处于主备状态,正常工作状态下,ONU仅能通过主用线路PON口转发报文,备用PON口在备用OLT上注册信息,但不能用于转发报文。当主用线路中的某器件发生故障导致主用线路中断时,ONU可快速切换到备用OLT。
图1 Type D保护双归属模式
在配电网实际组网应用中,EPON手拉手组网比图1所示网络复杂,整个网络可以分为核心层、汇聚成、接入层3个层面,如图2所示。核心层包括设置在主站的核心交换机,用于快速转发数据;汇聚层包括位于变电站内的OLT、汇聚交换机以及传输设备SDH/ MSTP,OLT将数据传送至汇聚交换机,进行数据汇聚、安全控制、流量控制等处理后通过骨干通信网传输至核心交换机;接入层包括放置在环网柜/开闭所/柱上开关的ONU、分光器和配电终端设备,ONU通过主备用2条光纤线路分别连接至不同变电站的OLT。
图2 配电通信网EPON组网方案
在大部分企业测试环境中,通常采用图1的网络拓扑对手拉手保护功能进行测试[7,8],测试结果表明在主用线路发生故障的情况下,业务能够很快地倒换至备用线路,整个倒换大约在50 ms。但是在实际生产环境中,主用线路发生故障后,往往需要数分钟甚至更多时间,业务才能够倒换成功。
对比测试环境拓扑和实际组网环境拓扑,发现测试环境和实际组网的差别在于实际环境比测试环境多了汇聚层和核心层交换机,为研究交换机对EPON手拉手保护特性的影响,采用仿真软件eNSP模拟手拉手倒换过程中OLT、ONU、交换机的网络行为。不考虑PON的物理特性,OLT、ONU的网络交换特性可以等效成以太网2层交换机,因此在仿真中采用2层交换机模拟OLT和ONU,仿真拓扑如图3所示。
图3 实际组网仿真拓扑
图中CORE模拟主站核心交换机,SW1和SW2模拟变电站汇聚交换机,SW1的g0/0/1与SW2的g0/0/1之间采用3层通道互联,CORE与SW1、SW2之间运行OSPF协议;OLT和ONU均由2层交换机模拟,SW1、SW2、OLT1、OLT2以及ONU之间均用二层链路连接,其中SW1的g0/0/4与SW2的g0/0/4之间采用2层通道互联;配电终端设备(DTU)用PC进行模拟,IP地址为10.1.20.100,在SW1设置DTU网关10.1.20.254。仿真过程中通过控制ONU上联端口g0/0/1和g0/0/2的开关状态模拟主用PON链路故障后的倒换动作。在DTU上使用命令“ping 1.1.1.1-t”来模拟实时遥测信息,1.1.1.1为CORE环回口地址。
2.1稳态运行
稳态运行情况下,ONU的g0/0/1端口被关闭,主用PON链路为ONU-OLT2。通过命令在所有设备上查看实际物理地址(MAC)表,列出与DTU的MAC相符合的表项,结果如表1所示。
在SW1上查看DTU对应IP地址10.1.20.100的ARP表项,发现其对应MAC地址为5489.9850.7777,对应出接口为g0/0/4。
通过抓包分析可知DTU向CORE上传数据路径:DTU—ONU—OLT2—SW2—SW1—CORE,CORE向DTU下发数据路径:CORE—SW1—SW2—OLT2—ONU—DTU,此时DTU能够持续连通CORE,表明系统能够正常工作。
表1 正常工作时MAC地址
2.2故障倒换
将ONU的g0/0/2关闭,并打开ONU的g0/0/1,模拟主用PON链路失效后数据从备用PON链路进行发送,发现DTU无法连通CORE,连接中断。通过命令在所有设备上查看MAC地址表,列出与终端DTU的MAC相符合的表项,结果如表2所示。
表2 发生保护倒换后MAC地址
在SW1上查看10.1.20.100的ARP表项,发现结果与正常运行时相同,对应出接口仍为g0/0/4。
由表2可知,当备用的链路被启用时,除了OLT2丢失DTU的MAC地址表项外,OLT1、SW1、SW2的MAC地址表项均未发生变化,而且SW1的ARP表项也未发生变化。抓包分析显示,DTU上传的信息直接在OLT1处即被丢弃,无法上传至SW1和CORE。等待5 min后再次查看MAC表,结果如表3所示。
表3 保护倒换5 min后MAC地址
此时在SW1上查看10.1.20.100的ARP表项,发现结果与正常运行时相同,10.1.20.100对应出接口仍为g0/0/4。结果表明,此时MAC地址表已经被正确学习,但是由于SW1关于10.1.20.100的ARP表项仍然存在错误,故DTU无法恢复与CORE的通信。
抓包分析发现,DTU发往CORE的数据已经被CORE正确接收,但CORE向DTU发送的回复报文全部被SW1通过g0/0/4接口发送出去,从而导致DTU无法接收到回复报文,与CORE的连接关系建立失败。再等待20 min后,发现DTU和CORE的连接恢复,此时查看MAC表和ARP表,发现均学习正确,SW1关于10.1.20.100的ARP表项对应出接口已从g0/0/4更新至g0/0/2。
2.3原因分析
在手拉手倒换过程中,限制业务进行快速倒换的原因主要有二:(1)OLT1的MAC地址表项没有及时更新;(2)当OLT1和SW1的MAC地址表项更新后,SW1的ARP表项没有及时更新。分别采用MAC地址漂移和ARP更新原理对上述现象进行解释。
2.3.1MAC地址漂移
MAC地址漂移是指某个端口的源MAC地址老化之前,设备从另一个端口学习到该源MAC地址,并刷新MAC地址表中源MAC地址和物理端口的对应关系,这就好像是MAC地址从一个端口漂移到另一个端口。为应对恶意用户利用MAC地址漂移原理仿冒其他用户或上层设备的MAC地址,OLT支持防御MAC地址漂移特性,简称防MAC漂移。实现原理是从端口A接收到某个源MAC地址的报文后,设备会检查MAC地址表中是否已存在该MAC地址。如果MAC地址表中记录端口B对应该MAC地址,则设备根据主控板、端口类型等判断是否允许该MAC地址从端口B漂移到端口A。对于禁止漂移的情况,在MAC地址老化之前,设备会丢弃从端口A接收到的含有该源MAC地址的报文。
在EPON系统中,OLT默认开启防MAC地址漂移功能,OLT网络侧接口(NNI)MAC地址优先级为1,用户侧接口(UNI)MAC地址优先级为 0,因此当OLT网络侧接口学习到某个MAC地址后,即使该MAC地址立刻从UNI被学习到,该MAC仍然不会被覆盖,而从用户侧发来的带有该源MAC地址的报文会被全部丢弃。
对应仿真拓扑,OLT1的NNI接口为g0/0/1,UNI接口为g0/0/2,在稳态运行情况下,OLT1从NNI接口学习到了DTU的MAC地址5489.9850.7777,当备用PON线路备启用后,OLT1又从 g0/0/2学习到5489.9850.7777,但由于g0/0/2的MAC地址优先级低于g0/0/1,该MAC地址无法被正确学习,因此表2中OLT1关于DTU的MAC地址5489.9850.7777对应接口仍然是g0/0/1。这种情况会持续到OLT1中该MAC地址表项老化时间结束,当该MAC地址在老化时间达到后仍然无法被刷新,OLT1丢弃这个MAC地址,开始接收g0/0/2的MAC地址学习。MAC地址的老化时间默认为5 min,因此等待5 min后,表3中MAC地址被正确学习。
2.3.2ARP更新原理
ARP用于确定对应IP地址的网卡物理地址。在实际环境中,只有同时满足以下2个条件时,设备的ARP表项才会更新:(1)设备收到来自某IP的ARP请求包或免费ARP包;(2)设备现有ARP表项中已经存在该IP对应的ARP表项。其他非ARP报文不会对设备的ARP表项产生影响。
以仿真系统为例,系统刚开始运行时,DTU不知道网关10.1.20.254对应的MAC地址,则会发送ARP请求,SW1以自身MAC地址回应,DTU收到ARP回复后即在ARP表中保存相应的ARP表项,同样SW1中也会保存关于DTU的ARP表项。当发生故障倒换后,DTU无法感知上层网络变化,仍然采用原ARP表项封装数据包,并不会发送ARP请求或免费ARP报文,因此虽然网络拓扑发生变化,但是SW1由于没有收到DTU的ARP请求或免费ARP,SW1中关于DTU的ARP表项仍不会更新。因此,即使倒换后SW1能正确学习关于DTU的MAC地址(如表3),由于不满足ARP更新的2个条件,当CORE发往DTU的数据经过SW1时,SW1仍会按照原ARP表项中的对应接口g0/0/4将数据发送出去,从而导致DTU与CORE建立连接失败,这种情况会持续到ARP老化时间到达。当DTU的ARP表项老化时间达到后,SW1会发送一个ARP探测确定原ARP对应DTU主机是否存活,由于DTU上联通道已经连接至OLT1,SW1自然无法从g0/0/4获取ARP探测的回应,尝试数次仍无法得到回应后,SW1会删除相应ARP表项。此时若有CORE发往DTU的流量,SW1会发出ARP广播,请求DTU的MAC地址,从而获取正确的ARP表项。
需要注意的是,在Cisco设备中ARP表项只起到IP地址和MAC地址互相转换的功能,具体数据发送则会查找相应的MAC地址表项。国内大部分厂家在优化ARP表功能时,在ARP表中添加了出接口一项,虽然减少了查找多个表项带来的延迟,但是也带来了MAC表和ARP表无法同步刷新而导致数据被错误转发的问题。
根据上述分析可知,当EPON手拉手保护从主用PON链路切换到备用PON链路过程中,倒换延迟主要体现在MAC地址老化时间和ARP表项老化时间两方面。MAC地址老化时间默认为5 min,ARP表项老化时间默认为20 min,远超过了网络故障自动恢复的允许时间,影响了电力系统的实时性和可靠性。通过减少MAC表和ARP表的老化时间可以缩短保护等待时间,然而多次尝试发现,如果将老化时间略减少后,对手拉手保护倒换的提升效果非常有限;但是如果将老化时间大幅减少(5 s),整个网络内会产生大量的ARP报文,在网络结点数量较多的情况下有可能产生报文堵塞,影响整个网络的正常运行,产生的后果比倒换失败更加严重。
通过研究MAC表和ARP表的更新机理,采用以下2种方式对手拉手保护倒换机制进行优化:(1)在网关交换机上配置端口隔离功能,避免OLT在NNI接口学习到终端DTU设备的MAC地址,解决防端口漂移带来的问题;(2)在发生主备PON链路倒换时,ONU通过备用PON链路同步发送免费ARP报文,主动更新网关交换机的ARP表,解决MAC地址表和ARP地址表无法同步更新的问题。
3.1端口隔离
端口隔离是为了实现报文之间的2层隔离而产生的高级功能,正常情况下,同1个VLAN内所有的设备均属于同1个广播域,同1个广播域中设备的MAC地址、IP地址可以被同1个广播域中另外1台设备学习。采用端口隔离特性,可以实现同1个VLAN内端口之间的隔离,用户只需要将端口加入到隔离组中,就可以实现隔离组内端口之间2层数据的隔离,使用隔离技术后隔离端口之间不会产生单播、广播和组播。采用端口隔离,不但增强了网络的安全性,提供了灵活的组网方案,同时节省了大量的VLAN资源。
在EPON手拉手保护网络的网关交换机上部署端口隔离,即可保证主用PON链路上的OLT和备用链路上的OLT均不可能从NNI学习到终端设备的MAC地址,不但保留了OLT防MAC地址漂移的安全功能,而且解决了保护倒换过程中MAC地址老化的等待时间。以仿真系统为例,在SW1上部署端口隔离,将g0/0/2和g0/0/4放入一个隔离组。在稳态运行情况下,OLT1的g0/0/1不会从SW1学习到DTU的MAC地址,在发送故障倒换后,OLT2的g0/0/1也不会从SW2学习到DTU的MAC地址,如图4所示。
图4 稳态运行下端口隔离功能
3.2免费ARP
免费ARP报文是一种特殊的ARP报文,该报文中携带的发送端IP和目标IP地址都是本机IP地址,报文源MAC地址是本机MAC地址,报文的目的MAC地址是广播地址。设备通过对外发送免费ARP报文来实现以下功能:(1)确定其他设备的IP地址是否与本机IP地址冲突。当其他设备收到免费ARP报文后,如发现报文中的IP地址和本机IP地址相同,则给发送免费ARP报文的设备返回一个ARP应答,告知该设备IP地址冲突。(2)设备改变了硬件地址,通过发送免费ARP报文通知其他设备更新ARP表项。
免费ARP具有更新其他设备ARP表项的功能。在EPON手拉手组网中,利用该特性即可实现主备PON链路倒换过程中汇聚交换机ARP表项主动更新功能。具体思路如下:在正常工作状态下,ONU设备会保存终端设备的ARP表项。当ONU监测到主用PON链路发生故障后,将业务导向备用PON链路时,同步发送一个免费ARP报文,该报文中携带的发送端IP地址和目标IP地址都是终端设备IP地址,报文源MAC地址是终端设备的MAC地址,报文的目的MAC地址是广播地址。当备用OLT和汇聚交换机收到该免费ARP报文后,会立即更新本地的ARP表和MAC地址表,无须再等待相应表项的老化时间。
以仿真系统为例,正常运行时ONU会保存DTU的 ARP表项 IP:10.1.20.100—MAC:5489.9850.7777,当ONU检测到主用PON链路故障后,会主动通过备用PON链路发送免费ARP,免费ARP的源IP地址和目的 IP地址均为 10.1.20.100,,源 MAC地址为5489.9850.7777,目的MAC为广播地址。虽然此时DTU本身没有发出ARP,但是SW1仍然可以从g0/0/2接口接收到免费ARP报文,从而更新本地的ARP表项,确保倒换过后系统正常运行,如图5所示。
图5 故障倒换后ONU主动发送免费ARP更新MAC表和ARP表
以无锡地区配电自动化EPON网络为验证对象,诚飞、灰凌、仕途、竹辉路为某条线路上4个馈线终端设备(FTU),各FTU所连ONU以EPON手拉手保护方式组网,主备用链路分别连接至杨亭变OLT和商贸变OLT,如图6所示。设备地址规划如表4所示。
图6 无锡配电通信网EPON手拉手保护组网拓扑
表4 EPON手拉手组网地址规划
在主站前置机通过输入命令 “ping 10.X.20.36-t”,长时间观察诚飞FTU终端的在线情况,在核心交换机通过输入命令 “ping-m 10-c 50000 10.X. 20.36”观察诚飞FTU终端的在线情况。
优化前,断开诚飞ONU与杨亭OLT直连光纤,启用商贸变备用PON链路,倒换后主站前置机与核心交换机一直处于丢包状态,且主站前置机产生告警信息,显示诚飞FTU离线,等待约20 min后诚飞FTU恢复在线,告警消失。实施优化措施后,断开诚飞ONU与杨亭OLT直连光纤,启用商贸变备用PON链路,核心交换机显示丢包数为2,表明业务倒换延迟在50 ms以内,主站前置机未显示丢包,同时无告警产生。
EPON手拉手保护组网方式提高了EPON网络的可靠性,但大部分厂家在研发、测试手拉手保护功能时,仅考虑EPON光路的倒换时间,并未结合实际业务和全局拓扑进行考虑,导致手拉手保护在应用中存在较多的问题。文中结合真实EPON系统,从以太网分析角度提出了端口隔离、免费ARP的优化策略,缩短了手拉手保护的业务倒换时间,提高了配电通信网网络自愈功能。文中所做优化均基于华为的EPON产品,多品牌EPON设备互联互通、协议的兼容性以及手拉手保护倒换测试的标准还需进一步规范、完善。
[1]蔡万升,汤 辉.基于EPON技术的配电自动化通信系统[J].电力系统通信,2010,31(12):11-15.
[2]唐 琳.配电自动化通信系统的设计与实现[J].电力系统通信,2003,24(12):45-47,54
[3]孙晓霞.xPON和工业以太网技术在配电网中的应用研究[D].北京:华北电力大学硕士毕业论文,2010.
[4]鲍兴川.配电通信网接入层EPON保护组网可靠性与性价比分析[J].电力系统自动化,2013,37(8):96-100.
[5]罗鹏程,金 光,周经伦,等.通信网可靠性研究综述[J].小型微型计算机系统,2000,21(10):1073-1077.
[6]格伦·克雷默.基于以太网的无源光网络[M].北京:北京邮电大学出版社,2007:20-25.
[7]工业和信息化部.YD-T1809—2008接入网设备测试方法-以太网无源光网络(EPON)系统互通性[S].北京:北京邮电大学出版社,2008.
[8]工业和信息化部.YD-T1771—2008接入网技术要求-EPON系统互通性[S].北京:人民邮电出版社,2008.
Application and Optimization of EPON Hand-in-hand Protection in Distribution Communication Network
SHEN Chao,XU Jun,LIU Jiadan
(Wuxi Power Supply Company,Wuxi 214061,China)
This paper presents a method to improve the EPON hand-in-hand protection in event failure.The simulation mode of power distribution communication network in EPON is established,which is applied in analyzing the network characteristics of OLT,ONU and Switch under hand-in-hand protection.Based on Ethernet principles,two assistive functions,port-isolated and gratuitous ARP,are proposed for the optimization of hand-in-hand protection.The switching delay less than 50 microseconds is achieved.Effectiveness of the proposed method is verified by a real system.
EPON;hand-in-hand protection;port-isolated;gratuitous ARP
TP391
B
1009-0665(2015)03-0041-05
2014-12-02;
2015-02-16
沈超(1987),男,江苏无锡人,工程师,从事电力系统通信研究工作;
徐俊(1978),男,江苏江阴人,工程师,从事电力系统通信研究工作;
刘佳诞(1975),男,江苏无锡人,高级工程师,从事电力系统通信研究工作。