尹常红 胡雅超 袁文波
摘要:在对BFD工作原理分析研究基础上,结合武汉气象信息网络建设实际和要求,引入BFD技术,应用BFD的双向检测机制,在出现线路故障时,能够实现气象通信网络路由的快速收敛和通信线路的瞬时切换,确保气象信息网络传输稳定。
关键词:BFD;OSPF;路由收敛
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)07-0240-04
Abstract: On the basis of our analysis about BFD, considered the requirement and actual situation on the construction of Wuhan meteorological information network, we introduced the BFD technology and applied the bidirectional detection mechanism of BFD. When a line fault occurs, the meteorological communication lines can be switched immediately,after the fast routing convergence ended. It will ensure the meteorological information network runs stably.
Key words: BFD;OSPF;routing convergence
1 引言
現代气象业务的不断发展,对气象信息网络系统的通信质量提出了更高的要求,气象信息网络承载了业务数据、图形图像、音视频信息以及公文文件的实时传输,气象信息网络的稳定可靠是气象业务服务的基础支撑。为了确保一些实时业务不中断,除了建设通信备份链路之外,还需要在故障发生时快速切换到备份链路。快速切换不仅包括通道的切换,也包含通信路由的收敛与重新发现后的刷新。链路的自动切换应用较容易实现,关键是需要能建立一套有效的故障检测机制,在故障发生后,能够及时发现,迅速采取措施,断开无效路由,建立起新的通信路由。
2 气象信息网络建设
2.1网络系统现状
经过近几年来连续的升级改造,武汉市气象局已建成了以MPLS(Multi-Protocol Label Switching,多协议标签交换)、MSTP(Multi-Service Transfer Platform,基于SDH的多业务传送平台)、MPLS-VPN混合方式的气象广域网系统,市、区两级气象系统均以CE(Customer Edge,用户边缘设备)的方式接入移动MPLS VPN网,MPLS VPN线路作为数据传输的主线路;备份模式下,各区气象通过电信MSTP 10M线路汇聚至市气象局,市气象局通过电信MSTP 10M线路汇聚至省气象局。
气象广域网中需要数据传输或交换业务种类较多,其中有各类观测数据、预报产品、办公信息、音视频流等。根据业务工作需要,从武汉市气象局到湖北省气象局建立了两条互为备份的通信线路,在两条线路都正常的前提下,根据不同业务传输对带宽、时延等要求的高低,通过策略路由或者其方式使该项业务运行在优先运行于某条线路上。如视频会商要求时延低,因此适合将该项业务放在电信MSTP线路上运行,而对于带宽要求大,时延要求不是很高的数据传输业务,则适合放在MPLS VPN运行。
2.2通信稳定性要求
武汉市气象业务服务系统很多需要实时数据传输,天气视频会商系统更要求了音视频的连续不中断。这些业务对气象通信的稳定性提出了要求。
在通信传输中,影响通信质量的既有链路现状、用户终端、网络设备等硬件因素,也有网络运行协议、技术策略应用等软件原因。为了确保网络传输稳定,在硬件方面可以采取设备冗余备份、骨干链路捆绑、选用支持热插拔的核心设备等措施;在网络策略应用等软件方面需要体现快速故障发现能力、业务快速保护切换技术、路由协议的快速收敛等等。
为了保证一些气象实时业务,在网络发生通信故障时,就要求网络设备必须迅速检测出故障,并在第一时间将业务传输切换至备份链路,以加快网络路由的收敛速度。在进行故障快速检测中,既需要硬件设备的支持,同时也需要相关网络协议和技术的应用。在目前IP网络中的慢hello机制的路由协议的检测中,不能满足气象业务实时通信的要求。在武汉市气象信息网络设计中,采用了BFD(Bidirectional forwarding detection , 双向转发检测)技术来实现故障快速检测与瞬时切换。
3 BFD在气象信息网络中的应用
3.1 BFD技术简介
BFD协议是一个通用的、标准化的快速故障检测机制,与介质无关,与协议无关,专注于故障快速检测,且轻负荷,专注于转发平面检测,为上层控制协议提供检测服务,自身不作为,无发现机制,由上层协议提供邻居信息。
BFD在路由邻居检测中通过周期性发送检测报文来判断路由邻居的连通性。如果本端设备在某个特定的时间内未收到对端设备发送的检测报文,系统就此判断在由此及彼相邻的双向通道的某个部分发生了通信故障。为了降低系统运行的负荷,BFD在发送和接收检测报文的速率需要进行协商,也能根据需要适当调整,来适应整条链路中各类协议的不同要求。
BFD会话的触发过程包括以下三步:一是上层协议发现邻居,比如OSPF;二是上层协议通知BFD与邻居建立会话;三是BFD与邻居建立起会话。BFD建立会话分为主动模式和被动模式。BFD主动模式建立会话前,不管是否收到对端控制报文,本端都主动发送控制报文;被动模式建立对话前,本端不主动发送控制报文,直到收到对端发送来的控制报文。会话建立后,BFD协议实现双向检测机制,工作模式又分为异步模式和查询模式。异步模式下,路由设备之间相互周期性地发送控制报文,本端设备在一定检测时间内没有收到对端发来的控制报文,就宣布会话Down掉;查询模式下,先假定每个设备确认它连接到其他设备,建立BFD会话,停止发送控制报文,如果某个设备需要验证连接性,则发送控制报文来查询,如果未收到返回的控制报文就判断为Down。
BFD在两台网络路由设备上建立会话后,实时监测链路中的双向转发路由,并为上层协议服务,比如OSPF。BFD不像OSPF那样,它没有发现机制,必须依赖上層协议通知建立会话,会话建立后根据报文返回的实际情况来判断链路是否发生故障,并能在发生故障后及时通知上层协议,由上层协议采取行动。BFD在监测到链路故障后,随即拆除邻居会话,并立即通知上层OSPF协议,OSPF则迅速进行收敛处理,再次重新计算路由并选择备用路径。
BFD能够快速检测转发故障,帮助网络以良好的QoS(Quality of Service,服务质量)实现气象实时业务数据的高可靠性传输,大大提高气象通信网络的性能。
3.2 BFD技术应用
3.2.1 OSPF
武汉市、区气象网络运行MPLS L3 VPN,市、区气象局全部作为CE接入,湖北省气象局作为武汉市气象局的MSTP线路汇聚接入,武汉市局作为下辖各区气象局MSTP线路汇聚接入。
根据湖北省气象局统一规划,在全省气象业务宽带网中,配置三个OSPF进程,其中接入移动的MPLS VPN线路运行OSPF 10,电信MSTP线路运行OSPF 20,省、市、区气象局域网运行OSPF 1。OSPF路由结构如图1。
在武汉市气象局,将OSPF 10和OSPF 20的路由引入至OSPF 1;将OSPF 1的路由引入至OSPF 10和OSPF 20,引入时配置过滤策略,引入局域网的路由,同时将武汉市局下辖各区气象局局域网路由进行聚合后配置为下一跳为NULL 0,并分别引入至OSPF 10和20。武汉市气象局数据通信流程如图2。
在武汉市气象局的信息通信网关上H3C 6000上配置以下路由信息:
#
ospf 1 router-id 172.31.212.254
import-route static route-policy ShiJu-TO-OSPF1
import-route ospf 10
import-route ospf 20
preference 180
preference ase 190
area 0.0.7.220
network 10.108.64.0 0.0.0.255
network 10.108.67.0 0.0.0.127
……
#
ospf 10 router-id 172.31.212.254
import-route direct route-policy Direct_to_OSPF10/20
import-route static route-policy S-TO-OSPF
area 0.0.0.0
network 172.31.75.44 0.0.0.3
network 172.31.101.180 0.0.0.3
#
ospf 20 router-id 172.31.212.254
import-route direct route-policy Direct_to_OSPF10/20
import-route static route-policy S-TO-OSPF
preference ase 170
area 0.0.0.0
network 172.31.72.44 0.0.0.3
#
……
ip route-static 10.108.64.0 21 10.108.67.2 tag 1000
ip route-static 10.108.96.0 22 NULL0 tag 2000 description JiangXia
ip route-static 10.108.100.0 22 NULL0 tag 2000 description XinZhou
……
ip route-static 172.20.48.0 24 10.108.67.2 tag 1000
……
#
在各区气象局,将OSPF 10和OSPF 20的路由引入至OSPF 1;将OSPF 1的路由引入至OSPF 10和OSPF 20,引入时必须配置过滤策略,只引入局域网的路由。
在各区气象局核心信息通信网关H3C 3000s配置以下命令:
#
ospf 1
import-route ospf 10
preference 180
preference ase 190
area 0.0.7.220
network 10.108.120.0 0.0.3.255
network 192.168.176.36 0.0.0.3
#
ospf 10
import-route direct route-policy Direct_to_OSPF10
area 0.0.0.0
network 172.31.101.204 0.0.0.3
……
3.2.2 路由收敛
在武汉市气象局与湖北省气象局的业务通信中,采用MSTP线路作为主用线路,当其出现故障后,路由器无法及时侦测到故障,原来配置运行在该线路上的静态路由不能立即失效,因此导致ip路由不能尽快切换到备份线路上,运行在MSTP线路的业务将出现中断,这对一些实时业务,包括音视频类业务产生较大影响。
引入BFD,采用BFD与静态路由联动来解决上述问题。在MSTP线路两端配置BFD后,BFD周期發送控制包,实时检测链路情况,如出现故障在极短时间内(毫秒级)会被侦测到,BFD将会立即通知上层路由系统,将与之联动的那条静态路由立即失效,路由也随之切换至另外备份链路。
以下以配置在武汉市局信息通信网关H3C 6000上的命令为例,BFD检测从IP 172.31.72.45(位于湖北省气象局)到IP 172.31.72.46(位于武汉市气象局)的这一段光路,在链路故障时,立即断开到目标地址10.104.28.0/24(Lotus Notes办公系统)的静态路由,交由上层路由系统切换到备份链路。
#
……
ip route-static 10.104.28.0 24 172.31.72.45 bfd control-packet bfd-source 172.31.72.46
……
3.2.3 切换测试
测试了BFD与静态路由联动的网络环境,在未配置BFD的情况下,在通信链路故障时,原先配置的静态路由不可达,但又不能立即失效,因此反映为请求超时,直至重新更新路由为止,如图3。图4所示情形为配置了BFD的时候,通信链路故障,先前配置的静态路由立即失效,BFD通知上层路由立即更新路由,切换至备份链路,在数据包的传输上只是表现出了时延,但是未丢包。本文的试验只是作了一个初步的测试,未做精确的延时测试。
3.3 应用讨论
通信链路常见的故障检测机制一是通过硬件检测信号来实现,例如通过SDH告警信息检测发现,效率较高,但是并非支持所有设备;二是依靠上层协议的HELLO报文机制进行检测,但是效率较低,对于实时性业务传输不适用。
采用BFD技术能有效实现,且不过分依赖硬件系统。尤其采用BFD与OSPF相结合,交互工作,效果更好。OSPF通过HELLO机制发现邻居并建立连接,然后将邻居的参数及检测参数都通告给BFD,BFD根据收到的参数并建立邻居。在故障发生时,通过BFD的快速检测,回告OSPF后OSPF重新发现邻居并刷新路由表,BFD能大大缩小路由收敛时间。当然BFD协议故障检测发现机制也在一定程度上增加了设备负担和管理开销,尤其是在网络中存在多种路由协议时,需要采用多个BFD进行检测,网络负担进一步增加。因此在整条链路的设计中,BFD的工作效率与设备处理能力需要进行权衡。
4 结束语
武汉市气象信息网络建设中,在OSPF动态路由的基础上,引入BFD技术,实现了路由的快速收敛与瞬时切换,确保了信息传输的连续。BFD在气象信息网络通信传输中与OSPF以及其他上层协议结合应用能明显提高气象信息网络的可靠性,在应对故障处理时效率更高。虽然BFD在周期性发送检测包会对设备造成一定的负荷,但是在网络设备处理能力日渐强大的情形下,仍不失为一种较好地快速解决通信故障的方式。
参考文献:
[1] H3C.BFD技术白皮书[EB/OL].(2008)[2011-12-04]
[2] 王坦,仝磊,郭学义,等.基于BFD检测的静态路由切换研究[J].自动化技术与应用,2015,34(8):42-46.
[3] 徐俊,秦艺力,唐森,等.通信IP网BFD应用的研究[J].电子设计工程,2012,20(3):39-43.
[4] 李乃振,李朝东,刘继光.BFD技术在提高专网可靠中的应用[J].工业仪表与自动化装置,2015(2):58-61.
[5] 许玮,王迎迎,秦运龙,等.省级气象广域网网络优化的设计与应用[J].气象科技,2016,44(3):358-361.