刘明波,赵乾宏,吉 庆,丁 冉
(中国卫星海上测控部,江苏 江阴 214431)
自某专用业务网部署建设以来,信息通信方式由专线环境下的同步传输通信转变为网络方式下的异步传输通信,实现了专用任务数据、话音、图像等业务的统一承载、综合传输与交换。与专线传输相比,IP 模式下业务网信息传输带宽更大,组网方式更灵活,状态监测和故障定位更方便,已圆满完成了数百次专用任务中各类业务的交换和传输,承担着信息高速公路和信息神经网络的功能,在任务中发挥了关键作用[1]。
但是,在业务网的日常使用过程中也出现了一些亟需完善的地方。例如,虽然业务网各节点间备份、冗余、转接线路和设备很多,但是由于广域网采用静态路由设置方法,当出现某一个骨干线路中断或骨干设备宕机等故障时,由于无法自动适应网络拓扑的变化,需要整个线路上各节点岗位人员重新进行路由配置,线路切换时间长,效率低。可见,当前路由设置方法已不能很好地满足新型专用任务对信息传输“不间断”的需求。
以往相关研究中主要针对专用业务网现有配置情况下的优化方法进行分析完善,没有从根本上解决现有网络路由收敛慢、故障处置低效等问题[2]。本文重点对在当前某专用业务网中部署路由信息协 议(Routing Information Protocol,RIP)、开 放最短路径优先(Open Shortest Path First,OSPF)、中间系统到中间系统(Intermediate System-to-Intermediate System,IS-IS)路由协议、边界网关协议(Border Gateway Protocol,BGP)等动态路由协议替代静态路由协议的可行性开展研究,对比各类路由协议的优缺点和应用场景,对某专用业务网的路由设置提出改进完善建议,确保能够满足现有业务传输对网络路由快速收敛、故障高效处置(50 ms 内)的迫切需求。
某专用业务网网络平台根据组网方式分为节点间广域网和节点内城域/局域网两部分。
节点间广域网是指需使用长途光纤通信或卫星通信等远距离传输手段作为传送通道进行通信的IP通信网,一般采用路由器组网。为保证信息远距离传输的可靠性,各广域网节点采用两个路由器分别接入两条相互独立的广域传送通道,与其他广域网节点对应路由器相连,形成双路由独立组网结构,构成两个相互独立的网络传输平台,分别为第一路由广域网和第二路由广域网[3]。节点间广域网组网方式如图1 所示。
图1 节点间广域网组网方式
节点内城域网/局域网主要指各子节点内部的IP 通信网,一般采用三层交换机组网,以节点内光纤和电缆线路作为传送通道。城域网和局域网在网络覆盖范围、层次结构、网络流量以及用户数量上存在一定的差别。
在层次结构方面,城域网/局域网主要采用“核心——汇聚——接入”三层结构或“核心汇聚合一——接入”的二层结构。核心层是城域/局域网的中心,对外连接广域网,对内连接下级节点;汇聚层是城域网的区域中心,对上连接核心层,对下连接接入层,主要实现区域内的信息汇聚与交换;接入层节点完成用户接入,一般部署在各用户集中点位。核心节点、汇聚节点和重要的接入节点均采用双交换机配置,汇聚或接入节点交换机均采用双上联方式与上级节点的两个交换机连接,核心交换机之间采用环状连接或采用全网状网连接,上下级交换机之间统一采用路由方式,同一个节点的两个交换机之间采用路由方式或二层连接方式。一般情况下,一个城域网/局域网各有一条链路与任务中心第一广域网和第二广域网相连[4]。城域网/局域网的一般结构及其对外连接关系,如图2 所示。
如前所述,某专用业务网网络平台主要由节点间广域网和节点内城域/局域网两部分组成,总体拓扑结构如图3 所示。
图2 城域网/局域网结构及对外连接关系
图3 某专用业务网总体拓扑结构
网络由若干中心节点(以2 个为例)和若干子节点(子节点1~子节点N)组成,其中中心节点根据信息安全设备类型的不同,设置两类双路由广域网互联接口,同时部分子节点也据此设置两类双路由广域网互联接口。业务传输主要在子节点至中心节点以及子节点至子节点间进行。子节点至中心节点直接传输,子节点间通过中心节点转接。
当前,子节点至中心节点广域网间采用静态路由。静态路由是一种需要手工配置的特殊路由,当网络结构比较简单时,只需要配置静态路由就可以使网络正常工作;在复杂网络环境中,配置静态路由可以减少不必要的动态路由协议更新报文开销,增加网络的稳定性,改进网络的性能,并为重要的应用保证带宽;静态路由比动态路由使用更少的带宽,且不占用CPU 资源来计算和分析路由更新。但是,由于静态路由的特点,在当前网络的使用过程中存在以下问题。
(1)静态路由不能很好地适应包含多个可行路由的网络。某专用业务网中各个节点(特别是子节点与子节点)间存在多条可用路径,但是由于静态路由的局限性,只能设置少量的可用路由;
(2)静态路由需要网络管理员投入大量的时间进行配置,不仅要创建路由表,还要根据网络拓扑变化持续更新参数配置;
(3)当网络发生故障或者拓扑发生变化后,静态路由不会自动更新,必须手动重新配置,涉及到多节点多设备参数状态变更,协调难度大、效率低,故障应急处置时间较长。以中心节点间骨干线路中断为例,执行发现故障、上报故障、请求切换备份链路、批准切换、协调各方向以及完成切换,整个流程至少需要30 min,给某专用业务的实时传输带来了较大隐患。
高密度、新型号任务形势下,对专用业务网网络传输的可靠性和快速响应能力提出了新的更高的需求,要求网络传输万无一失。链路故障代通时间不超过50 ms,因此亟需对现有路由设置方法优化完善。
随着专用业务网中广域网链路带宽增加、网络设备性能提升以及路由协议优化等,在网络中部署RIP、OSPF、IS-IS、BGP 等动态路由协议,可以在保证网络稳定的情况下,大大提高网络性能和应急处置效率[5]。本文分别对各协议特点和应用的可行性进行研究,给出后续路由设置优化建议。
路由信息协议(Routing Information Protocol,RIP)是一种较为简单的、基于距离矢量算法的内部网关协议,采用跳数作为度量来衡量到达目的网络的距离[6]。RIP 协议是一个早期开发的协议,具有可扩展性受限的问题。受到最大跳数的限制,允许的路由器直径不能超过15跳,否则路由无法学习。同时,每次更新时间到期,RIP 协议将发布整个路由表,占用了大量链路带宽[7]。
专用业务网中各分支节点间数据传输一般要经过中心节点或其他分支节点,因此路由器(或跨网段交换机)直径可能会超过15 跳。同时,业务网中某些广域网通过卫星链路互联,带宽严格受限。因此,RIP 协议的跳数限制和链路带宽占用的特点不能适用于该专用业务网。
开放最短路径优先(Open Shortest Path First,OSPF)是由IETF 开发的广泛使用的链路状态路由协议。它使用Dijkstra 算法计算路由,快速收敛,层次化多区域结构设计,多部署在中大型园区、企业或城域网中[8]。目前,OSPF 虽然比其他内部网关协议(Interior Gateway Protocol,IGP)复杂,但因其成熟性而广为使用。
3.2.1 区域结构设计
为了防止路由环路的出现,OSPF 定义的区域结构为骨干区域(Area0)、普通区域、Stub 区域及NSSA 区域4 种。骨干区域有且只有一个,所有其他区域必须同骨干区域相连。如果没有连接到骨干区域,它将不会学习到其他区域的路由。OSPF中所有区域间路由必须经过骨干区域传递。
根据专用网络拓扑结构、业务传输要求以及OSPF 协议特点,网络中所有节点间的业务传输都要经过出口路由器和节点间广域网进行传输,因此可以将所有节点(包括中心节点和子节点)出口路由器的广域网接口组成骨干区域Area0。各节点内部(即出口路由器以下)网络为普通区域、Stub 区域或NSSA 区域,区域结构设计如图4 所示。
为了方便示意和原理说明,图4 中只列出包含了2 个中心节点和4 个分支节点的网络拓扑结构,且每个节点只包含1 个出口路由器。在实际应用过程中,需要将每个节点出口路由器的广域网接口(包括第一路由和第二路由)以及中心节点间的所有互联广域网接口均放置在骨干区域Area0 中。中心节点以及分支节点内部城域网/局域网设置为普通区域或其他类型区域,区域号根据规划统一设置。
图4 某专用业务网OSPF 协议区域结构设计
3.2.2 协议应用场景
下面以节点1 与节点2 之间的网络数据传输为例,说明OSPF 协议在业务网中的应用场景。
正常情况下,各节点路由信息通过Area0 中的ABR 发布给其他各个区域,因此节点1 通过“节点1-ER1—中心节点1/2-ER1(等价路由)—节点2-ER1”与节点2 建立业务传输链路,节点2 通过反向路径与节点1 建立业务传输链路。若节点间某条广域网链路中断或出现故障(假如中心节点1 和节点2 之间广域网链路中断),只要存在迂回链路,节点1 和节点2之间的业务传输都不会中断。节点1 可以通过“节点1-ER1—中心节点2-ER1—节点2-ER1”与节点2 保持业务传输,确保了专用业务数据的高效、可靠传输。
根据业务网OSPF 区域结构设计,采用华为eNSP 网络模拟仿真软件建立如图5 所示的网络拓扑。图5 中模拟了两个子节点通过两个中心节点进行数据传输,子节点和中心节点出口路由器之间建立OSPF Area0,出口路由器以下的城域网部分建立OSPF AreaX(X 号根据图示设置)。为了显示清晰,中心节点1 和中心节点2 第一/第二平面出口路由器之间的互联线缆分别通过HUB 转接。
根据业务网广域网链路调配和带宽分配情况,OSPF 协议在实际配置过程中需要注意以下情况。
(1)等价路由导致数据传输异常。专用业务传输对乱序、丢包等问题比较敏感。当链路中存在等价路由时,由于各个等价路由之间传输时延、带宽占用等情况不完全一样,数据在传输过程中容易出现乱序、丢包等问题。OSPF 可以通过maximum load-balancing 1 和nexthop XX weight X 等参数设置控制协议不使用等价路由。
(2)异常情况下链路拥塞。当传输链路中某个设备或某条链路出现异常宕机或断路时,协议通过拓扑更新和路由计算,可能会将海量数据通过其他某一个设备或某一条链路进行传输,导致该设备或链路负载较重而出现拥塞情况。OSPF 可以通过在接口下OSPF cost XX 设置切换优先级,当主用路径出现异常时,优先通过传输能力强的路径进行传输。在进行任务规划和方案设计时,也可以各节点分别设置不同的备份路径,避免所有数据都切换到一条路径上。
图5 ENSP 模拟节点间路由设置拓扑
(3)双平面同路径问题。为了确保数据传输的可靠性,业务网对外数据传输链路采用双平面。一般来说,双平面的出口带宽差别很大,OSPF 协议在自动进行路由计算时优先选择大带宽路径,导致两个平面的数据均通过一个出口路由器传输至其他节点。根据目前的区域结构设计,OSPF 协议可以在骨干区域Area0 中通过filter import ip-prefix XXX 过滤本节点其他平面路由信息,防止其他节点通过本路由器传输其他平面数据。同时,OSPF 协议规定,ABR 通过非骨干区域学习到的LSA3 路由不能进入该ABR 路由表,进一步避免了两个平面数据的同路径混传问题。
(4)海量路由信息导致路由震荡问题。专用业务网中节点众多,海量路由信息占用大量的存储空间。如果某条路由出现抖动,将触发全网通告路由信息,占用链路带宽和计算资源。OSPF 协议可以通过ABR-Summary 进行路由聚合,减少了大量的路由信息,同时节点中某些路由抖动也不会触发路由通告和计算,降低了对链路带宽和计算资源的消耗。
(5)链路切换过程中数据丢包问题。MA 网络中,OSPF 协议的超时时间DeadTime 为40 s。非直连链路中断情况下,OSPF 协议最大需要40 s 才能完成链路切换,期间会导致大量的数据丢包。OSPF 协议可通过与双向转发检测(Bidirectional Forwarding Detection,BFD)联动机制,最短将切换时间控制在2 ms 以内。
OSPF 协议配置完成后,链路正常情况下节点(以子节点1 为例)路由信息及传输路径如图6 所示。子节点1 通过中心节点1 转接至子节点2。
图6 ENSP 拓扑中链路正常情况下子节点1 第一/第二平面出口路由条目及tracert 路径
链路异常(子节点至中心节点1、中心节点1至子节点2 第一平面直连链路均中断)情况下节点(以子节点1 为例)第一平面连通性和传输路径,如图7 所示。子节点1 通过“中心节点1—中心节点2—子节点2”的路径完成数据的迂回传输,且链路切换过程中数据传输没有丢包,理论上最快可以在2 ms 内完成链路切换,且传输速率50 Mb/s 以内的数据不会出现明显丢包现象。
中间系统到中间系统(Intermediate System-to-Intermediate System,IS-IS)路由协议最初起源于DEC 公司的PhaseV 网络,只支持OSI 协议栈的数据链路层,而不能工作在IP 协议层,后IETF 开发了可为IP 工作的IS-IS,称为集成IS-IS。由于集成IS-IS 运行稳定,收敛快,具有支持大量路由设备的能力,因此ISP 相继选用IS-IS 作为其内部骨干IGP 路由协议。
IS-IS 与OSPF 协议均为链路状态路由协议,路由计算方法相似,均基于区域设计,支持层次化网络设计。区域结构和应用场景与OSPF 基本一致,因此不再赘述。
与OSPF 相比,IS-IS 协议更加精炼,使用更少的报文和更优化的路由计算方式。在类似规模的网络中,IS-IS 消耗的资源更少。同时,IS-IS 报文直接在数据链路层传递,因此不易遭受欺骗或DoS 攻击。
图7 ENSP 拓扑中链路异常情况下子节点1 第一平面tracert 路径
OSPF 报文基于IP 之上封装的,容易遭受IP欺骗或DoS 攻击。以往的网络设计过程中,IS-IS协议在前期主要应用于OSI 协议栈,在IP 网络中应用较少,因此网络设计和管理人员对其了解掌握的较少。随着集成IS-IS 的普及,越来越多的新建网络选用IS-IS 协议作为骨干IGP 路由协议。后续新建或改造的专用业务网络建议可以选择IS-IS 协议作为骨干IGP 路由协议。
边界网关协议(Border Gateway Protocol,BGP)是一种在自治系统AS 之间传递并选择最佳路由的高级矢量路由协议。它为路由定义了多种属性,并提供了灵活的路由选路规则和丰富的路由策略,主要具有如下特点。
(1)BGP 是一种外部网关协议,与OSPF、RIP、ISIS 等内部网关协议(IGP)不同,着眼点不在于发现和计算路由,而在于控制路由的传播和选择最佳路由;
(2)路由收敛时间相对较长,可以工作在非直连邻居间,使用TCP 作为其传输层协议,提高了协议的可靠性;
(3)提供丰富的路由策略,能够对路由实现灵活的过滤和选择;
(4)一般应用于大型、超大型运营商网络。在实际网络建设和实施过程中,BGP 协议一般部署在以下网络中:
(1)路由规模庞大且无法聚合;
(2)跨经营实体,信息沟通不便利,信息加密传输;
(3)一个路由选择域内运行了多种IGP 协议;
(4)IGP 协议无法提供相应的工具来实施所需策略。
专用业务网对路由收敛时间要求较高,且路由规模相对较少,整个路由域由一个实体单位维护管理,可以方便部署一种IGP 协议,因此没有部署BGP 协议的必要性。
根据业务网拓扑结构和业务传输特点,综合分析比对RIP、OSPF、IS-IS 和BGP 等路由协议的特点和应用场景,得出如下结论。
(1)RIP 协议由于协议设计缺陷和路由传递对带宽的占用较大,不适用于本专用业务网;
(2)BGP 协议一般应用于超大型运营商网络,且配置前要求网络IGP 路由配置正确,给网络设备带来了额外负担,收敛时间较长,不适用于本专用业务网;
(3)OSPF 和IS-IS 协议同为链路状态路由协议,使用最短路径算法计算路由,收敛速度快,链路故障情况下的代通时间最短为2 ms 左右。层次化多区域结构设计,占用带宽少,路由控制策略虽然没有矢量路由协议丰富,但也能满足常用需求。针对实际应用中可能存在的问题,可以通过合适的参数设置加以解决,因此较适用于本专用业务网;
(4)针对特殊的、临时的数据传输业务,路由协议策略无法满足需求时,可以临时采用策略路由的方式进行设置。但是,由于策略路由是本地有效的且协议无关组播(Protocol Independent Multicast,PIM)等组播路由协议也无法基于它生成组播路由表,因此不建议大量使用。
某专用业务网承载了专用业务系统众多重要业务信息的传输任务,其骨干链路的可靠性是任务完成的基本前提。考虑到后续高密度、新型号任务态势下业务传输需求多样化、链路资源保障难度大等实际情况,采用动态路由协议可以在短时间内完成链路资源动态调整情况下的主备路径切换,实现新增业务“入网即通”、故障链路“即刻切换”的高可靠、高性能骨干数据传输网络。同时,由于动态路由协议运行较为复杂,一定程度上增加了网络维护和配置的复杂度,对岗位人员的能力水平提出了一定的要求。