地铁智能运维平台的环网架构及其性能分析

2021-04-14 05:13
铁道通信信号 2021年2期
关键词:双环环网网卡

覃 旺

目前,广州地铁信号系统维修维护模式主要以周期检修、预防维修为主,人力成本和材料成本消耗巨大,只能依靠检修人员以及复杂的维修管理流程保证设备维修质量。当检修人员或维修管理环节出现问题时,就会导致设备故障。为了提高信号系统维修水平,降低人力和材料消耗,同时保证信号系统安全、可靠运行,广州地铁、广州铁科智控公司联合开展了信号系统智能运维平台的研究。

智能运维平台需要采集各线路列车运行和关键设备状态等信息,并通过分布式控制系统DCS 系统传输到后台服务器,实现可视化呈现;根据DCS 系统设计的四维评价法[1-2],可通过设备、网络拓扑的冗余,实现网络系统的高可靠保护;同时,部分业务系统对时延要求敏感,要求网络系统在故障切换过程中,尽可能地缩短切换时间。本文根据DCS 系统需求,提出了3 种不同的基于ERPS协议的环网架构,通过可靠性的分析、计算和对比,以及收敛性能的测试和分析,其结果可直接用于轨道交通或相关领域,工程人员可根据实际条件来选择合适的组网架构。

1 网络组网架构

1.1 全冗余环网架构

1)接入冗余。服务器双归接入交换机,服务器启用双网卡绑定功能,其中主、备网卡分别接入主交换机和备交换机,正常时,主网卡处于活跃状态,备网卡处于静默状态。当主网卡出现故障时,服务器的备网卡立刻激活,代替主网卡工作,实现环网保护。

2)交换机冗余。在每个节点机柜布置2 台交换机,一台为主,一台为备,两交换机之间通过堆叠线互连,用以传输心跳报文或业务数据。当主交换机故障时,数据切换到备交换机转发,实现环网保护。

3)线路冗余。节点之间主交换机与主交换机互连,备交换机与备交换机互连。配置跨设备的链路聚合,将2 条链路划入同一个跨设备Eth-Trunk接口,实现链路间的备份,保证了数据流量的可靠传输。

4)拓扑冗余。网络拓扑为环型,通过ERPS协议避免产生环路,防止发生广播风暴;同时在出现故障时,可快速激活冗余备份链路,恢复网络连通性,可达到电信级切换要求[3]。

该组网架构可以保证环网中出现二度故障时,业务不中断。全冗余环网架构拓扑见图1。

图1 全冗余环网架构拓扑

1.2 双环网架构

1)接入冗余。服务器2 块网卡不绑定,每个网卡均处于活跃状态。2 块网卡分别接到2 个互相独立的环网1 和环网2,由服务器的上层软件实现数据的“双发选收”,进行业务保护。

2)交换机冗余。在每个节点机柜布置2 台交换机,不区分主备,不需要互连,也不需要组成堆叠。2 台交换机分别属于2 个独立的环网Ring1 和环网Ring2,任何1 台交换机故障都只会影响其中1 个环网,实现冗余保护。

3)线路冗余。节点之间的2 条链路分别属于不同环网,其中1 条出现故障不影响另一个环网的运行,实现线路冗余。

4)拓扑冗余。2 个独立环网分别运行ERPS 协议,在环内避免发生广播风暴,并在故障切换时进行业务倒换,实现环内保护;环网Ring1 和环网Ring2 互为备份,进一步提高了其可靠性。

该网络架构同样可以保证环网中出现二度故障时,业务不中断。双环网架构拓扑见图2。

图2 双环网架构拓扑

1.3 单环网架构

单环网架构是双环网架构的简化,即去掉环网Ring2,只保留1 个环网。该架构无接入冗余、线路冗余、交换机冗余,只存在环路的拓扑冗余,可靠性相对较低;但由于其网络结构简单,节省了交换机资源和光缆(或电缆) 资源,降低了投资成本。单环网架构拓扑见图3。

图3 单环网架构拓扑

2 可靠性分析

网络系统的可靠性计算是当前研究的热门方向,主要有:状态枚举法、因子分解法、最小路(割)集法、不交化方法等精确算法;定界法、图变换、模拟法等近似算法[4-6]。这些计算方法都能有效解决网络可靠性的计算问题,但均较为复杂,直接应用于工程实践存在较大难度。本文提出的3种环网结构,其拓扑结构规则,每条链路、每个交换机的状态相互独立,可根据古典概型直接计算可靠性,计算过程如下。

2.1 全冗余环网可靠性计算

全冗余环网拓扑可等效为一些基本割集的串并联[7],其等效拓扑结构如图4 所示。

图4 全冗余环网等效架构

假设任意一条链路的可靠性为λ,任意一台交换机的可靠性为P,服务器发送端下挂在节点1,服务器接收端下挂在节点k,整个环路有n 个节点,系统 整体可 靠 性 为P1。记u=2λ-λ2,v=[λP(2-λP)],x=(1-P)·(λ+P-λP)·(λP)2,得到:

式中,P(La)为在环路无故障时,数据流通过顺时针方向链路La传输的可靠性;P(Lb)为在顺时针链路La不通后,数据流通过逆时针方向链路Lb传输的可靠性。为了减小计算P(La)、P(Lb)时的计算量,本文做了以下工程化假设。

1)通过拓扑分割成互相独立的子集,主设备与主链路、备设备与备链路各看作一个基本割集,本节点内只需要保证任意一个割集联通,就认为本节点通向相邻节点存在一条有效路径。此时,有2 种耦合形式会导致“黑洞路径”,需要排除。“黑洞路径”如图5 红线所示。

2)主备交换机之间的堆叠线,其距离近,且布置在有人值守机柜内,故障时可立即替换,维修耗时接近于0,因此可以忽略其可靠性对系统整体可靠性的影响,即默认可靠性等于1。

根据上述假设,记:

根据串并联概率计算方法,计算通过链路La通信的可靠性:

计算在La上发生“黑洞路径”概率,得到:

图5 节点间耦合故障

计算整条La的可靠性:

同理,可求得在La故障时,数据通过Lb传输的可靠性:

将式(2)、(9)、(8)代入式(1)、(3),得:

2.2 双环网可靠性计算

双环网拓扑亦可等效为一些基本割集通过串并联而成,其等效拓扑结构如图6 所示。

假设任意一条链路可靠性为λ,任意一台交换机可靠性为P,服务器发送端下挂在节点1,服务器接收端下挂在节点k,整个环路有n 个节点,系统整体可靠性P2,并记w =P(A网)。则有:

图6 双环网等效架构图

将式(14)代入(13),得

将(15)式代入(12),有

2.3 单环网可靠性计算

单环网只有1个ERPS 环,其可靠性即为双环网A 网的可靠性。设单环网系统整体可靠性为P3,有:

2.4 可靠性对比

根据广州地铁集团公司的光缆、交换机故障维修记录,在2004—2016 年的12 年时间内,网络故障主要来源于光纤链路故障,未发生过因为交换机故障而造成的网络中断。

根据交换机性能指标参数,其MTBF(平均无故障时间)=57 年,MTTR(平均修复时间)=2h,则根据可维修系统的可靠性计算公式[8~9],有

计算得到交换机可靠性P=0.99999,为计算方便,取值P=0.99。

对于光缆故障,由于其发生的随机性较大,光缆可靠性λ 可视为变量,在0.9~1 变化区间内,观察其对网络可靠性的影响。

根据上述分析计算结果,本文给出不同n(环网节点总数)、k(环网中,服务器接收端下挂的节点编号,该变量表示接收端到发送端的距离)值的可靠性曲线,如图7 所示。同时,为了直观看出不同网络架构的可靠性,给出故障率变化曲线,如图8 所示。

由图7、图8 可看出,全冗余环网的可靠性最高,双环网次之,单环网的可靠性最低。由于全冗余网络架构采用心跳线互联,可提供更多连通路径。经过分析计算得出:当设备可靠性、链路可靠性均在0.999 以上时,全冗余网络架构的故障率比双环网架构的故障率低3个数量级。

图7 3 种环网的可靠性对比

3 收敛性能分析

当网络出现拓扑改变或者故障时,触发网络链路切换。在网络状态收敛过程中,不同组网方式、不同协议条件下会产生不同的故障切换时间[10-12]。本文针对3 种组网架构,采用6 台华为S5700 交换机,分别根据图1~图3,在节点数n=3 条件下,给出在一度、二度故障条件下的试验结果,并简单分析影响切换时间的因素。3 种组网方式的性能对比见表1。

图8 3 种环网架构的故障率对比

表1 3 种组网形式性能对比

续表

经过测试结果对比分析,可以看到,全冗余网络收敛最慢,双环网和单环网收敛性能相当,但单环网可靠性低,不能进行二度故障保护。

4 结论

3 种组网方式各有优缺点,对比如表2 所示。

表2 3 种组网方式的优缺点对比

综上所述,在一些对可靠性要求极高的场合,全冗余环网是首选方案,适合在信号系统部署;在一些对可靠性、时延有一定要求,但要求又不是特别高的场合,双环网方案是首选,适合在地铁综合监控系统部署;在一些可靠性要求较低、时延要求高,且价格敏感的应用场合,如运维系统、PIS 系统等,可优先考虑单环网方案[13-18]。目前,3种网络架构在广州地铁旧线运维、新线建设中得到了广泛应用,将来可在轨道交通其他线路或其他应用领域推广。

猜你喜欢
双环环网网卡
直流电源系统环网故障危害分析
首个聚集可调双发射性质的手性双环分子研发成功
一起直流接线错误引起的环网故障分析
双环磺草酮与吡嘧磺隆混用对稻稗的防治效果试验
电力光纤通信环网的可靠路由与可靠性测评
浅谈PROFINET 环网冗余功能在汽车工控领域的应用
部署Linux虚拟机出现的网络故障
Server 2016网卡组合模式
模仿到底
挑战Killer网卡Realtek网游专用Dragon网卡