计算机网络可靠性技术的工程应用

2014-09-02 02:38马代军
中国科技纵横 2014年15期
关键词:恢复工程应用通信

马代军

【摘 要】 随着信息技术在经济社会各领域的广泛应用,大量信息平台建成并投入使用,计算机网络作为信息平台的支撑基础,其可靠性已关系到了使用者的工作效率和生活舒适程度。计算机网络的可靠性设计是网络系统规划的重点之一,本文通过对实际建成的计算机网络工程分析总结,从工程应用的角度来探讨计算机网络可靠性的设计要点和实现方法。

【关键词】 信息 通信 计算机网络 可靠性 恢复 工程应用

1 概述

计算机网络系统的可靠性在规定的条件下和规定的时间内网络完成信息交换(数据通信)的能力,这里就涉及到了连通性(节点之间要保持通信)和有效性(节点间的通信要保持一定的质量,如延迟、抖动、速率等指标)两方面。由于计算机网络系统的可靠性是在破坏或故障的情况下保持通信,所以还涉及到了抗毁性和生存性,确保在部分节点、线路失效后,网络依旧保持信息通信能力。

2 影响计算机网络可靠性的因素

计算机网络不可靠的表现从轻到重一般是网络变慢(速率降低、响应超时)、数据出错(或数据丢失)、服务无响应(或响应错误)、网络阻塞(慢到无法使用)、网络局部中断、网络全面崩溃等。网络可靠性指在部分网络组件(节点或线路)发生失效的情况下,网络保持正常通信的能力。

网络组件失效的情况一般有故障(设备或线路损坏)、错误(软件或配置出错)、干扰(电磁、温度等环境干扰)或者破坏(自然灾难、人为事故)等。以下是影响网络可靠性的具体因素:(1)硬件设施:设备和线路自身的可靠性、维修性;(2)运行环境:设备工作环境的电源、温湿度、洁净度、电磁干扰等;(3)网络管理:网络监控和管理及相关规章制度;(4)网络架构:网络拓扑、层次规划和网络协议、算法等。网络架构是实现网络故障监测、隔离和恢复的关键,直接关系到网络在组件失效情况下的自我恢复能力,是决定计算机网络可靠性的主要因素。

3 提高计算机网络可靠性的方法

要保证网络的可靠性,在保证网络组件自身可靠性的前提下,主要是采用容错技术和冗余设计,使用检测(发现故障)和恢复(倒换恢复)的手段,使网络在通信不受影响的前提下自动恢复。保障计算机网络可靠性的方法可按以下层次分类。

(1)提升网络组件可靠性:选用高可靠性的网络、主机等设备和软件,并对设备的易损和重要部件热备(如电源冗余、管理引擎冗余、磁盘阵列、网卡冗余等);选用合适的通信线缆并加以适当保护;采用不间断电源、机房空调、环境监控等,确保设备工作环境符合要求;采用防火墙、入侵检测、病毒过滤、行为管理、流量控制等安全控制措施。保证设备设施自身的可靠性。

(2)提升网络系统可维修性:对关键和重要设备(如中心和汇聚交换机、骨干路由器、重要服务器等)进行整机热备(如双机双工、双机热备、负载均衡、服务器集群等);对主干和重要线路进行双线路备份;对数据做离线备份和远程备份;对机房供电线路、UPS、机房空调等冗余备份。即使发生设备、线路故障,也有冗余系统可供切换,保证网络主干的可维修性。

(3)提升网络自动恢复能力:结合网络拓扑、层次结构、设备冗余等手段,采用网络故障检测(UDLD/DLDP、CFD、BFD等)和网络故障倒换(MSTP、HSRP/VRRP等)等技术,在发生故障时,网络快速计算并收敛、重构,自动隔离故障和恢复通信。保证网络可靠性的有效实现。

4 实现计算机网络可靠性需求的技术措施

在计算机网络工程可靠性系统的设计和施工过程中,除了采用重要设备易损部件冗余、机房环境监控和管理、网络安全控制管理等手段外,更关键的是在网络主干设备和线路冗余的基础上,采用合适的故障检测和倒换恢复技术,实现故障快速恢复和流量负载均衡,提高网络通信效率,进一步提升网络可靠性。

计算机网络主干冗余一般包含中心交换机双机热备、汇聚交换机双机热备、网络骨干线路冗余、关键线路(如互联网出口)冗余等,汇聚层到核心层之间通过冗余主干链路做口字或交叉连接,接入层到汇聚层做双链路连接。网络故障检测通过链路检测(数据链路层使用UDLD/DLDP、CFD等技术)和网络检测(网络层使用SLA/NQA、BFD等技术)实时监测网络路径的连接状态,确定故障,为故障隔离和倒换恢复提供服务。网络故障倒换恢复则通过冗余设备和冗余连接,当故障发生时快速切换,以保证通信连续和服务可用。

网络主干冗余的倒换恢复通常采用以下技术措施:

(1)生成树协议:根据链路状态和优先级设置来阻塞或打开冗余链路,实现链路备份。结合VLAN规划,采用MSTP,多个生成树实例以不同VLAN走不同路径的方式可实现数据链路层的负载均衡传输。生成树协议适合于各种网络环境,但收敛速度较慢,只能以秒级(或更大)的速度迁移倒换,且网络直径不宜过长、冗余连接不宜过于复杂,否则故障时网络收敛和倒换恢复时间过长,还易引起网络频繁震荡,反而降低网络性能。

(2)热备份路由协议:根据路由器状态和优先级设置来切换虚拟路由器中活动路由器,实现路由备份。结合VLAN规划,采用HSRP或VRRP,多个虚拟路由器(成员路由器优先级不同)以不同VLAN访问不同网关的方式来实现网络层的负载均衡传输。

(3)路由策略:对不同的访问源或访问目标使用不同的匹配规则来应用路由重定向等动作,实现路由备份。结合VLAN规划和IP分配,以不同用户使用不同网关的方式来实现网络层的负载均衡传输。

(4)链路聚合:将多条物理链路合并成一条更高带宽的逻辑链路,可实现链路备份和负载均衡传输。链路聚合在故障发生时,网络通信基本上没有中断,且直接将单条链路扩容数倍,性能效果最好。但只能用在两台设备直接相连的环境中。

(5)备份链路:单台设备采用两条链路连到两台上游设备,故障发生时快速切换到备用链路。结合VLAN规划,采用SmartLink或FlexLink,以不同VLAN使用不同链路的方式来实现数据链路层的负载均衡传输。故障时收敛速度可达亚秒级,但只能用于双上行部分,不能适用于复杂网络环境,且与生成树协议互斥。

5 结语

随着网络环境愈加复杂,用户需求日益增加,实现计算机网络可靠性面临的条件和问题也越来越多。对于每一个计算机网络工程可靠性系统的建设,都应当根据用户的实际环境和具体需求,结合投资预算,从工程项目全生命周期出发,全面考虑设计、施工和运行维护等实际情况,选择最合理的技术手段,构建最适合于该用户的网络可靠性体系。endprint

猜你喜欢
恢复工程应用通信
联梁型钢大跨度悬挑脚手架技术在工程中的应用
对数字微波通信技术的研究