于继江,陈 为,董中平
(中国食品药品检定研究院,北京,100050)
计算机网络的可靠性被定义为特定条件下,规定时间内,网络所能够保持的连通和数据通信的能力,该性能是计算机网络设计、运行的核心参数之一。其中,特定条件是指如规定操作方式、负载条件、网络环境的温湿度等;规定时间是指计算机网络的运行时间。利用上述定义可以获得计算机网络在上述顶一下可完成相应功能的概率,该概率可用于直接反应计算机网络是否可靠。
为便于分析和计算,实际研究中需要将计算机网络这一复杂的系统化简处理为可进行理论分析的具体的网络模型,然后分别对每一模型进行可靠性问题求解。通常,计算机网络的模型可用概率图 来描述,该概率图中的V 是指计算机网络中的终端、服务器等设备的集合,E 是指计算机网络中的具体的链路。为应用该概率图进行可靠性分析,需要对网络模型进行如下几点假设:(1)网络是连通的,反映在概率图上为图中的任意两个结点之间都存在一条可连通的链路;(2)链路介质的可靠度与结点距离无关;(3)网络内的结点是理想的,即结点设备本身不存在故障;(4)计算机网络只有正常和故障两种状态,且设备、链路相互独立,这样可以保证所发生故障的独立性;(5)网络正常运行概率可知,分为结点和链路两部分,且两部分正常运行的概率统计独立;(6)网络模型还可以用多状态模型进行刻画。
在该假设下即可得到计算机网络的概率图,图中的可靠性问题由可靠性分析和可靠性设计两部分内容构成。
由于计算机网络的部署与设计存在持续性和不确定性,故大型计算机网络中常常会采用多种网络设备进行部署,只要这些设备之间能够很好的兼容其他设备,且能够提供高质量的信息传输服务即可。为保障计算机网络的完整性、提升网络可靠度、降低故障发生概率和传输误码率,就必须协调好各设备之间的关系,使用现金的网络管理技术对网络进行管理。可见,网络管理是否有效,是否能够及时发现和帮助排除计算机网络中出现的故障对计算机网络的可靠性运行具有十分重要的影响。
计算机网络是由结点和介质链路组成的,通常情况下网络链路的可靠性较高,而网络故障的原因大多集中在网络结点位置。
(1)结点的影响。终端交互能力越强,其所在计算机网络的可靠性越高,若用户终端中可以采用冗余设计,如使用两块网卡同时与不同局域网建立连接时,其所具有的可靠性必然会高于单网卡用户终端设备的可靠性。服务器是计算机网络的信息中心,其主要负责向用户提供相关的网络应用和网络服务,服务器可靠性的高低直接关系到其所在计算机网络的运行效率与可靠性。为确保计算机网络的可靠性,提升计算机网络的应用效果,网络中所架设的服务器必须采用双机热备份的冗余设计。
(2)传输交换设备的影响。虽然传输介质对计算机网络可靠性的影响不如结点高,但是其一旦出现故障则需要相当大的代价进行故障查找与排除。为确保计算机网络的持续应用性,在采用标准线路按照布线要求进行布线的同时,还应该适当的采取一些冗余设计方案进行双线架设,确保一旦其中的一条线路出现问题可以快速切换到另一条正常线路中,降低故障持续时间。
计算机网络的部署与建设是依照严格的规划和设计方案执行的,若设计方案不合理,网络拓扑结构存在问题则必然会在应用过程中使得计算机网络的可靠性大幅度下降。经验表明,若想获得较高的网络可靠性,就必须依照计算机网络的规模和层次进行具体的分析与设计,确保所设计的拓扑结构与实际应用相匹配。
在规划设计计算机网络时,为保证所设计的网络具有良好的应用特性和较高的可靠性,应该遵循如下几条设计原则:(1)依照国际标准进行网络设计,确保所设计的网络对异构系统和异种设备具有良好的支持与兼容,保证所设计的网络扩展性强;(2)尽量选用成熟的、先进的网络技术,在保证所设计的网络具有良好的兼容性和优良的运行稳定性,必要时可同时采用多种拓扑结构进行组合设计;(3)设计计算机网络时应该尽量让其支持较多的通信协议和通信标准,以增强其与其他网络或特殊环境下的互联能力
计算机网络的可靠性主要是通过系统的容错性进行反映的,对计算机网络进行可靠性优化时可以以提升系统的容错性为出发点进行冗余设计,降低网络故障发生的概率和持续时间。具体的设计方案如下:
(1)计算机网络以并行主干,为网络配置双网络中心为主。
为确保用户终端和网络服务器的运行可靠性,可分别将用户终端与网络服务器同时连接到多个网络中心中,并为其设置自动转接功能;边界网络与网络中心的连接使用多数据、多路由的方式实现,即便某一链路出现故障也不会产生大范围的网络故障;网络应支持热插拔,可进行功能模块替换,这样不仅可以增强组网的灵活性,还能够确保网络故障时能在不断电的情况下完成故障设备的替换工作,避免全局性的断网情况发生,有效提升网络的容错能力;在计算机网络的系统层面采用双机热备份机制进行构建,正常运行中备用设备定期与主运行设备进行同步,一旦出现故障则直接接管故障设备的功能为用户提供服务,必要时还可以设置异地存储备份机制,以确保重点数据内容不被破坏;网络操作系统应尽量依照多处理器进行定制化设计,以便于提供应急恢复与保障机制。
(2)网络层面采用双网络冗余设计
双冗余设计是指在现有网络的基础上添加一套新的,功能完整的备用网络,网络内的终端和服务器同时与主网络与备用网络进行连接。正常情况下,终端可以使用两套网络同时进行数据传输,也可以只使用其中一套网络进行数据传输。该设计方案的优势在于在计算机网络的物理层面实现了可靠性的提升,即便其中某一网络的某一部分出现故障也不会出现网络通信中断的现象。
具体来说,评价计算机网络可靠性的指标至少包含以下几项内容:用户在计算机网络应用过程中的网络体验反馈;网络服务质量投诉率;网络故障统计概率;网络系统软件崩溃或无响应概率;网络传输设备、交换设备、存储设备的可靠度;链路通信过程中的失败次数统计概率;网络服务器的故障率以及用户终端的可靠度;计算机网络的平均连通率或间隔时间内的网络无故障次数;网络故障持续时间以及从网络故障到网络恢复的时间间隔;网络安全认证体系以及网络组织管理制度的评价等。
可见,上述几项指标中,部分指标可用具体的数值进行衡量,这些指标被称为数值型变量,部分指标无法使用具体的数据进行衡量,这些指标被称为语言型变量,在为不同的变量制定衡量标准时应该依照指标的类型制定相应的量纲和衡量规范,以能够让上述指标充分反应计算机网络的可靠性能。
计算机网络的迅猛发展使得可影响计算机网络可靠性的因素不断增多,为保证其可靠性就必须从实际出发,总结归纳影响计算机网络可靠性的原因,为其制定切实可行的优化策略或优化方案,并在优化完毕后及时对优化结果进行评价,为后续的优化和改进提供参考依据。
[1] 刘君.计算机网络可靠性优化设计问题的研究[D].沈阳工业大学,2006(3)
[2] 陈聪.计算机网络可靠性优化技术研究[J].信息通信,2013(1)
[3] 李宗英. 计算机网络可靠性优化技术[J]. 软件导刊,2008,7(6):
[4] 滕云微.网络可靠性分析系统的设计与实现[J].计算机信息,2008