提高通信网络可靠性的方法探讨

2009-10-29 10:07白生谦
移动通信 2009年16期
关键词:拓扑结构通信网络可靠性

【摘要】文章通过分析得出了影响通信网络可靠性的因素,从提高节点/设备的可靠性、优化拓扑结构、使用网络保护与恢复技术、使用差错控制技术等几个方面详细介绍了提高通信网络可靠性的方法和需要注意的问题。

【关键词】通信网络 可靠性 拓扑结构 保护与恢复 差错控制

通信网络在运行过程中往往会出现设备故障、链路失效、信道拥塞、通信中断等问题,严重影响用户的正常使用。这些问题都与通信网络的可靠性有关。目前对于通信网络可靠性的研究集中于可靠性的计算和评估方法,而对于如何提高可靠性涉及的不多。因此,研究提高通信网络可靠性的方法并付诸实际,有助于改善通信网络的性能,对通信网络技术的进一步发展也具有重要意义。

1 通信网络可靠性分析

我国的国家标准规定了产品的可靠性定义:产品在规定的条件下和规定的时间区间内完成规定功能的能力[1]。由定义可知,它包含产品、规定条件、规定时间、规定功能和概率(即测度)等5项要素。

通信网络与一般产品既有共性也有区别。对于通信网络的可靠性,研究人员提出了不同的定义,有的强调生存性,有的强调可用性,有的强调有效性,不一而足。其中之一为:通信网可靠性是指通信网在实际连续运行过程中完成用户的正常通信需求的能力[2]。它既包含了网络的生存能力和可用性,也反映了网络对用户需求的适应能力;既研究网络正常运行情况下的可靠性,也研究异常情况下的可靠性,是对整个网络运行过程的综合测度。这一定义包括了可靠性主体、规定条件、规定时间、规定功能和概率等五项要素,与产品的可靠性定义相当吻合,同时又突出了通信网络自身的特点。

通信网是由传输、交换、终端设施和信令过程、协议以及相应的运行支撑系统组成的复杂综合系统,影响其可靠性的因素很多,具体可以分为内部因素和外部因素。内部因素指设备可靠性、网络工程设计、网络的组织和维护管理等;外部因素是指通信设备和通信网所依存的环境条件。通过理论分析和工程实践相结合,这里总结出影响通信网络可靠性的因素如下:

◆通信网络的构成部件的可靠性;

◆通信网络的拓扑结构;

◆通信网络的故障诊断能力;

◆通信网络的保护与自我恢复能力;

◆通信网络的传输质量;

◆通信网络的管理与维护;

◆通信网络的运行环境;

◆其它影响通信网络可靠性的因素。

2 提高通信网络可靠性的方法

2.1 提高节点/设备的可靠性

通信网络的连通性变差将导致网络的拥塞,网络时延和吞吐量等性能指标下降,进而导致网络的服务质量(QoS)下降。造成网络连通性变差的原因主要是节点失效和链路失效,而节点失效的影响往往更大。因此,提高节点/设备的可靠性、降低失效率,是提高通信网络连通性最直接的办法。

通信网络的组成设备基本上属于电子设备,影响电子设备可靠性的因素主要包括所采用元器件的可靠性、电路结构、制造工艺、使用环境和操作使用等。提高电子设备可靠性可采用以下方法:

(1)简化设计:设备的可靠性与其复杂程度成反比,在满足指标要求的前提下应尽量简化设计;

(2)余度设计:为重要部件和易损部件设置备份,一旦发生故障便启用备份部件;

(3)故障树分析:通过分析可能发生故障的原因,寻找设计漏洞,以改进设计;

(4)热设计:温度对电子元器件影响很大,通过热设计确定设备在环境温度过高或过低时应采取的措施;

(5)机械应力的防护设计:采取加固、减震等措施,降低冲击、振动等机械应力的影响;

(6)电磁兼容性设计:减少传导、辐射耦合等各种电磁干扰,使设备的性能不至降低;

(7)元器件筛选:选择经特性测试正常的元器件施加外应力,剔除不合格的元器件;

(8)元器件的降额使用:选择额定指标高的元器件,使其工作条件始终低于额定指标;

(9)软件可靠性设计:采取避错设计、查错设计、纠错设计和容错设计等方法提高软件可靠性。

2.2 优化网络拓扑结构

一般来说,环形网和网状网的可靠性总是要好于链形网和树形网,在网络设计时多使用网状结构和环形结构是提高网络可靠性的有效办法。而一味追求网络结构最优化也不可取,还必须考虑到网络的建设成本是否合理。

规模较大的通信网通常可分为核心网和接入网,相应地网络中的节点也分为核心节点和接入节点。核心网处于整个通信网络的核心,承载的业务量大,对网络可靠性的影响也比较大。因此,综合考虑网络可靠性和建设成本,可以在核心网采用网状或环形结构,接入网采用链形或树形结构,组成复合型的拓扑结构(如图1)。

对于已经投入使用的网络,也可以通过对拓扑结构的微调提高网络的可靠性。例如,在链形网两端节点之间增加一条链路以组成环形网,就是一种有效的办法。

2.3 使用网络保护与恢复技术

增强通信网络的生存性,减小链路失效对通信网络的影响是提高通信网可靠性的有力措施。通信网络的生存机制包括保护与恢复两种。保护机制的基本思想是预先规划一部分冗余容量作为备用系统,当传输线路或者节点出现故障时,将受故障影响的主用系统迅速倒换到备用系统上;恢复机制是指网络失效后,动态寻找可用资源并采用重新选路的方式绕过失效部件。表1列出了通信网络几种生存技术的对比:

在工程应用中,需要注意以下几个方面:

(1)线型保护包括1+1、1:n和m:n三种方式。1+1方式属于专有保护方式,最可靠但利用率也最低;1:n和m:n属于共享保护方式,资源利用率相对较高。线型保护资源利用率低、成本高,多数网络不必实现全保护,可以优先保障对通信网络可靠性影响较大的链路[3]而在可靠性和成本之间寻求平衡。

(2)针对不同的业务应该采取不同的保护恢复策略。对QoS要求很高的专线业务,可以采用永久1+1的保护方式,取得极高的可用性;对于实时性和可靠性要求较高的业务,可以采用1+1保护与恢复相结合的方式;而对于实时性和可靠性要求较低的业务,或那些在业务层面有冗余带宽保护或者无需实时保护的业务,可以采取动态恢复的方式。

(3)通信系统的不同层面(如链路层、业务层等)可能会同时启用保护与恢复机制,这就涉及到层间协调问题。目前解决的方式包括两种:a)优先启动低层的保护恢复,当低层不能完成时再启动高层的保护恢复,这对层间协调的要求比较高;b)优先启动高层的保护恢复,这种方式的问题在于低层故障发生后会影响多个高层业务。

2.4 使用差错控制技术

信道上传输的信号容易受到信道传输特性以及噪声的影响,使得通信接收端产生误码。要提高通信的可靠性,就应当根据信道特性,合理设计基带信号,选择合适的调制解调方式及发射功率,采用均衡技术消除或减少码间串扰等。但很多情况下,仅仅这样是不够的,还要通过信道差错控制来改善通信系统的传输可靠性[4]。

差错控制有以下三种方式:

(1)自动请求重发(ARQ):当接收端发现差错时,设法通知发送端重发,直到收到正确的码字为止;

(2)前向纠错(FEC):接收端不但能发现差错,而且能确定二进制码元发生错误的位置,从而加以纠正;

(3)混合方式(HEC):发送端编码具有一定的纠错能力,接收端对收到的数据进行检测。如发现有错且未超过纠错能力,则自动纠错;如超过纠错能力则发出反馈信息,命令发送端重发。

三种差错控制方式的比较参见表2。可以看出,三种方式各有其优缺点和使用范围,应结合实际应用选择适当的方式。

3 结束语

除了以上介绍的几种方法,还有流量分配、路由控制、维护管理等多种方法提高通信网络的可靠性。在笔者从事的工程项目中,通过各种方法的应用,使目标网络的可靠性提高了两个级别。

可靠性是通信网络的重要属性。随着通信技术的不断发展和网络规模的不断扩大,对网络可靠性的要求越来越高。本文结合工程应用提出的几种提高通信网络可靠性的方法,对它们的研究对于通信网络的设计与规划、网络维护以及管理等方面也有参考价值和指导意义,有助于改善通信网络的整体性能。

参考文献

[1]GB/T3187-1994. 可靠性、维修性术语[S].

[2]丁开盛,张学渊,梁雄健. 通信网可靠性的定义及其综合测度指标[J]. 通信学报,1999,20(10): 75-78.

[3]戴伏生. 通信网络各节点和链路重要性的客观评估方法[J]. 南京理工大学学报,2006,30(6): 748-754.

[4]李兵,蔡晓霞,陈红. 差错控制对数字通信系统的可靠性的影响[J]. 电子科技,2005(8): 34-38.★

【作者简介】

白生谦:中国电子科技集团公司第五十四研究所工程师,硕士毕业于西安电子科技大学,主要研究方向是通信系统与网络。

猜你喜欢
拓扑结构通信网络可靠性
可靠性管理体系创建与实践
5G通信中数据传输的可靠性分析
浅谈P2P网络的拓扑结构
空间激光通信研究及发展趋势
物联网关键技术的发展对通信网络的影响
信息办公平台网络优化设计
基于可靠性跟踪的薄弱环节辨识方法在省级电网可靠性改善中的应用研究
可靠性比一次采购成本更重要