席晓宇
摘 要 随着时代的发展,信息技术的进步,计算机已经逐渐的成为了各行各业中不可取代的一部分,我国对于计算机技术的应用也十分的广泛。其中,计算机服务器系统是计算机中十分重要的一个技术,能够为国防、医疗以及金融等各个行业为计算机系统提供不间断的服务,如果它出现问题那么会造成十分严重的损失,因此应该对于计算机服务器系统的容错技术进行足够的重视并且对其进行进一步的发展。本文主要对其进行了详细的阐述。
关键词 计算机 服务器系统 容错技术
中图分类号:TP302.8 文献标识码:A
1容错必要性
随着计算机技术的普及,通过计算机系统来进行信息的传输并提供服务逐渐应用的越来越广泛,但是计算机的软硬件都有可能会发生故障,这些故障如果没有及时的进行解决很容易造成巨大的损失,甚至会造成整个服务的终止网络也会因此而瘫痪,因此产生难以估量的损失。因此,系统的容错性以及不间断的性质显得尤为重要,为了能够更好地保证系统安全、可靠地运行,必须要采取一定的措施来保证计算机系统能够在出现故障的时候已然可以正常的使用。经过人们地长时间的研究,总结出来了两种方法,一种叫做避错,就是使用正确的设计并且进行相应的质量控制尽可能的避免系统产生错误,防止将错误引进系统之中,但是在实际的运行中难免会产生一些意料之外的事情,因此这种方法在实施起来有着很大的难度。另外一种就是容错,在系统中出现了某些硬件或者软件的错误的时候,系统能够执行规定的一组程序,或者说这种程序不会因为系统的故障而被中断或者在中途被修改,且其执行的结果也不包含系统中的故障引起的差错。
随着科技的不断发展,计算机技术的逐渐普及,设备的安全性以及可靠性逐渐的引起了越来越多的人的重视,因此计算机服务器系统的容错技术十分重要。当系统的内部出现故障的时候,通过容错技术能够消除故障产生的影响并且使系统最终仍然能够给出正确的结果。按照时间进行故障的划分,故障可以分为以下几种类型:永久性的故障、间歇性的故障以及偶然性的故障。随着计算机的硬件技术的不断发展,容错计算机的系统开销逐渐的降低,同时纠错的速度变得越来越快。而软件方面的容错,对于硬件不会提出过高的要求。
2容错技术概述
容错指的是计算机系统的一个或者多个关键的部件发生故障或者将要发生故障的时候,仍然能够保持正常的工作而不影响其正确结果的一种性能或者是措施。容错往往是使用荣誉的方法来对故障及西宁消除的,因此冗余技術是计算机的容错技术的基础,一般情况下冗余技术可以分为以下的几种类型。
2.1硬件冗余
这种冗余技术指的是通过增加一定的硬件设备的方式来检测或者屏蔽一些故障。硬件冗余中可以将其再细化分为部分冗余和完全冗余两种主要的方式,对于完全冗余的方式来看,可以按照工作方式的不同而将其划分为热备、冷备、温备以及双工等四种工作方式。
在机器处于热备工作方式时,两个互为冗余的计算机系统都是处于加电的工作状态的,但是热备的计算机系统对于系统的处理结果不会输出。在主计算机系统发生故障的时候,热备计算机系统直接的接手主系统开始进行工作,在系统的故障修复完毕以后,热备的机器又再次的处于备用的状态。
与此相对的,冷备工作方式和热备工作方式存在一定的差异,冷备工作方式的备用计算机系统没有进行加电,当主机发生故障的时候冷备机器才会进行接手,在故障完成以后冷备机器又会重新的变成备用机器。
而温备的机器的工作方式则是冗余的两个系统都是处于加电的状态的,其中一个正在工作,另外一个处于等待的状态。如果工作的机器发生了故障,那么另外一个机器就能够直接进行接手工作,并且在故障结束以后主机继续工作,备用的机器继续变为备用状态。
双工的工作方式,指的就是在这个方式中两个机器处于同时工作的状态,并且将处理结果进行输出,在发生了故障以后,对两个机器的结果进行比较之后再进行输出,这样能够尽可能的降低故障造成的损伤。
2.2软件冗余
软件冗余指的是为了能够检测或者屏蔽软件中的一些差错,增加一些在正常运行的时候不需要的软件方法。和硬件系统的故障研究相比较而言,对于软件的错误进行纠正显得更加的困难,目前为止还没有一个相对来说比较成熟的、完整的方法来检测系统中软件的可靠性、安全性。目前来看,比较普遍使用的对于软件故障的处理方式有两种,一种是前向回复,一种是后向恢复。
其中,前向恢复主要指的是将计算机的当前计算状态继续的进行下去,然后将之后的状态能够正确的和当前的状态连接起来使其具有连贯性。目前来看使用的前向恢复状态的方法主要是N-versionProgramming方法,这种方法的基本思路是由不同的团队开始进行独立化的设计,然后通过使用不同的方法以及不同的设计语言,在不同的开发环境下使用不同的目的来展示同一个结果,这样就能够减少在各个版本的软件上出现相关的错误的可能性。
而后向错误指的就是在计算机的软件出现故障以后,将计算机的系统状态恢复到之前的某一个正确的状态上。目前来看比较普遍的一种后向恢复方式主要有恢复块方法以及防卫式程序设计两种方式。其中恢复块方法就是在同一个功能下,有主块和多个后备块,当主块运行的时候如果没有通过最后的验收测试,那么就指令第一个后备块开始进行工作,使其吃呢个为主块然后以此为顺序直到所有的后备块都被耗尽。在这样的方式下,设计出来的主块以及后备块应该尽可能的保持相对的独立性,这样就不会因为主块出现了错误而导致后备块的运行受到影响。
2.3信息冗余
所谓信息冗余指的就是除了实现正常的功能所需要的信息之外,额外的增加一些信息来保证程序能够正常的运行并且得到正确的结果。这些冗余的信息往往被加入到原始的数据中,加入的信息通常情况下包括检错以及纠错这两种编码。我们使用加入的检测编码来自动的检测软件中具有的错误,同时使用纠错的编码来对错误进行纠正。
2.4时间冗余
时间冗余就是通过额外的增加一定的时间来完成系统的某些功能,这些附加的时间主要能够用来进行故障的检测、或者故障的屏蔽上面。
目前来看,比较流行的时间荣誉方式有两种,一种是RSHW,这种冗余方式主要是对一组数据执行同一种指令,然后通过在相同的硬件上在不同的时间片对这些指令进行执行。另一种时间冗余方式则是使用数据延迟设备将其与表决电路结合到一起,将一次数据处理的输出结果进行不同的延迟大小的设置,使其能够复制成多个版本并且在表决器中进行比较。
2.5简单的双机备份
这种方式主要在20世纪30年代的时候得到了广泛的应用,通过使用双处理机或者双机的方式来进行容错。根据系统的工作情况的不同,又可以将之微热备份和冷备份这两种情况。
其中,双机热备份技术是一种将软硬件很好地结合起来的一种方案,这种方案主要包括两台服务器以及一个恭喜那个的磁盘阵列柜,还有相应的程序。在这种技术中,有着专业的人员对数据进行管理,并且这些数据是存放在这些磁盘阵列柜中,这样能够使得数据十分安全。在工作的时候,数据通过中央储存器进行读取以及存储,这样在实际的工作过程中及时主服务器出现了一定的问题,也能够有另外一台服务器理科的启动并且同时接替该主服务器的工作,从而保证了系统能够安全的运行。为了保证这个系统能够正常的运行工作,这个系统中运用了两台服务器,两台服务器之间互相的发送通讯信号从而保证联系,服务器在之前会约定好一定的时间间隔进行信号的发送,如果某一台服务器没有及时的发送信息,那么另外一台服务器就可以判断出这台服务器存在问题,系统的相应管理软件就会迅速的启动备用的系统,这样能够维持系统不间断的正常的进行工作。
而双机热备份方案中还可以进一步的区分出这样的三种模式:双机热备模式、双机互备模式、双机双工模式。
(1)双机热备模式,在这样的模式中存在着主服务器以及备用的服务器,这两台服务器能够同时的对数据进行写入,这样就保证了数据的同步。而当主服务器发生故障的时候,备用的服务器就能够及时的被激活,从而保证了服务器始终运行吗,确保了系统的安全。
(2)双机互备模式。这种模式下,系统中存在两台服务器并且这两台服务器能够同时的运行两个独立的应用,在运行的时候无论哪一台的服务器发生故障,另外一台服务器都能够接管这一台服务器的內容并且继续工作下去,这样就保证了的服务能够连续的运行,因此有着很高的安全性,并且这种模式下对于服务器有着较高的配置要求。
(3)双机双工模式。在这种模式下,即有两台服务器,这两台服务器能够同时的工作,并且运行的程序是一样的,这样能够保证负载较为均衡。
2.6操作系统支持的双机备份
这种冗余方式进行容错主要是在20世纪70年代的中期出现的,是一种软件和硬件结构的容错方式,这种容错方法是在操作系统的层次上的,支持联机的维修,也就是说故障部分在退出以后能够及时的进行维修并且在维修之后重新的投入到运行中,这个过程中对于正常的正在运行的程序不会产生影响。系统的容错是在操作系统下进行控制的,每一个处理机上面都保持了所有的系统资源的状态的表格,以及本机和其他机所具有的相关工作的工作进程。
2.7单机容错
所谓单机容错指的就是在系统中只使用一台服务器来进行一种高性能的容错。这种方式和其他的容错技术相比较而言所具有的最大优势就是能够把发货所能故障的模块自动的分离出去,并且把故障的模块和备用的模块记性调换,在故障的部分被排除以后,使用相应的容错技术能够保证系统继续的运行下去。为了实现真正的容错,单机的容错服务器能够通过系统内部的所有冗余的部件进行同步的运行。并且由于单机的容错方式实际上只需要使用一台服务器,而双机的容错模式则需要使用两台服务器,因此单机的容错方式相对表而言投入更少一些。目前市场上使用的单机容错产品除了有着较好的兼容性之外,还能够支持主板等关键性的硬件的热插拔,用起来十分的方便。
3结论
随着计算机技术逐渐的成为了人们的工作学习生活中不可或缺的一部分,人们对于计算机的依赖程度的增加,计算机服务器的故障性问题也逐渐的引起了越来越多的人的重视,其直接的影响到计算机的性能,并且如果没有设置相应的容错方案很有可能产生巨大的财产损失。因此,本文主要在介绍了计算机容错的必要性的基础上,对于现有的计算机服务器系统的容错技术进行了详细的分析,希望能够起到一定的参考价值,促进未来计算机服务器系统的容错技术的进一步发展。
参考文献
[1] 史飞.关于计算机服务器系统的容错技术[J].中小企业管理与科技(下旬刊),2016,(06):171-172.
[2] 吴辉明.关于计算机服务器系统的容错技术[J].电子测试,2015,(12):60-61.
[3] 吴玥.浅析计算机服务器系统的容错技术[J].无线互联科技,2014,(11):67-68.
[4] 许敏.分布式文件系统容错机制的研究与实现[D].电子科技大学,2012.
[5] 楚国锋.基于LoadRunner的高端容错机性能评测系统的研究与设计[D].哈尔滨工业大学,2010.
[6] 陈汇远.计算机信息系统安全技术的研究及其应用[D].铁道部科学研究院,2004.
[7] 邵艳明.集群视频服务器容错与流共享策略研究[D].华中科技大学,2004.
[8] 谷国栋.容错冗余技术研究及其在水利枢纽工程计算机监控系统中的应用[D].河海大学,2001.
[9] 庄蓉茹.集群系统下的通信系统开发[D].昆明理工大学,2001.