计算机技术可靠性分析

2018-05-14 02:36李宗泽
科学与财富 2018年9期
关键词:故障率使用者可靠性

李宗泽

摘 要: 随着现代技术的进步,计算机技术得到普及,人们对于计算机技术应用的可靠性也越来越重视。文章对常用的计算机技术进行对比。对计算机特性进行更进一步的阐述,为微机应用和鉴定的使用者提供系统方案,并分析计算机可靠性的发展趋向。

1.引言

技术的进步推动科技的发展,微机技术的应用领域范围不断延伸[1-2]。人们对计算机系统的可靠性要求更加严格,供应商也提供越来越多的技术手段。因此本文以常用的可靠性技术手段为基础,对其特性进行全面分析,为使用者提供决策依据[3]。

2.可靠性技术研究

微机应用系统的可靠性是指给定固定时间,在这个时间范围内保证系统能正常运行的概率,影响因素是在运行过程的故障率造成的。对于一个应用系统,无法实现绝对无故障,只能通过降低故障率来提高运行系统的可靠性。

一般对于系统运行技术的应用,按要求不同使用相应的技术。影响故障的因素主要有运行系统的费用、操作技术人员的生命和使用者的需求,分出不同的等级,有以下相应技术。

1)费用的影响主要适用于商业领域;

2)对于微机军用系统或者核电站等重要或危险场所对操作人员的生命影响比较大;

3.可靠性

3.1故障的分类和故障机理

从系统运行功能上分析,主要分为三大故障:硬件、软件和过程故障,不同原因对应不同的故障特点。硬件故障:设计不合理;整体结构不完善;可靠性不高等;软件故障:代码编写不正确;系统无法正确读取数据等;运行故障:操作步骤不完善,文件不正确等。

从可靠性方面分析,主要故障有:很多对于可靠性的高要求在实际运行中可能只是对于某一些故障类别有特殊要求,在设计过程中可以对此进行费用、程序进行合理规划,既能节省费用也能提高可靠性。

3.2可靠性参数

常用度量可靠性参数主要有可靠性、可维性、可用性,被称为RAS技术。其中常用的指标是可靠性技术指标。在实际使用过程中,虽然可靠性技术指标指向明确,但是在供应商和使用者之间对故障率存在不同看法。比如,对于一台中央处理机的可靠性进行检测,往往使用者发现的故障远远高于工程师检测的故障率,而对于这些故障问题,大多情况下只需要关闭系统重新起动即可。

为了使使用者切实感受到微机系统运行的可靠性,使用者可以选择最好的运行系统,并对故障提前做出应对措施,让使用者充分了解系统的可维护性、诊断性以及如何恢复等操作技能。

3.3可靠性的技术条件

为了对系统的可靠性进行综合分析,从以下几个方面进行讨论:

1)系统开发成本:决定了系统级别,也是可靠性技术的一个重要支撑;

2)技术的复杂性:主要是硬件的复杂程度,为系统工艺精确性提供保障;

3)系统的开发难度:决定了系统的成本和适用范围;

4可靠性技术剖析

硬件、软件和使用流程都是影响可靠性的因素,包括一些技术手段、防错技术、容错技术、维护措施等,针对这些技术特点,本文进行详细阐述,为使用者提供更完善的决策依据。

4.1系统结构技术

对于系统的可靠性往往从使用者要求的服务质量和经济性进行选择合适系统结构。对于子系统的可靠性一般采用软件技术,而子系统的可靠性对整体系统的影响也至关重要。通过实验验证,对于一个拥有四个子系统的系统,串联系统要比串并联系统的可靠性高。

4.2防错技术

这项技术要求在系统设计过程中提前考虑影响因素并避免。遵守的原则有:

1)保证元件质量:在保证成本合理情况下,选用可靠性高的元件;

2)结构合理:系统结构要简化,使用比较成熟的结构设施,减少故障率;

3)设计合理:对于仿真模拟电路要进行实际实验;减少集成电路的分电路,对电路进行简化;

4)采用先进的并且成熟的技术。

4.3容错技术

为了提高系统的可靠性,容错技术是对软件和硬件技术很重要的一项技术措施。容错技术可以对一些系统设计进行合理的补充,使系统可以正常運行。

冗余技术和检测技术是容错技术的两大组成部分。

(1)冗余技术

作为容错技术的重要组成部分,冗余技术是附加软件、硬件、时间或他们之间的组合。他们的特点主要有:

1)屏蔽冗余,也称为静态冗余,能够通过附件分元件对故障元件进行屏蔽。有N模冗余系统,一般N为奇数,若多块模块可靠性高,则必须保证单个模块的性能提高。纠错码在冗余系统中能够实现故障的自行监测和故障屏蔽,他的特点是当容错能力固定时,N模冗余模式相对于编码可靠性更高;当复杂程度是定值时,合理编码更能提高可靠性。

2)动态冗余,指的是系统运行过程中,指定一个模块运行,若此模块发生故障则直接被换掉。

3)混合冗余,此方式可以通过计算设备模块的数量,来计选择模块的最佳值,达到最优可靠性。

4)自清除方式,其特点是与一般冗余方式相比结构简单;若果系统具备修复功能时,则更能显示此系统的优势,特别对于数字系统效果更加明显;随着现代设备容量的加大,表决器也会变得更加复杂;如果改用其他的元件,不仅会增加成本,可靠性也会大打折扣。

(2)检测技术

容错要求系统运行过程应把故障进行屏蔽,但过多的故障累计可能会导致系统运行的失败。为防止这种现象发生,需建立相应的检测技术来发现故障并及时进行维修,减少故障率,降低维修时间,减少成本。建立故障检测机制分为硬件检测和软件检测。硬件检测要对编码进行检验,并定时重复校验,硬件检验设施比较全面。软件故障检验主要是对数据和控制程序和功能进行检验,但在实际运行过程中比较复杂,应用成本高。

4.4降格恢复运行

除了采用冗余技术改善系统运行的可靠性,我们也可以运用分离方式把故障模块分隔,再对其余模块进行重组,通过降级使系统工作,就是降格恢复运行。这种运行方式工作的首要条件是系统能够接受降级工作,再次降格不影响系统工作的正常运行,并在不能维修的状况下能实施全恢复。对于效率要求高的系统中,比较适合采用此方法。

5可靠性技术比较

在避错、检测和动静态冗余这几项技术中,综合成本避错技术最低,静态冗余的可靠性改善程度最好,但复杂性也是偏高,技术难度较大,而避错技术相对简易。

6可靠性设计方法

(1)可靠性分配

明确各项要求指标,并确定在系统中的重要程度和复杂程度以及维修成本和是否易于维修,对各部分进行合理分配,使子系统、整体和操作人员得到优化配置。

(2)可靠性评估

根据系统要求确定材料的可靠性,进行整体评估,提出方案,对数据进行分析。

(3)可靠性设计

1)根据使用者和系统本身的要求,分析材料,设计合适方案。

2)如果设计的系统运行可靠性低,则要采取措施提高可靠性,既要防止人为的失误操作,也要增加系统的安全指数;可运用自动检测系统进行故障分析。

3)设计过程中,如出现冲突,要对矛盾进行分析,减少损耗,进行合理取舍,最终达到较强功能和可靠性的方案。

4)可靠性预测和验证

了解系统性能,对改进提出适应方案。并在使用寿命,应用环境和维修以及模拟阶段进行试验验证。通过这些环节确定系统的可靠性,如果不达标,及时找出问题进行改进。

7结束语

科学技术和应用电子的发展使微机系统应用更加广泛。系统结构的复杂要求微機系统的各个组成部件设计更加精细,再加上人为操作等社会环境的偶然因素,都使系统可靠性受到影响。

针对这些原因,我们更要在系统设计中发挥我们的特长,不断设计过程中总结经验,提高系统的整体性能。

参考文献

[1]黄永勤, 金利峰, 刘耀. 高性能计算机的可靠性技术现状与趋势[J]. 计算机研究与发展, 2010, 589-594.

[2]于银凤. 计算机网络可靠性提高方法研究[J]. 电大理工, 2016, 28-29.

[3]李霄, 郭彤, 王常洲. 企业计算机应用系统可靠性测试技术研究[J]. 中国科技信息, 2013, 87-88.

猜你喜欢
故障率使用者可靠性
可靠性管理体系创建与实践
新型拼插休闲椅,让人与人的距离更近
探索零故障率的LED智能显示终端
5G通信中数据传输的可靠性分析
抓拍神器
基于故障率研究的数字保护最优检修周期
基于可靠性跟踪的薄弱环节辨识方法在省级电网可靠性改善中的应用研究
降低空气开关跳闸故障率的措施研究
可靠性比一次采购成本更重要
降低集控中心计算机故障率措施