湖南师范大学文学院 李达清
嵌入式计算机控制系统容错策略
湖南师范大学文学院 李达清
在信息时代快速发展的背景下,计算机与互联网已经成为人们日常生活、学习与工作中的重要组成部分。计算机控制技术的广泛应用,尤其是在航空航天、工程设计、精密器件生产管理等方面具有重要应用价值。在此过程中,计算机具有的容错性至关重要。基于此,本文以嵌入式计算机控制系统为例,对嵌入式计算机控制系统容错工作模式与系统容错策略进行了分析,以供参考。
嵌入式计算机系统;系统容错性;系统容错设计
在计算机控制系统不断创新与发展的背景下,容错计算机控制系统整体性能得到了有效提升,并被应用于电子通信、工业制造、航空航天、公共服务等领域中,为计算机控制系统运行的稳定性、准确性提供了保障。对嵌入式计算机控制系统容错策略的研究,有利于进一步明确并掌握嵌入式计算机控制系统存在的问题,为嵌入式计算机控制系统容错设计提供依据,以便进一步提升计算机控制系统功能的最大化发挥。
近年来,随着计算机技术的不断创新与普及应用,构建计算机控制系统已成为各领域各行业现代化建设工作中的重点内容之一。随着计算机控制系统应用价值的提升,计算机控制系统稳定性与运行安全性问题的研究被提上日程。而据分析发现,受大数据以及我国计算机技术水平的影响,提升计算机控制系统稳定性的重要途径在于强化系统的容错性。
容错(Fault-tolerance),通俗的说就是容许错误、容忍故障,。以嵌入式计算机控制系统为例,当系统中一个或多个硬件、软件产生故障与错误时,系统可以自动进行检测与诊断,并执行既定程度,保证系统规定作用的正常发挥,进行正常运行。
因此,明确嵌入式计算机控制系统容错策略,从系统结构出发实现容错技术的有效应用,是提高嵌入式计算机控制系统可靠性的重要举措,具有一定研究价值。
现阶段,在计算机运行过程中,嵌入式计算机控制系统容错一般分为以下几个阶段,进行系统故障处理。
第一,系统故障检测:由于嵌入式计算机系统故障最终结果多为逻辑故障,容错系统可通过“一致性校验”或“奇偶校验”进行具体检测。目前,在故障检测主要分为两种类型,即线检测与离线检测。其中,在线检测具有实际检测功能且与计算机控制系统运行具体协调统一性,因此多被应用于卫星控制或军事控制系统中,而在进行离线检测时,系统则不能进行维持在工作状态中。
第二,系统故障限制:嵌入式计算机容错故障限制模式主要是指,当故障发生时,将影响系正常工作的因素或故障的影响性限制在一定范围内,用以避免系统故障对计算机控制系统中的其他区域产生影响。
第三,系统重试:在计算机控制系统运行过程中,瞬间故障作为系统不稳定故障,对系统整体稳定性具有重要影响作用。而通常情况下,多数计算系控制系统统一操作具有二次重启功能,该功能对受非物理性质破坏的计算机控制系统故障具有一定的应用价值。
第四,系统重组与修复:当计算机容错系统检测并判定计算机控制系统出现永久性故障时,系统容错则侧重于对重组系统元件与失效系统元件的替换与分离。修复则主要是指当计算机控制系统发生故障时,对故障元件进行替换,用以保证系统的正常运行,该操作可实现系统在线或离线转态的同时进行[3]。
第五,系统屏蔽:系统屏蔽主要是指,为避免出现故障区域或节点对系统输出的影响,采用将多模表决冗余或逻辑屏蔽的方法将故障效应进行遮盖。在此过程中,当冗余资源被消耗殆尽时,系统设备将产生输出错误。
第六,系统恢复:在进行系统重组、屏蔽等操作后,借助于系统软件程序,实现系统故障转态向系统正常运行状态的恢复。
嵌入式计算机控制系统容错策略,是容错技术与亢余技术的整合设计。为提升嵌入式计算机控制系统容错能力,在计算机控制系统故障频发单元中,适当加入亢余计设计,强化系统容错性。
由于嵌入式计算机控制系统主要由硬件系统和软件系统共同组成,因此系统容错策略可分为系统硬件的容错策略与系统软件的容错策略。近年来随着信息技术的快速发展,嵌入式计算机控制系统呈现智能化发展,智能化硬件系统容错策略在基于亢余技术的实现得到提升。其中,电路级冗余、静态冗余、动态冗余、静态冗余与动态冗余混合设计,推动了计算机系统容错策略工作模式的顺利执行,在一定程度上保证了计算机控制系统可靠性。
在计算机软件系统的容错策略中,主要采用“指令冗余”与“软件陷阱”两种容错设计进行方法的具体体现:其一,指令冗余:指令冗余是提升嵌入式计算机控制系统容错性能的重要手段,主要由“操作数”与“操作码”共同组成计算机控制系统中CPU所执行并完善的所有操作多由操作码在基于操作数的技术性进行指明的[4]。而在计算机控制系统中,无论是操作码,还是操作数其指令控制皆由程序计数器PC完成,因此一旦PC遇到干扰产生故障,将对其他指令产生重要影响,致使系统程序脱离正常运行轨道,形成“跑飞”现象。在嵌入式计算机控制系统容错中通过进行指令冗余设计,则可有效改善上述问题,降低跑飞程序发生机率,通过单字节指令将跑飞的程序引导至原有轨道。与此同时,在双字节指令、多字节指令后面适当的插入NOP单字节指令,可有效提升各指令之间的关联性与紧密性,改善指令整体质量。NOP指令依据自身所具有的本质特性,可有效控制跑飞程序对对操作数上其他程度的影响,提升系统容错性。此外,也可利用指令冗余技术提升嵌入式计算机控制系统容错策略中“系统重复”作用的最大化发挥,即在容错重复系统中设置一定量的重要重复指令,在保证指令科学运行的基础上,对系统中重要的数据进行审核,通过不断的审核及时探寻系统程序中存在的问题并给予有效的修正,提升系统运行准确性与可靠性。其二,软件陷阱:据经验分析与资料整合发展,在嵌入式计算机控制系统容错中,通过创设一定的软件陷阱,可效提升控制系统运行的稳定性,减低程序错误的影响性。即,嵌入式计算机控制系统容错中所设置的软件陷阱,通过利用相应的指令对跑飞程序进行及时扑捉;其次,软件陷阱将跑飞程序引入到复位入口,并在过程中对应程度问题产生的各项故障进行实质性处理,避免因部分程序错误而影响系统整体程序错误,用以保证计算机控制系统运行的稳定性。目前,常用的软件陷阱方法主要有“运行程序区”、“中断服务区”以及“未使用的ROM空间”,在软件陷阱设计应用过程中,需根据实际需求与软件规模特性进行合理设置。例如,在运行程序区设计过程中,可利用“模块化”设计形式在用户计算机控制系统空白程序模块中,设置既定陷阱指令,实现对跑飞程序的有效控制;而中断服务程序区主要是通过在系统主程序运行区域内布设“计时器”,当遇到跑飞程序时,执行定时中断,用以避免跑飞程序影响性的扩散;对ROM空间的设计,通常情况下需保留一部分空间用以为跑飞程序的引导提升前提条件,保证系统运行的可靠性[5]。
综上所述,本文对计算机控制系统概述、容错工作模式以及系统可靠性提升策略进行了分析,以期进一步明确并掌握嵌入式计算机控制系统容错策略,提升嵌入式计算机控制系统运行的稳定性与可靠性,为我国计算机技术水平的优化发展,提供有益帮助。
[1]刘晔.计算机控制系统可靠性设计[J].信息通信,2016,02:133-134.
[2]谢建洲.计算机系统容错技术研究[J].电脑知识与技术,2016(06).
[3]吕迅竑,姜斌,陈欣,等.无人机容错飞行控制计算机体系结构研究[J].系统工程与电子技术,2016,11:2586-2597.