刘 旭, 刘雪晶, 聂 毅
(1. 中国电子科学研究院,北京 100041; 2. 中国人民解放军93184部队,北京 100036)
对于作战场景中使用的大型复杂系统,例如特种飞机任务系统,其故障以及误操作引起的系统失效在不断增加,需要采取相应的保护措施,否则会产生难以估量的后果和损失。因此,在现代战争中,增强特种飞机任务系统的容错能力,提高系统智能化程度,成为当务之急[1-3]。现阶段特种飞机任务系统架构主要以分立式、联合式及综合式为主,但是下一代特种飞机产品的系统复杂程度将大幅提升,使得以前的系统运行模式不能完全适应未来的作战需求,尤其是在鲁棒性及智能化方面需要进一步提升,主要包括:1)系统故障、异常导致作战能力丧失,需要有效的解决途径完成系统的功能重构;2)由于系统日趋复杂,当进行功能重构时,需要系统自动识别故障并完成恢复,减少系统因为人工操作环节带来的时间延迟及误操作等问题;3)随着系统对各子系统的计算能力及存储能力需求的大幅提升,在苛刻的空间和重量局限条件下,需要通用化的计算和存储平台[4]。本文针对特种飞机任务系统,利用人工智能概念,提出了蓝图智能管理的方法,能够自动完成动态部署、故障恢复、功能重构,从而提升系统的鲁棒性,保障系统稳定地运行。
为了满足下一代特种飞机任务系统的需求,本文考虑从以下五个方面开展设计[5-8]。
1)智能化设计,即通过智能化设计实现对系统的自动控制。在任务变更及状态变更的情况下,对系统的运行方式进行最优调整,实现基于人工智能的动态部署及运行,减少人工操控带来的误操作风险以及时间延迟。
2)松耦合设计,即通过松耦合设计实现对软件组件的解耦合。剥离软件组件之间的依赖关系,按照功能内聚原则,实现软件的独立加载和运行机制;剥离软件组件与底层系统的依赖关系,对底层的应用驱动组件进行有效封装,建立通用统一的运行环境,实现软件的平台无关性。
3)虚拟化设计,即通过虚拟化设计实现资源的按需使用及动态扩展。系统根据服务请求动态开辟存储空间或选择相应的计算设备。通过虚拟化管理,用户所面对是统一的信息中心节点,简化资源的调配部署。
4)容错性设计,即通过容错性设计实现系统对错误状态的监测及恢复。系统根据异常信息监测完成对运行资源的重新动态部署,保障软、硬件资源在有错误的状态下能够实现容错的目的。
5)服务化设计,即通过服务化设计实现信息的按需分发模式。所有系统信息由信息中心统一存储,当有应用需要数据时,通过注册数据服务形成信息流的请求,信息中心通过认证的数据服务分发信息给相应的功能模块。
基于蓝图智能管理的特种飞机任务系统主要通过功能组件实现对系统软硬件的动态管理,完成作战使用模式到资源运行方式的映射关系建立,下面介绍各功能组件。
1)能力环境。能力环境与操作系统预先安装于各系统资源模块上,是屏蔽底层的专用接口,统一为通用的接口形式,增强应用软件的可移植性,提供应用所需的系统服务管理接口。
2)系统任务管理。系统任务管理是根据战场态势、作战样式及交互指令产生对应的任务列表或系统工作模式,是整个系统运行的顶层输入组件。在对战场态势和作战样式进行分析的情况下,能够通过智能反馈的方式自动建立或变更任务列表,实现系统的人工智能控制。
3)系统线程管理。系统线程管理是根据系统任务管理下发的任务清单建立对应的软件线程列表,软件线程列表由软件组件及组件之间的关联进行描述,其产生的依据就是系统任务清单,在任务执行过程中,任务清单如果发生改变,则系统线程管理会对应地完成软件线程列表的变更。
4)系统蓝图管理。系统蓝图管理是根据作战需求及资源状况,按照资源映射规则对软件蓝图、硬件蓝图、配置蓝图及运行蓝图的管理维护,是特种飞机任务系统实现系统级管理的核心部件。其内部和外部的逻辑关系如图1所示。
图1 蓝图组成示意图
在图1中,硬件蓝图描述了系统的硬件拓扑结构,以及所有硬件资源的状态信息,硬件蓝图在系统启动时由各硬件模块资源自动上报进行注册生成,在系统的运行过程中,资源管理模块实时监视各模块资源并更新蓝图状况。软件蓝图描述了系统各个功能软件模块的信息,软件蓝图在启动时根据驻留在存储器上的软件蓝图描述文件自动生成,并根据存储器中存储的可执行文件进行安装性检测,对可用软件进行标识。配置蓝图描述了当前需要运行的功能线程,配置蓝图是根据当前任务所需要的功能线程进行配置产生的。运行蓝图是根据系统任务管理的指令,并结合硬件蓝图和当前系统可用硬件资源、软件蓝图、配置蓝图和映射规则后,最终计算得到的输出结果,它描述了系统运行的各类信息。资源映射规则给出了软件资源与硬件模块的映射原则,是整个系统资源分配策略的核心,结合软件蓝图、硬件蓝图和配置蓝图,通过映射规则,就可以将功能线程所需要的若干软件模块映射到具体的硬件模块上运行。
5)系统资源管理。系统资源管理主要功能是根据系统蓝图管理提供的运行蓝图对系统软、硬件资源进行系统级的部署,将对应的软件执行文件列表、驻留位置、安装方式及启动方式等相关信息分发至相应的硬件模块管理软件上,以支持软件在模块上的加载和运行。
6)模块资源管理。模块资源管理主要功能是根据系统资源管理所发布的部署指令,按照运行蓝图完成软、硬件资源的部署,包括将运行中所要求的软件执行文件、配置文件、软件运行文件从数据中心的对应位置上提取出来并安装至相应的目标模块上,进而实现软件的加载和运行。
7)模块自检管理。模块自检管理主要功能是检测模块内部的各单元、处理器芯片,内存等硬件组件的健康状况。自检的范围可涉及电源的电压和频率、内存逻辑地址、外围设备等。自检结束后,上报信息给系统蓝图管理,由其完成系统资源状态的更新,对于有故障的情况进行及时反馈处理。
系统运行过程设计包括系统初始化、系统任务变更、系统功能重构、系统关闭等4个阶段。
系统初始化过程如图2所示,各功能模块解释如下。
图2 系统初始化过程
软件环境运行:系统开机上电,各系统模块自动运行能力环境。
初始网络地址分配:各系统模块通过启动脚本文件执行环境中所定义的相应系统函数获取模块的安装槽位,完成网络地址设置。
模块级管理软件安装:各系统模块通过执行文件及配置文件,获取完毕后安装在本模块存储单元上并自动加载、运行。
系统级管理软件安装:系统级管理主控模块通过执行文件及配置文件,获取完毕后安装在本模块存储单元上并自动加载、运行。
初始自检:各系统模块完成对本模块的上电初始自检功能。自检结束后,上报模块健康状态给系统级资源管理。
初始硬件蓝图建立:系统蓝图管理软件运行后,结合硬件蓝图模板创建初始硬件蓝图。
初始软件蓝图建立:系统蓝图管理软件运行后,结合软件蓝图模板创建初始软件蓝图。
初始任务列表建立:系统任务管理软件运行后,建立初始任务列表,并将此列表作为输入传阅至系统线程管理。
初始线程列表建立:系统线程管理软件运行后,完成初始线程列表的建立,并将此列表作为输入传阅至系统资源管理。
初始配置蓝图建立:系统蓝图管理软件创建初始配置蓝图。
初始运行蓝图建立:系统蓝图管理软件构建初始运行蓝图,将其发送至系统资源管理。
初始运行蓝图数据部署:系统资源管理获取软件蓝图模板文件,进行软、硬件资源部署,安装至相应的目标模块的内部存储器上。
初始运行蓝图软件启动:数据部署完毕后,各模块级资源管理根据软件运行文件,加载、运行本模块上的软件组件,完成初始运行蓝图软件的启动过程。
系统初始化流程结束,系统正常运行。
系统任务变更过程描述如下。
1)任务变更触发:操作员加载任务规划数据、人工操作界面干预或者智能化的动态自动任务装载,完成任务的增加、删除或创建。
2)任务列表更新:系统任务管理根据任务状态,更新任务列表,并将任务列表分发至系统线程管理。
3)线程列表更新:系统线程管理根据当前任务列表请求,更新线程列表,并分发至系统蓝图管理。
4)配置蓝图更新:系统蓝图管理依据软件蓝图及更新后的线程列表,更新配置蓝图。
5)运行蓝图更新:系统蓝图管理依据当前的硬件蓝图、软件蓝图及配置蓝图,完成运行蓝图的更新,并将运行蓝图分发至系统资源管理。
6)运行蓝图比对:系统资源管理收到更新后的运行蓝图后,与当前的运行蓝图进行蓝图比对,完成新建软件组件及注销软件组件的梳理。
7)注销控制:系统资源管理对需要删除的软件组件进行注销处理,分发注销指令给指定的模块级资源管理,调用注销函数结束相应软件组件的运行。
8)原有数据卸载:系统资源管理对需要删除的软件组件进行数据卸载处理,分发数据卸载指令给指定的模块级资源管理,调用数据卸载函数完成相应软件组件的执行文件、配置文件的删除工作。
9)新增数据部署:系统资源管理根据软件蓝图模板将新增的软件组件可执行文件、配置文件、软件运行文件从数据中心的对应位置上提取出来并发送安装至相应的目标模块的内部存储器上。
10)软件启动:新增数据部署完毕后,相应模块级资源管理根据软件运行文件,加载、运行本模块上的新增软件组件,完成新增软件的启动。
11)系统任务变更过程结束,系统正常运行。
系统功能重构过程描述如下。
系统故障触发,当某硬件模块出现故障、软件出现异常时,各模块级自检将软、硬件的异常信息上报给系统蓝图管理。
系统蓝图更新,系统蓝图管理根据软、硬件异常信息,更新系统运行蓝图及系统硬件蓝图。
故障分类,系统蓝图管理针对故障情况进行分类,一类为软件故障,另一类为硬件故障,优先进行硬件故障恢复。软件故障恢复步骤为:1)系统蓝图管理向系统资源管理发送软件组件重启请求;2)系统资源管理通过故障模块的资源管理完成故障软件组件重启;3)重启完毕后,模块进行软件运行检测,上报状态给系统蓝图管理;4)系统蓝图管理向系统资源管理发送重启请求;5)系统资源管理通过故障模块的资源管理完成对软件的重启;6)系统级软件重启完毕后,上报状态给系统蓝图管理;7)系统蓝图管理更新运行蓝图为正常状态;8)软件故障恢复结束,系统正常运行。硬件故障恢复步骤为:1)系统蓝图管理根据硬件故障信息向系统资源管理发送故障隔离请求;2)故障隔离包括关闭故障模块的网络端口,也可以单独切断模块电源;3)根据硬件蓝图选择替换节点(若无则进入降级流程),更新运行蓝图;4)系统资源管理收到更新后的运行蓝图后,作出新节点部署启动;5)系统资源管理根据软件蓝图模板将需要重置的软件安装至新的模块;6)数据部署完毕后,加载并运行本模块上的软件组件,完成软件启动;7)硬件故障恢复结束,系统正常运行。
功能降级重构步骤为:1)当硬件节点已经满负荷,无法满足功能重置的情况,则需降级处理;2)系统蓝图管理根据运行蓝图和软件蓝图模板确定重要等级低的软件;3)系统蓝图管理将降级信息回传给系统线程管理,功能线程标注降级;4)系统资源管理对需要删除的软件组件进行注销处理;5)系统资源管理对需要删除的软件组件进行数据卸载;6)低等级软件释放资源后,系统资源管理将重置的软件安装至新模块;7)数据部署完毕后,相应软件的启动;8)功能降级重构结束,系统正常运行。
系统关闭过程描述如下。
1)系统关机触发:通过界面操作完成关机指令的输入。
2)任务列表清空:系统任务管理收到关机指令后清空任务列表,并将空任务列表发送至系统线程管理。
3)线程列表清空:收到空任务列表后,系统线程管理清空线程列表,并将空线程列表发送至系统蓝图管理。
4)配置蓝图清空:收到空线程列表后,系统蓝图管理清空配置蓝图。
5)运行蓝图清空:由于配置蓝图清空,系统蓝图管理将清空运行蓝图。
6)注销控制:系统资源管理对运行的软件组件进行注销处理,分发注销指令给指定的模块级资源管理,调用注销函数结束相应软件组件的运行。
7)数据卸载:系统资源管理对软件组件进行数据卸载处理,分发数据卸载指令给指定的模块级资源管理,调用数据卸载函数完成相应软件组件的执行文件、配置文件的删除工作。
8)系统下电:系统资源管理控制电源模块的资源管理,完成电源下电。
9)系统关闭过程结束。
随着特种飞机任务系统的复杂程度不断提升,对系统的稳健性、可恢复性、智能化的要求在不断增加,因此,如何充分利用有限的系统资源满足当前的需求成为一个亟待解决的问题。本文通过对系统蓝图进行智能管理,实现了特种飞机任务系统功能的动态智能化自动部署,有效地提高了系统资源的利用率,增强了系统的容错能力、动态扩展能力及鲁棒性能,从而为下一代特种飞机任务系统管理设计提供了一个新思路。