陈祥斌,张爱民,史 芸
(1.军事交通学院 装备保障系,天津300161;2.军事交通学院 汽车指挥系,天津300161)
信息时代的战争主要依靠信息制胜,谁拥有了更多、更有效的信息,谁就会在竞争中处于有利地位。而数据作为信息的载体,正日益受到人们的重视[1]。随着我军信息化建设的不断发展,为适应新形势和任务要求,推进通用装备保障转型建设、信息化建设和装备保障科学发展,需要更准确、更及时、更全面地掌握通用装备使用和保障的各类信息,运用科学合理的手段,有效记录和应用各类信息。因此,开展以通用装备保障信息获取、处理、融合、共享、服务和应用为中心的数据资源建设势在必行。
通用装备保障数据资源建设,是实现基于通用装备保障工作的信息获取、数据采集、数据存储管理、数据共享的综合性信息系统工程,是通用装备保障信息化基础工程的重要组成部分。因此,必须结合信息化条件下通用装备保障工作的实际,规范数据从产生到使用的全过程,为通用装备保障信息系统互联、互通、互操作提供数据标准支持,为系统之间的数据共享提供安全、可靠的支撑环境,为系统的运用提供准确及时的数据保障和服务[2]。
通用装备保障数据资源建设以通用装备保障工作中的各类数据资源为主体,以数据信息系统建设为支撑,以数据管理为保障,以数据标准规范为规则,构建通用装备保障数据资源体系。主要包括数据资源、数据支撑环境、数据管理和标准规范4 个方面(如图1 所示)。
图1 通用装备保障数据资源建设内容体系
数据需求是数据工程建设的主体,根据通用装备保障工作实际和特点,分析通用装备保障数据需求,明确军事需求数据、装备编制数据、装备性能数据、装备结构及部件数据、装备使用保障数据、装备保障管理数据、装备保障政策法规、成果情报资料等方面数据需求。
数据支撑环境是形成数据资源的技术手段和物资基础,包括计算机网络、硬件设备、软件工具和各类功能软件等。数据支撑环境主要明确数据采集、数据管理维护、数据查询显示,以及基于数据的各类信息服务和应用软硬件的实现方案。
通用装备保障数据资源管理是及时补充更新数据、保证资源准确的主要手段,也是实现系统稳定运行的重要保证。因此,需要明确数据获取、数据共享和数据维护等一整套数据管理办法和机制。
通用装备保障数据量大、种类繁多,并与军队相关数据资源具有关联性和共享性。因此,需要制订各类通用装备保障数据标准,通过数据的标准化、规范化建设,达到建立有效数据资源库的目的。
通用装备保障数据资源建设的一个重要问题就是数据资源的标准,只有依据标准建设的数据源,才能无障碍地实现跨系统数据共享。科学的标准体系是促进通用装备保障数据资源建设趋向科学合理化的手段[3]。通用装备保障数据标准体系主要由指导类标准、通用类标准和专用类标准3大部分组成。
指导类标准是与标准制订、应用和理解等方面相关的标准。它主要阐述通用装备保障数据标准化的总体需求、概念、组成和相互关系,以及使用的基本原则和方法等,包括标准体系及标准化工作指南等。
通用类标准是通用装备保障数据建设中具有共性的相关标准,包括数据标准、服务标准和管理建设标准。
(1)数据标准。包括元数据、分类与编码、数据内容等方面的标准。
(2)服务标准。是提供通用装备保障数据共享服务相关标准的总称,包括目录服务、数据访问服务、数据分发服务等方面的标准,涉及数据和信息的发布、表达、交换和共享等多个环节,规范通用装备保障论证数据的转换格式和方法、互操作的方法和规则,以及认证、目录服务、服务接口、图示表达等各方面。
(3)管理建设标准。用于指导系统的建设,规范系统的运行和使用,包括数据汇交管理办法、质量管理规范、信息安全管理规范、数据中心建设规范等。
专用类标准是根据通用类标准制订出来的、满足各层次论证任务数据资源建设需求的标准,重点是反映通用装备保障论证数据特点和效能评估数据特点的数据类标准,如元数据内容、部件层次划分、数据分类与编码、数据模式、数据交换格式和数据采集规范等。
根据通用装备保障数据资源建设的需求,在全面梳理通用装备保障数据资源建设成果的基础上,明确数据资源建设所涵盖的兵种专业,提出通用装备保障论证评估数据资源建设的内容体系,按照“分布建设、分步实施、谁用谁建、谁建谁管”的原则开展数据资源的梳理、采集、加工、整理工作。
全面梳理通用装备保障论证评估的各类数据资源,研究通用装备保障论证评估数据资源的分类体系,建立面向共享交换的统一数据资源分类框架,是数据资源建设的前提条件。通用装备保障数据资源可分为3 个部分。
(1)通用装备保障基础数据。包括装备数据、装备结构数据、保障系统编制数据、环境数据和文档资料,对通用装备保障工作起基础支撑作用。
(2)通用装备保障实测数据。包括装备保障的方案、过程和结果数据,涵盖了通用装备保障的全过程。这些数据具有空间上多点分布、时间上连续、效应上关联的特征,共有的特性是时间性,其表述的信息是和时间相关的。
(3)通用装备保障仿真实验数据。包括实验任务数据、实验评估仿真数据、实验评估结果数据等。
通用装备保障数据资源体系可按共享、代建和自建3 种途径来建设。
(1)共享获取的基础数据。当前,全军相关业务单位已经采集了大量的基础数据,为了避免重复建设,并确保数据资源的权威性和一致性,通用装备保障工作所需的基础数据不再重新建设,可以通过相互协作、互惠互利的原则,实现基础数据共享应用。比如装备基本信息、特性数据、性能数据、编制编成数据、作战保障数据、作战对象数据等都可以从权威部门通过共享的方式获取。
(2)需要代建的基础数据。通用装备保障数据体系中还有大部分数据需要补充建设,其中有些数据只有权威的业务部门利用相关的技术手段才能获取。因此,为确保数据的准确性和权威性,必须依托这些权威业务部门来建设。比如,作战想定和规则数据、气象水文数据、电磁环境数据、测绘导航数据等可以委托相关单位代建。
(3)需要自建的基础数据。通用装备保障数据还有大部分数据是通用装备保障所特有的,必须依靠各兵种专业自己建设。比如,军械、装甲、车辆、工程、防化、船艇装备保障想定数据、保障力量运用数据、保障规则数据、保障单元及修理时间数据、保障单元故障模式及失效机理数据,以及相关的资料文档等需要各依托建设单位根据自己的职能特点分工进行建设。
数据支撑环境是形成数据资源的技术手段和物质基础,为通用装备保障数据资源建设提供硬件支撑平台和软件应用环境,主要包括硬件设备、计算机网络、软件工具和各类功能软件等,用于实现数据资源的转换、数据采集、数据管理、数据维护、数据查询展示,以及基于数据的各类信息处理、挖掘和应用。支撑环境可按照“1 个数据中心、6 个数据分中心”的模式来建设(如图2 所示)。
数据中心与各分中心依托军事信息网实现互连,并连接其他相关业务信息系统和平台。数据中心建有邮件服务器、文件服务器、目录服务器、数据服务器、安全服务器和应用服务器等,具有严格的网络安全和保密措施,严格的数据共享与访问控制。主中心数据库负责日常运行维护,全面负责系统建设的管理和实施以及各兵种共享数据加载、调用。分中心数据库,按各所、直属单位、地域进行建设,各所、直属单位自行负责领域的数据资源的生产、加工、维护和更新。各数据分中心按统一的技术架构进行数据支撑环境建设,采用统一的基础设施、数据管理与共享服务平台。不同的是,数据资源建设的内容和支撑环境建设的规模有所差异。
图2 通用装备保障数据中心共享关系
依托通用装备保障数据运行支撑环境,通过开发数据管理与服务平台,实现通用装备保障数据资源的有效采集、管理和共享服务。该平台在数据汇交、数据管理、数据共享、信息安全等相关信息技术的支持下,依托军事综合信息网,实现对分布式数据库和数据集的标准化和规范化管理、名录发布、目录服务、数据服务、延伸服务等功能。为了便于数据管理与共享应用,形成全军统一的数据共享服务机制,避免重复开发,消除“烟囱系统”,数据中心根据实际需要,立足公共软件和平台,通过二次开发,补充研制相关软件和工具,重点放在数据汇交、数据验证、数据分析、数据挖掘等方面。
数据采集方式应与通用装备保障实践工作相结合,通过制定数据采集上报规范,采用数据采集工具,优化装备保障工作流程,简化数据搜集工作,完成数据采集和数据的归档入库。数据采集应做到要素齐全、格式规范、数据准确。主要功能包括数据录入与汇交、数据质量检验、数据预处理、数据整理归档等。
(1)数据录入与汇交。用于把原始数据录入到相应的数据库中,并通过数据接口将各相关业务系统的可用数据导入通用装备保障数据资源库中进行统一管理。
(2)数据质量检验。用于数据入库前对原始数据和导入数据进行检查。
(3)数据预处理。用于将原始数据按照一定的数据处理的方法或算法进行规范化和标准化处理。
(4)数据归档。主要是对结构化、半结构化数据和非结构化数据进行归档存储。
利用分布式数据库技术、数据仓库管理技术、元数据技术和网络技术,建立以分布式为主、集中式为辅的标准化数据管理系统,提供对各类通用装备保障数据及文档的统一管理,涵盖数据存储、备份、容灾、质量、报表、版本、权限、接口管理等功能。
(1)数据存储管理。主要包括3 种数据存储方式。一是在线存储,可以实时访问;二是近线存储,即要借助一定的软件和网络来实现不同系统间的数据异地存放,以及需要时的数据回迁;三是离线存储,即把数据存放在可以随时脱离系统的磁盘、光盘等设备中。实际应用时,要根据数据类型、密级和用户需求进行数据存储。
(2)数据备份与容灾管理。数据备份是为了防止用户操作失误、系统故障等意外原因导致数据丢失而将整个应用系统的数据或一部分关键数据复制到其他介质上,必要时能迅速恢复数据。容灾系统需要建立2 套或多套功能相同的系统,互相之间可以进行状态监视和功能切换,当一套系统因意外停止工作时,整个应用系统可以自动切换到另一套系统,确保整个系统的正常运用。
(3)数据质量管理。是对录入数据质量在线监测,包括单字段、字段间的完整性、逻辑性和规则符合性在线监测并告警;对批量数据进行重复数据、缺失数据、逻辑错误、不一致数据的批量检测、分析与辅助修正。
(4)数据报表管理。主要包括类似EXCEL 方式的报表设计,自定义复杂组合条件查询,以图、文、表复合方式展现报表内容,按指定报表样式打印报表等。
(5)数据权限管理。是对不同种类数据、不同密级数据的访问权限进行控制。
(6)外部数据接口管理。主要是对数据汇交时与通用装备保障数据资源库进行数据导入的各类数据接口进行管理。
数据共享是数据从生产者手中通过各种方式将数据传送到用户的过程,包括数据发布、数据发现、数据分发与获取、数据评价等。数据共享服务平台作为数据提供者与数据使用者之间的媒介,实现资源数据的共享。
(1)数据发布。是将已生产的和标准化的数据传送到数据分发系统中,包括元数据、数据本身、数据质量信息及相关信息。数据发布是用户发现、获取和评价数据的基础。
(2)数据发现。主要是通过开发数据目录服务系统,使用户快捷地搜索到所需的相关数据信息。
(3)数据分发与获取。主要是通过身份认证、权限控制和安全审计,按用户数据订阅要求分发相关数据。用户可以通过在线下载、邮购、快递或其他方式获取数据。
(4)数据评价。是用户对数据的内容进行判断和评定,判断数据是否符合自己的要求,对符合自己要求的数据,在数据使用结束后,对数据的质量信息进行评价。
数据分析主要是建立基于通用装备保障资源数据的评估和决策支撑模型体系,构建以性能水平评估、决策支持为目标,以数据统计分析、数据挖掘技术为核心的装备决策支持体系。通过数据清理和集成,生成并分析相关数据,选择不同的数据挖掘算法,设定不同的参数建立挖掘模型,进行数据挖掘操作,输出挖掘结果,可根据需要提供定时或实时挖掘服务。
数据挖掘主要是从海量的通用装备保障数据中发现隐含在内的客观规律,发掘有用的信息,并实现数据资源整合、改造与重组,为辅助决策提供依据。主要包括数据总结、关联分析、分类与预测、聚类分析、孤立点分析等任务。
数据维护主要包括运维管理和安全管理。
(1)运维管理就是通过整合各种系统资源,并对资源的运行状态进行检测,对系统运行故障征兆进行预警,使维护人员能够及时发现并排除故障,确保系统连续、可靠、安全运行,提高系统运行管理水平和服务保障水平。
(2)安全管理就是按照军队相关安全保密要求,提供必要的网络安全、数据安全和密码保护等安全基础设施保障和病毒更新、漏洞扫描、补丁更新、安全审计、安全认证等公共安全服务,保障数据采集、传输、处理、发布等过程安全可信和用户对试验数据资源的受控使用,确保系统安全运行。
未来战争是以信息化为主要特点的一体化联合作战。在此背景下,以通用装备保障数据资源建设推动通装保障信息系统的整体建设,以数据为中心构建信息系统,以数据集成推动信息系统集成,重视数据法规和标准建设,构建一体化数据支撑环境,建立健全数据管理机制,促进数据共享,强化数据管理,最大限度地提高数据的使用价值,是通用装备保障信息化建设的主要目标。
[1] 罗强一,曹京春,胥少卿,等.数据工程在信息系统建设中的作用[J].数字国防,2009(3):44-46.
[2] 陈鹏.对军队数据工程建设的认识和思考[J]. 军事通信学术,2008(2):15-17.
[3] 林平,刘永辉,陈大勇.军事数据工程基本问题分析[J]. 军事运筹与系统工程,2012,26(1):14-17.