李明忠,张建康,车万方
(1.空军装备研究院,北京 100076;2.复杂系统第四实验室,北京 100076)
广义地讲,所谓数据是科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等的数值。在信息系统的各个领域中,通常认为数据是客观事物的属性、数量、位置及其相关等的抽象表示,其表现形式不仅指数字,还可以是文字、图形及声音[1],现代计算机可以接受所有类型的数据。现代作战仿真系统实质是一个以模型为核心、以数据为基础的信息处理系统,其运行的过程也就是对数据进行不断调用、处理、生成和传送的过程,因此数据是作战仿真系统的重要部分,数据的准确性、有效性直接关系到作战仿真系统的实用性及仿真结果的真实性。
然而,在作战仿真研究领域,人们往往将关注焦点聚焦于数学模型构建及程序的开发上,而对数据缺乏足够的重视,更缺乏对数据特点、来源等基础问题相对系统的研究。实际上,作战仿真研究中,数据问题是一个相对基础的研究课题,也是系统开发及运行中需要解决的关键问题之一[1]。为此,本文针对作战仿真系统的数据问题,在对军事数据特点分析的基础上,研究数据分类、来源以及形成过程等,旨在深化对作战仿真数据的认识,为作战仿真系统研发及其运行中数据的开发提供指导。
军事数据,就是对作战环境、武器装备、作战条件、作战行动及部队的编制编成等军事信息进行量化处理后所形成的数据。作战仿真数据是作战仿真系统开发及其运行中运用的军事数据,其本质是作战仿真中各种军事信息的具体表现形式,通常是对构成战争环境的各要素信息量化处理后形成的,内容涵盖了武器装备、力量构成、作战保障等各个方面。通过对这些数据的分析,可发现其具有层次关联性、相对性、广泛性、主次之分性、可变性、精确性或模糊性等主要特征[2-4]。
数据层次关联性,是由影响军事行动及其结果因素的多样性所决定的。在实际军事问题中,影响军事行动及其结果的因素较多,这些因素之间又都存在着内在联系。当用数据的形式表示这些因素时,它们之间不仅相互关联且有层次之分,每一个(或一组)数据都必然地在军事数据体系中处于一定的层次上,有时下层数据的变化还会给上一层次的数据带来影响。所有数据相互结合在一起,就客观地反映着一定的战斗条件、情况和过程。
从对数据层次及其关联性的分析可以看出,同一个数据相对其上一层次的数据是基础,而相对其下一层次的数据又是结果。从另一角度看,每个数据都有其形成条件、准确程度及适用范围。因此,数据之间就这种基础、条件与结果的关系特性以及准确程度来说,是具有相对性。
现代战争系统的复杂性决定了作战仿真数据的广泛性。现代战争系统涉及面广、包涵的因素多,要对这一复杂系统的建模与仿真,所需要的数据上至天文气象、电磁空间,下至地理环境,涉及到人员、武器、装备、战斗行动及其指挥等各个方面,范围极广、数量巨大。
数据的主次之分性,主要表现在两个方面:一是在同一个层次的数据中,数据所代表的因素对战斗行动及其结果影响的重要性并不是处于同等位置,重要性程度高的数据对战斗行动及其结果的影响大,反之,影响较小;二是同一数据在不同的军事问题、不同的模型中,其重要性程度也不一样。例如,描述飞机运动的加速度数据,在以空战仿真为主的武器平台级、战术级仿真系统中,就是非常重要的基础数据,而在战役级、战略级仿真中,有时甚至可以忽略。
作战仿真系统中的数据,有些是固定不变的,如武器装备的战术技术参数、固定机场参数等,而有些数据是随着客观条件、系统运行的状态以及其他数据的改变而改变,这种数据在作战模拟系统占有相当的比重。例如,一些跟作战想定相关的数据(部队编制、编成等),就会随着作战想定的改变而变化。还有一些与仿真进程紧密相连的数据,如参加战斗的武器装备、人员数量等,会随着仿真进程的前进不断发生变化。对于固定不变的数据,其不变性也是相对的,有时也会随着武器装备的技术进步而改变,这些都是数据可变性的体现。
精确性或模糊性,是指作战仿真应用中的数据有些是具有精确性的,有些是具有半定量性质。例如,一些武器装备的基本参数、战术技术数据等,一般都是经过精确实验或测量得到的,一定意义上讲诸如该类数据是具有精确性的。而对于那些通过统计、估测或无法量化而借助数学手段量化得到的数据,如各种类型的作战指数、具有概率特征的一些数据等,就是具有模糊性的。
目前对作战仿真数据的分类尚无统一标准,从不同的角度划分可以得到不同的分类[12-13]。例如,按照作战仿真系统运行进程的不同,可以把数据分为初始化数据、运行过程数据、运行结果数据等;按照数据所属的军事范畴不同,可以将其划分为战场环境数据、武器装备数据、部队编成数据、作战方案数据等。但实践中,不存在哪一种分类方法能够适用于所有的应用场合。这里本着能最大限度地反映不同类型数据之间的本质区别,并尽可能保持相互之间的独立性,结合作战仿真数据开发的经验,给出两种最为有效的分类(如图1所示):一是基于数据性质的分类,二是基于作战仿真中数据作用的分类。
图1 作战仿真数据分类
按数据性质的不同,可将作战仿真中应用的数据分为4类:元数据、固化数据、实例数据和验证数据。
1)元数据。又称作基本数据、说明数据,是指对作战仿真系统所应用的数据作说明、解释的数据,主要包括对数据的特征、来源、类型、质量、精度、标准等数据细节情况进行的说明,还有不同分系统之间数据通信的协议等等。这种类型数据一般不直接参与模型的运算和系统运行,只作为建模的参考数据,但对系统中所运用数据的整理、加工和收集具有非常重要的作用,是进行数据工程化的基础。
2)固化数据。是指那些其数据值已经以固化的方式嵌入作战仿真系统内部代码中的数据。通常情况下,这些数据(包括常量)已经作为模型的基本条件直接编写进程序代码,其可信度、分辨率、精度等对仿真结果都会产生很大影响。
3)实例数据。是指作战仿真系统初始化和运行过程中用到的数据,其实质是系统运行过程中对类、对象实例化的数据。这种数据是作战仿真系统数据的主体,其一般保存在数据文件和数据库中,也可以由用户通过交互接口输入。
4)验证数据。是用于检验仿真结果与真实世界的吻合度,以判断仿真结果有用性的数据。验证数据往往来自于试验、实兵演习、战争的历史数据,或者来自于已被验证过的仿真系统的模拟结果,也可用来自于领域专家的经验数据。验证数据最大特点[11],是其不直接用于仿真的运行,只用于建模与仿真VV&A及其相关的活动。
按作用不同对作战仿真数据进行分类,最符合作战仿真系统研发中数据分类的习惯,当前在实践中应用最为普遍。按此标准,可以将作战仿真的数据分为五大类[2-3]:基础数据、方案想定数据、系统执行期数据、运行管理与配置数据。
1)基础数据。简单地说,其主要是指不因想定、作战方案等具体仿真内容的改变而改变的数据,它是所有数据中处于最基本层次的数据。其最大的特点是数据量大、涉及面广,并具有相对的稳定性。主要包括武器装备的战术技术性能参数、基础地理信息数据、作战指挥数据(如战斗队形、指挥反应时间等)、部队编制等。一般情况下,该类型的数据经专业人员整理成结构化的信息之后存放在基础数据库中,被基础模型调用、运算、变换,产生出上一层次、甚至上几个层次的数据后,再作为高层次模型的输入数据,最终影响到仿真运行的结果。除此之外,实践中往往也将各类作战文书模板、军队标号数据划为基础数据,因为这些数据一般也不会因具体仿真内容的不同而改变,只不过它的存储模式是一系列的数据文件。
2)方案想定数据。相对于基础数据而言的,此类数据是指随着作战仿真想定和作战方案的变化而变化的数据。其本质是将想定和方案中以文字、图表等文书形式对特定演习训练活动进行表述和规定的信息,转换成能够被作战仿真系统理解的形式化、结构化信息所形成的数据集合。主要包括战场环境数据、作战编成和部署数据、作战方案数据、战场目标数据、后勤装备保障数据等。这些数据都是以不同的库文件形式存在于系统之中,有的是通过关键字的关联从基础数据库中抽取生成得到,有的是直接根据想定和方案内容量化得到。以往通常情况下,把想定数据和方案数据区分对待,但它们都随着具体仿真内容不同而改变,本文将其统一归为一类,即方案想定数据。按这样的方法来划分,不仅能体现该类数据的特征,也更符合实际情况。
3)系统执行期数据。从系统底层的视角来看,系统执行期数据就是系统运行中系统内部各种模型之间进行交换的数据流。这些数据流经有效处理后,以人可以理解的形式表现出来,其高级表现形态就是系统运行过程的各种图表、事件报告等,它是作战仿真系统态势显示的重要依据和来源。例如,在二维视窗下,系统执行期数据驱动电子地图上的军标移动,可实时显示战争态势,反映作战进程的发展。
4)运行管理与配置数据。就是与作战模拟活动组织管理及系统运行配置相关的数据。其主要包括:仿真实施计划、保障计划、演习导调计划、演习备考文书等一系列文件,参训人员的分组情况、席位划分、角色设置及其权限设定、席位上下级关系,还有仿真步长、运行的控制策略等等。这些数据虽然与战争本身量化无关,而且大部分不直接参与模型的计算,但与系统运行和仿真活动紧密相关。一般情况下,作战仿真系统的类型、仿真目的不同,运行管理与配置数据也就不相同。因此,该类型的数据可重用性低,一般只为特定的仿真系统或仿真所使用。
作战仿真中的数据类型多、数据量大、涉及面广,其最终还是源自于对战争及其相关因素方方面面的分析和认识。具体来源主要有[2,6]:武器装备试验、训练演习、仿真实验、战史战例、兵要地志、统计计算。
武器装备试验是获取数据的主要途径。作战仿真的基础数据中,有相当一部分是通过专门的武器装备试验得到的。如各种武器装备的战术技术指标、弹药的特征与杀伤效果等武器效能数据,一般都是通过武器装备试验得到的。
对于武器装备试验获得的数据,需要注意两点:一是要弄清试验的条件和背景,主要包括试验时的环境、武器装备的状况、参试人员水平与素质、试验的次数等,因为条件不同,会引起结果的变化;二是要弄清试验结果的处理过程,这样有利于把握数据的误差、精度等。
部队组织的训练演习,尤其是一些检验性和实兵实弹的训练演习,情况近似于实战,从中可以获得一些数据。诸如各种武器操作速度、操作与测量误差、进行各种作业所需的时间、战斗反应速度、行军速度、弹药补给速率等具有实践特性的数据,大部分都是从训练演习中获得的。
需要说明的是,训练演习中得到的数据与训练情况设置的难度、要求的严格程度有关[3]。平时训练演习时,参训的指战员心理压力小,获得的数据指标很大程度上可能会比实战时要高。为此,作战仿真中使用训练中得到的数据时,要充分考虑到这些因素,要对平时训练中得到的数据进行适当处理,力争使所使用的数据尽可能代表实战时的情况。
仿真实验是将建模仿真技术与科学实验相结合形成的一种新型科学研究手段,也是获取作战仿真数据途径与来源之一。实践中,作战仿真系统中需要的有些数据,如敌我武器战损比、敌防空系统对我威胁系数等,无法通过实兵实装演习、试验中来获取,通过仿真实验就能很好地得到解决。
在应用从仿真实验中得到的数据时,需要注意数据的可信性,必要的情况下,必须对其进行权威的VV&A,否则会影响仿真结果的可信性。
对比分析过去战争的文献、战史战例等资料,从中可以得到作战仿真研究所需要的一些数据。尤其是在战略仿真中,一些需要反映战争与社会关系以及具有长期效应的数据,一般都是从战史战例资料中获得的。在引用战史战例资料中的数据时,应选用不同资料对同一问题描述比较一致的数据,力争保证数据的准确性。
在作战仿真研究的发展史上,俄国运筹学家澳西谱夫,通过系统地分析1805年到1905年100年间的38次战争的历史数据,提出了完整的作战毁伤理论的数学表达,开创了现代作战仿真的经验法[5]。英国运筹学家兰切斯特,也是在对过去战争数据分析的基础上,提出了著名的兰切斯特方程。从一定程度上说,以定量研究为标志的现代军事运筹学,就是起源于对过去战争结果数据的分析与对比。因此,过去战争的文献、战史战例资料也是作战仿真数据来源之一。
兵要地志是平时由军事机关从军事行动的需要出发,对一些重要地区或战略、战役方向的政治、经济、军事和自然条件进行调查、统计、评述的结论性资料。在兵要地志中,对社会政治、经济状况、自然地理等均有大量的统计数据[7],一些重要的地区(如桥梁、机场、城市、港口等)还有照片,对气候、交通等也都有详细的记载,从中可以获得许多反映地理信息、重要目标以及军事行动相关的数据。
作战仿真系统使用兵要地志中的数据时,要注意所参阅的兵要地志的形成时间,避免所引用的数据与现实不符的情况发生。
作战仿真使用的数据中,有些数据无法获取或一时难以获取,就必须借助模型、通过数学的方法来获取,也就是这里所说的统计计算。其主要是对数据来源而讲的,与对武器装备试验、训练演习结果进行的统计计算不同。
目前,常采用的统计计算方法主要有德尔菲法、内插、外推与估测法。其中,德尔菲法,是一种汇集专家经验的有效方法,采用专家打分来获得需要的数值,广泛应用于多层次指标评估权重的确定;内插,是指求取已知数据间的未知数据,以算术平均值或绘曲线插值求得;外推,则是为求已知数据之外的数据,一般由其变化趋势和规律求取;估测,是在确实得不到所需数据的情况下,依据经验和标准值对某些量进行估计。
按照软件工程理论,一般情况下可将作战仿真系统的研发过程分为系统设计、开发和维护三个阶段。其中,系统设计包括军事需求分析、军事总体设计、技术总体设计;系统开发又包括一般设计、详细设计、编程、软件测试和调试。根据系统研发的过程,也可将系统所需数据的形成过程分为两个阶段:数据分析阶段和数据组织阶段。数据的形成过程包含在系统研发过程中,两者的关系如图2所示。
图2 系统研发过程与数据形成过程关系
数据分析[9]是军事总体设计的一项重要内容。该阶段的主要任务,就是将作战过程(军事问题)的各种条件、情况及其结果和相关的因素进行抽象、分解,进而定量化描述并形成数据。这些数据是初级的未经过整理的,涉及到与作战有关的方方面面,数量极其庞大,大部分并不直接为模型所用,是进行数据组织工作的基础。
数据组织是对数据分析阶段得到的数据进行分类、整理,形成计算机程序所使用的数据过程。该阶段的工作主要是数据设计和数据定义。
1)数据设计。它是作战仿真系统技术总体设计的任务之一,就是把数据分析阶段得到的数据元素进行加工、整理,按照其用途,以一定的格式归并成若干数据实体,并设计数据实体的逻辑结构和物理结构,具体内容主要有确定各数据实体的表示方法和组织形式、数据文件的类型、数据管理方法、通信传输方式及格式、数据在计算机中的存储形式等等[10]。这些工作是在系统层次上进行的,是对数据进行的总体设计。
2)数据定义。位于软件开发阶段,就是在软件开发过程中,根据组成系统的各软件模块的功能,确定各模块所使用的数据(包括接口数据和中间数据),定义数据结构,形成计算机程序中所使用的变量、数组。这些都是在软件层次上进行的工作,是对数据的详细设计。
数据是作战仿真系统的重要组成部分,没有数据就没有现代作战仿真,尤其是现代高技术在军事领域的广泛应用,现代战争系统复杂性增加,战场空前广阔、涉及因素众多,信息种类繁杂、数量庞大。在作战仿真系统研发和仿真运行中,从这些海量的信息中挖掘出有用的数据是一项十分艰巨的工作,也是一项复杂的系统工程,会涉及到方方面面的难点。本文仅从相对宏观的层面上对作战仿真的数据问题进行了论述,可深化人们对数据的认识,对于从现实世界中搜集、获取数据具有一定的参考价值。
[1]贺利坚. 数据库技术与应用[M].北京:宇航出版社,2001.
[2]张夷人. 军事运筹学数据概论[M].北京:军事科学出版社, 1987.
[3]胡晓峰. 美军训练模拟[M].北京:国防大学出版社,2001.3.
[4]杨晓恝,等.仿真数据中心体系结构研究[A]. 张建军.军队信息化与军事系统工程[C].北京:海潮出版社, 2005.
[5]徐学文,等. 现代作战模拟[M].北京:科学出版社,2001.
[6]张野鹏. 作战模拟基础[M].北京:解放军出版社,1994.
[7]赵振南,张宏军,等. 兵要地志信息系统的关键技术分析[J].计算机工程,2003,30(17):65-67.
[8]张鹏,龚光红. 基于网格的分布式仿真数据记录系统[J].计算机仿真,2007,24(4):124-127.
[9]高华,张宏军,等. 作战仿真数据集成框架研究及实现[J].火力与指挥控制,2009,34(2):36-38.
[10]吴海滨,李庆民,等. 分布交互式仿真系统数据库的设计与实现[J].计算机仿真,2003,20(3):40-42.
[11]王立国,薛青,孟宪权. 基于HLA装备作战仿真数据的VV&C研究[J].计算机工程与应用,2006,42(21):200-202.
[12]DMSO. M&S Data Engineering Technical Framework(M&S DE-TF)[R]. Department of Defense, 1997.
[13]Taekyu Kim. Ontology/Data Engineering Based Distributed Simulation Over Service Oriented Architecture for Network Behavior Analysis[D]. Phoenix:The University of Arizona, 2008.