李新明,李 亢,刘 东
(装备学院复杂电子系统仿真重点实验室,北京 101416)
装备体系(Equipment System of Systems)是由功能上相互关联的各种类各系列装备构成的整体,通常由战斗装备、综合电子信息系统、保障装备构成。装备体系评估能够对当前构建的装备体系水平进行评价,明确体系中装备和系统的短板和不足,是装备体系建设的重要环节[1]。近年来,军事需求的生成模式由基于“任务”、基于“威胁”逐渐转向基于“能力”。所谓能力,是在特定的标准和条件下,通过组织运用各单位、装备和设施等手段和技术来执行某种特定的任务,达到某种效果的本领[2],基于能力的装备体系评估得到了众多专家学者的广泛关注。
大数据分析(Big Data Analyze,BDA)是近年来兴起的一种新的科学研究方法,能够从大量的数据中发现未知的规律,在众多领域得到了广泛的应用[3]。本文将大数据分析方法应用于装备体系评估中,通过分析大数据分析与常用体系评估方法的特点,提出基于BDA的体系评估思路,构建基于BDA的装备体系评估模型,并通过实例仿真实验挖掘装备体系构建与体系能力的关联关系,验证基于BDA的装备体系评估方法的应用价值。
大数据分析是指对海量、动态变化的数据集进行深度分析(Deep Analysis),提取出隐含的、先前未知的、有潜在价值的信息,用以提供决策支持。它主要基于人工智能、机器学习、模式识别等技术,自动化地分析大数据,做出归纳性的推理,从中挖掘出潜在的数据价值,提取出有用的信息,常用的方法有决策树、聚类、贝叶斯网络、关联规则、实例学习、半监督学习等[4]。
大数据技术的兴起是为了应对两个方面的趋势和挑战[5]:一是传统的数据管理技术难以满足规模大、类型多、变化快的数据处理需求,产生了以MapReduce为代表的非关系型数据管理技术;二是随着数据深度分析需求的增长,人们不再满足于从数据集中获取已存的数据,而希望通过对数据的深入分析发现隐含的知识,即我们所说的大数据分析。
Tony Hey等在《The Fourth Paradigm:Data-Intensive Scientific Discovery》[6]中指出,科学研究在实验实证、理论分析、计算模拟3种研究模式基础上诞生了第四种研究模式——数据密集型(Data Intensive)研究模式,即不再从已知的规则中计算推理,而是从数据中寻找问题的答案,获得理论上的突破。
常见的装备体系评估方法[7]主要有专家评估法、解析评估法、仿真评估法等3类。
专家评估法包括德尔菲法、头脑风暴法、交叉影响分析法等,通过专家掌握的专业知识和经验对研究问题的定性评价,该方法适用于缺少资料和数据的情况,但由于其判断的主观性较强,不能作为主要的评估方法。
解析评估法包括指数评估法、ADC评估法、Lanchester方程评估法等,通过建立评估指标与给定条件之间函数关系计算体系效能,该方法具有明确的解析公式,各变量之间的分析与计算较为直观简单,因此应用十分广泛。但解析评估法中涉及的先验知识和权重设置受人为因素的影响,而且对于作战过程中的对抗行为考虑较少,难以满足装备体系评估的需求。
仿真评估法包括多Agent仿真评估法、HLA分布式仿真评估法、Monte Carlo仿真评估法等,通过将仿真数据输入到体系仿真模型中,分析仿真结果数据进行装备体系效能评估,该方法利于体现各装备实体之间的交互作用,具有较高的可信度,其缺点是仿真模型的构建过程十分复杂,而且难以校验模型的优劣程度。
基于对以上装备体系评估方法的分析,本文探索将大数据分析技术应用到装备体系评估中,提高装备体系评估的效果。常见的装备体系评估方法通常采用经验打分、解析计算、仿真模拟等手段尽可能真实地表述装备体系的评估过程,是一种面向“过程”的研究模式。而大数据分析技术关注数据处理结果的分析与挖掘,不关心数据处理的中间过程,是一种“知其然,不知其所以然”的“黑盒”模式。正如“购物篮”案例中处理的数据是各种商品组成的订单,是顾客所购买商品的结果,并不关心挑选商品的过程。同样,基于BDA的装备体系评估也要弱化评估的过程,注重分析不同装备体系的输入以及其能力的评估结果,得出特定装备组合对于体系能力的影响,发现制约装备体系能力的“瓶颈”。
基于BDA的装备体系评估理想的数据输入是真实的装备体系和其在实际表现中的能力评估结果,然而如果测试不同的装备体系在各种想定条件下的能力表现,其工作量和成本是难以估量的。因此要利用实验仿真方法,通过建立实验仿真系统,将装备体系以实体数据集合的形式代入到系统中,进行想定任务条件下的实验仿真,并评估其能力表现。大量测试的装备体系以及通过仿真获得的评估结果数据,可以作为基于BDA的装备体系评估的处理对象。
基于BDA的装备体系评估模型设计了数据集成模块、仿真实验预设模块、装备体系能力评估模块和基于BDA的装备体系分析模块4部分,图1给出了基于BDA的装备体系评估的模型框架。
图1 基于BDA的装备体系评估模型
数据集成模块为基于BDA的装备体系评估提供所需的各类数据,可以分为装备实体数据和体系基础数据两类。这些数据需要集成为全局、统一的视图,用标准的语言描述数据的概念和关系,使之能够被评估系统准确无误地理解。
装备实体数据是多源装备数据库的集合,是评估系统的核心数据。它广泛集成了可获取的所有真实装备数据库,数据来源主要有装备部门管理的装备数据库、相关业务单位构建的装备数据库,以及从互联网收集的外军装备数据等。数据主要包括装备的编号、型号、战技指标、所属部门、部署位置、服役时间等信息。
体系基础数据是支撑体系评估的各类基础性数据的集合,包括作战想定数据、战场环境数据和作战力量数据等数据,一般采用文本、XML或其它形式化语言描述。作战想定数据描述作战的意图、兵力的配置、作战协同计划、作战原则与规律等信息。战场环境数据主要描述战场的所在区域、气象环境、电磁环境等信息。作战力量数据包括编制数据、区域数据等信息,其中编制数据明确了部队编制体制的隶属关系,区域数据明确了作战区域的位置信息。
在特定的想定任务条件下,仿真实验预设模块为基于BDA的装备体系评估提供仿真实验的数据输入,一方面生成用于测试的装备体系,另一方面设定仿真实验的初始条件。将这些数据输入到评估系统中,分别对每个测试装备体系进行仿真实验。
首先,按照想定的约束规则抽取满足条件的装备数据作为参与仿真的实体,并随机生成大量的测试装备体系。想定约束规则是对想定任务中装备实体数据的限制和要求,例如,某想定任务中要求“海军”完成这一任务,那么只有隶属关系属于“海军”的装备才满足这一想定约束规则的要求。将所有满足结束规则的装备,随机地组合为用于测试的装备体系。
然后,根据想定方案抽取相应的体系基础数据,将涉及到的战场环境数据和作战力量数据作为仿真实验条件数据。例如,某想定任务要求战场位置为X区域,要求参与的部队为“海军”,则需要提取X区域的战场环境数据,以及与“海军”相关的作战力量数据。这些数据可以准确描述仿真实验的预设条件。
体系能力评估模块是在实验预设条件下对测试装备体系进行的能力评估,为每个测试装备体系给出能力评价,包括仿真实验引擎、作战效果计算、装备体系能力评估3部分。其中仿真实验引擎能够根据仿真实验预设条件模拟实验过程。
首先,从仿真实验预设模块中提取仿真初始数据输入到仿真实验引擎中,仿真实验引擎按照初始数据中任务想定所描述的作战流程进行实验仿真,模拟测试装备体系对目标实施预警、探测、电子对抗、打击等动作,并根据各装备的性能指标产生装备业务数据。
其次,作战效果计算部分对装备业务数据进行处理和分析,例如通过处理雷达的频谱数据分析目标的运动特性等。综合分析各类装备业务数据,得出测试装备体系对目标进行预警、探测、毁伤动作的作战效果。
然后,装备体系能力评估部分结合评估指标体系对测试装备体系的能力进行评估,评估指标体系中规范地给出了描述装备体系能力的定量指标和定性指标,将测试装备体系作战效果与估指标体系进行对比分析,给出测试装备体系的能力评估结果。
基于BDA的装备体系分析模块是对大量仿真实验数据进行深度分析,挖掘装备组合与体系能力之间的关联关系、装备体系与任务环境之间的关联关系,并在此基础上提供想定条件下的装备体系辅助决策信息。
首先,采集和输入仿真实验中测试装备体系、体系能力评估结果、想定任务环境等数据,这些数据具有海量、多态等大数据的特点,基于BDA的装备体系分析引擎将这些数据进行集成和预处理,消除数据的异构性问题,把每次仿真实验中涉及的数据整理为可供分析的样本数据。
然后,以提高装备体系能力为目标,装备体系分析引擎重点考察体系能力评估结果较好的样本数据集,采用聚类、关联规则、半监督学习等大数据分析方法挖掘仿真实验数据中隐含的规律,分析在不同任务环境条件下装备组合与体系能力的关联关系、装备对体系能力的贡献程度,分析的结果可以为装备体系的构建提供辅助决策信息。在想定任务条件下进行作战时,相应的信息可以作为装备体系构建和部署的重要参考。
为了更好地说明基于BDA的装备体系评估,本文给出一个对电子信息装备体系的侦察能力进行评估的简单实例,详细阐述评估的具体步骤。
仿真实验的作战想定任务为复杂电磁环境下的对空目标侦察,假设目标战斗机于T时刻在X区域以750km/h的速度自东向西行驶,飞行高度为1000m。
按照该想定,从装备数据库中抽取具有对空目标侦察功能的装备,且能保证在T时刻可以作用于X区域。满足条件的装备及相关参数如表1所示,其中侦察卫星是经解算轨道方程后得出在T时刻覆盖X区域。
从列表中随机抽取任意数量的装备组成测试装备体系,如图2所示,将其和相应的环境数据一起输入到装备体系能力评估系统中进行仿真实验。当目标进入装备的探测范围后,系统将采集各装备对目标产生的侦察数据,并对这些数据进行综合解算,得出目标的运动特性。仿真完成后,将获得的结果与预设的目标参数进行对比分析,参照指标评价体系给出测试装备体系的侦察能力结果。以此类推,对产生的大量测试装备体系分别进行仿真实验和能力评估,并记录相关的数据。
表1 满足想定条件的装备列表
图2 复杂电磁环境下对空目标侦察示意图
分析大量想定任务环境下的测试装备体系和体系能力的评估结果,对体系能力表现优秀的(能力评估值在前10%的)仿真实验进行聚类挖掘。发现这些测试装备体系普遍是侦察卫星、无人机和雷达3种装备的组合。并且可以得出,有无侦察卫星对体系能力的影响较大;雷达数量(小于6时)的增加与体系能力的增加成正比,雷达数量(大于6时)的增加对体系能力的增加贡献不大。此外,还发现较新的无人机XX-4的性能优于其它型号的无人机;雷达XX-14虽然较XX-27的性能略有不足,但其和卫星联合后能力更强,等等。这些结论有利于决策者在不同的想定条件下,选取适合任务环境的装备组合,发挥装备体系的整体作战优势。
本文尝试将大数据分析的方法应用到装备体系评估中,设计了基于BDA的装备体系评估模型,通过分析仿真实验产生的海量数据,挖掘装备与体系之间、想定任务与体系之间、体系与体系能力之间的关联关系,为想定任务条件下的装备部署提供辅助决策支持。基于BDA的装备体系评估是对装备体系评估方法的一次创新和尝试,下一步工作将细化模型中各模块的功能设置,有针对性地研究数据处理算法,为装备体系的构建发展提供有价值的信息。
[1]李新明,杨凡德,等.电子信息装备体系概论[M].北京:国防工业出版社,2014.
[2]DoD Architecture Framework Working Group.DoD Architecture Frame Work Version 2.0[R].USA:Department of Defense,2009.
[3]Labrinidis,Alexandros,H.V.Jagadish.Challenges and Opportunities with big Data[J].Proceedings of the VLDB Endowment,2012,5(12):2032-2033.
[4]Han Jiawei,Micheline Kamber,Jian Pei.Data Minning:Concepts and Techniques[M].Third Edition San Francisco,CA,itd:Morgan Kaufmann,2013.
[5]覃雄派,王会举,杜小勇,等.大数据分析——RDBMS与MapReduce的竞争与共生[J].软件学报,2012,23(1):32-45.
[6]Tong Hey,Stewart Tansley,Kristin Tolle.The Fourth Paradigm:Data-Intensive Scientific Discovery[M].Redmond,Washington,2009.
[7]赵青松,杨克巍,陈英武,等.体系工程与体系结构建模方法与技术[M].北京:国防工业出版社,2013.