美军大数据战略特点分析

2018-02-09 02:50
中华医学图书情报杂志 2018年4期
关键词:美国政府军事决策

2011年,美国总统科技顾问委员会认为美国政府缺乏对大数据相关技术的投入,2012年美国科技政策办公室随即推出了《大数据研究与发展计划》,并成立了专门的大数据高级领导小组专职负责美国大数据战略部署。随后,美国信息技术与创新基金会于2013年发布了《支持数据驱动型创新的技术与政策》,美国总统行政办公室于2014年发布了《大数据:把握机遇,保存价值》,大数据高级领导小组于2016年发布了《联邦大数据研究和发展战略计划》。

本文以上述美国大数据战略文件作为研究对象,结合美军公开的军事项目信息,重点分析了与军事相关的大数据战略,发现美军把数据支撑决策作为大数据战略的中心,安全是美军大数据战略的基础。另外还分析了美军大数据战略与美国政府大数据战略的关系,发现美军大数据战略与美国政府大数据战略有明确的分工和互补,具有畅通的军民融合机制。

1 以数据支撑决策为中心

知己知彼,百战不殆。自古以来,知识和信息在军事决策中就具有重要作用,决策者综合运用知识和信息形成智慧决策。准确的信息可以减少不确定性,有利于做出正确的判断和决策。根据DIKW(Data,Information,Knowledge,Wise)概念链模式,数据(Data)经过输入传递系统转化成信息(Information),信息经主体接收处理后形成知识(Knowledge),知识的综合运用构成智慧(Wise)。数据是获取信息、知识和智慧的基础。在“小数据”时代,信息来源有限,决策人员需要在有限信息基础上更多地依赖经验和直觉做出判断和决策。在这种决策模式下,决策的正确与否主要依赖决策人员的经验和能力,具有较大的主观性和偶然性。随着大数据等科学技术的发展,依据客观数据进行科学决策有利于摆脱决策的随意性和主观性,将决策从经验推向科学。数据支撑决策是指在决策过程中以数据作为决策和判断的主要依据,减少根据经验和直觉进行决策带来的主观性和不确定性。目前,美军决策过程的每一个环节都充满了海量数据。如何使这些数据更加有效地支撑决策是美军持续思考和探索的问题。

大数据为开展数据支撑决策、实现决策科学化提供了数据基础,同时大数据量大、速度快、类型复杂和价值密度低等特点也给开展数据支撑决策提出了新的挑战,主要体现在海量数据的组织、复杂类型数据的检索和大规模数据分析3个方面。在美国公布的在研大数据项目中[1],军事类项目共9项,其中5项围绕上述3个方面展开。

美军开发了insight项目[2]用于融合情报、监视和侦察(Intelligence,Surveillance,Reconnaissance,ISR)系统中的海量数据,指挥员和参谋人员能够随时使用系统中的数据。ISR系统是美军C4KISR(Command,Control,Communication,Computer,Kill,Intelligence,Surveillance,Reconnaissance,C4KISR)系统的主要数据来源,包含了分布在美军的全球军事基地中的卫星数据、传感器数据和无人机数据等类型复杂的大规模数据集。数据支撑决策要求这些广泛分布的数据能够快速汇集到同一个地方,供指挥员和参谋人员进行决策时使用。美军在此之前开发的全球信息栅格系统用于对美军数据的统一管理和使用,但其由于设计思路对大数据的考虑不够全面而无法满足大数据条件下开展数据支撑决策的需求。因此,美军开发了insight项目用于快速接收、索引并存储数据,实现海量数据的组织与融合,指挥员和参谋人员能够从中获得和洞见来自多种复杂数据源中与任务相关的数据。

美军的大数据中包含大量图片和视频数据,包括各类监控视频、航拍图片等。传统的文本检索方法无法完成对图片和视频内容的检索,如检索“特朗普”时无法获取到包含美国总统特朗普的所有图片和视频,更无法完整发现决策所需的数据,无法进行数据分析和决策支撑。因此,美军开发了视频和图像检索与分析工具[3](Video and Image Retrieval and Analysis Tool,VIRAT)用于对视频和图像内容的检索和分析。VIRAT不仅能够对现有图片和视频快速检索,而且能够对实时监控视频进行事件和内容的监控。

大数据分析是数据支撑决策的关键,在2018年公布的《美国国防战略报告概要》中,美军把大数据分析视作确保打赢未来战争的新兴技术。美军现公开的5项与数据支撑决策相关的大数据项目中有3项属于大数据分析,分别是通用大数据分析工具XData[4]、针对自然语言的机器阅读理解项目和针对实时视频的Mind’Eye项目。

XData项目的目标是开发能同时对半结构化和非结构化数据进行分析的通用基础平台,可伸缩性和可配置性是XData的两项基本指标。伸缩性是指能够满足不同数据规模的数据分析需求,它是通过云计算架构实现的;可配置性是指XData能够提供场景可配置的大数据分析方案,以满足不同军兵种在各种作战场景下的数据分析需求。

机器阅读理解项目是针对美军大数据中包含的大量自然语言数据而开发的,其目标是代替人工完成部分浅层问题的理解和回答,其背后的支撑技术是知识图谱和深度学习。从海量文本数据中挖掘出有价值的内容也受到了非军事领域的重视,微软研究院、斯坦福大学等国外机构均发布了阅读理解数据集用以支持这方面的研究,百度、搜狗等国内公司也与哈工大等知名高校合作发起了机器阅读理解竞赛以推动该领域的发展。

Mind’Eye项目以实时视频为分析对象,主要解决士兵对战场环境的监视问题。传统的战场环境监视做法是士兵隐蔽在监视环境中进行24小时持续检查,对士兵个人能力有较高的要求而且将士兵暴露于战场的危险之中。Mind’Eye[5]通过开发智能摄像头对监视环境进行实施录像并监视环境中所发生的行为以文字形式实时输出,只需安排一名士兵在安全的监控室中即可完成对多个监视区域的监视。

数据支撑决策是美军大数据战略的核心,大数据分析是数据支撑决策的核心。美军大数据分析的战略部署包括开发通用的大数据分析工具和针对特定形态大数据载体的分析工具。出于保密需要美军或许并没有完全公开其大数据战略下的项目,但通过上述5个项目布局可以反映出美军在数据组织与融合、数据检索以及数据分析等方面的布局。

2 安全是美军大数据战略的基础

安全是一切军事行动的基础。数据驱动决策等任何军事行为的成功都建立安全基础之上,没有安全作为保证,一切行动都将面临泄密乃至失败的风险。美军大数据战略首先考虑大数据本身的安全问题,其次考虑基于大数据技术解决美军面临的安全问题。在美军公开的9项大数据项目中有4项与安全相关,其中两项针对大数据本身的安全,两项基于大数据技术避免美军来自内部或外部的安全威胁。美国大数据白皮书中重点讨论了如何在确保隐私的情况下利用大数据技术排查来自内部人员的潜在安全威胁。

大数据本身的安全是大数据战略的基础。云计算能够为大数据提供强大的存储空间和弹性的计算资源,是大数据分析的基础。云计算的安全性决定了美军大数据的安全性,美军开发了两个针对云计算安全的项目以保证美军大数据安全。美军提出了面向任务的弹性云[6](Mission-oriented Resilient Cloud,MRC)计划。该计划通过开发一系列用于检测、诊断和应对黑客攻击的技术以应对云计算环境下的传统安全问题,拟开发一系列技术以允许云计算环境在遭受攻击时仍然能够保证大数据分析的可靠运行,以确保战时敌方持续攻击情况下美军大数据能够正常运行。数据的机密性也是美军大数据战略的重点考虑对象,美军部署了基于加密数据的计算[7](Programming Computation on Encrypted Data,PROCEED)计划以应对云计算环境下大数据分析面临的数据泄密问题。PROCEED计划的特点是能够对加密的数据进行大数据分析,即在数据分析的全过程中数据一直处于加密状态以最大程度减少明文数据被窃取的可能性。为达到上述目的,PROCEED开发了专门的程序设计语言和计算机算法。

在确保大数据安全的基础上,美军试图利用大数据技术解决面临的安全问题,主要包括来自外部的安全挑战和来自内部的安全威胁。针对外部黑客不断对美军网络空间频繁实施黑客活动的安全挑战,美军开发了虚拟空间威胁[8](Cyber-Insider Threat,CINDER)项目,目标是监控、排查和检测美军虚拟网络中的间谍行为。

相对于来自外部的威胁,美军更注重对内部人员潜在安全威胁的防范,尤其在斯诺登泄露国家安全局内部文件事件发生后,美军着手研究利用大数据技术评估内部威胁。根据2015年大数据白皮书的披露[9],国防部已经开始试点对包括陆军服役人员、文职雇员以及承包商在内的3 370名雇员进行基于大数据的威胁评估调查,成功发现99名人员已经陷入严重的经济危机、家庭暴力、吸毒或卖淫等指控。这些人员最终可能被临时或永久性撤职,以消除内部人员带来的潜在安全威胁。美军为了防范内部人员误操作带来的风险,开发了多尺度异常检测[10](Anomaly Detection at Multiple Scales,ADAMS)项目。该项目主要是防止由于内部人员误操作等无意识行为引发的潜在威胁。其基本原理是从内部大数据中挖掘出异常模式,对可能带来安全问题的潜在威胁发出警告并采取防范措施。

安全问题,尤其是网络空间的安全问题越来越受到美国等军事强国的重视。2017年8月18日,特朗普宣布美军网络司令部从此前的二级功能司令部成为美军第十个联合作战司令部,以增强网络安全管控和作战能力。在此背景下,美军大数据战略如此重视安全问题也显得理所当然。

3 注重军民融合发展

美国政府虽然没有在官方文件中明确军民融合发展制度,但是在实际运行中却能够保证“战场”与“市场”之间的顺畅通联。从组织机构来看,美国国防部是美国联邦政府的15个联邦部门之一,国防部长、国务卿、司法部长和财政部长被认为是内阁中最重要的4个官员。在美国政府历次发布的大数据战略中,美国国防部都是重要的战略制定者和执行者,美军大数据战略也在美国政府大数据战略中占据较长的篇幅。因此美军大数据战略的制定并非孤立存在,一直都是美国政府大数据战略的重要组成部分,并且与其他行业部门之间有明确的分工。

从美国白宫科技政策办公室(Office of Science and Technology Policy,OSTP)发布的世界上第一个政府主导的大数据战略《大数据研究和发展计划》[11]中可以看出,美国政府在制定大数据战略时充分考虑了军事领域的布局。该计划包含科学、环境、教育和国家安全4个领域,分别由美国国家科学基金会、美国国防部、美国国立卫生研究院、美国能源部和美国地质勘探局5个部门负责组织实施。有关国家安全的战略计划由美国国防部直属机构美国国防部高级研究计划局(Defense Advanced Research Projects Agency,DARPA)负责具体实施。DARPA的宗旨是“保持美国的技术领先地位,防止潜在对手意想不到的超越”,该机构发布的大数据战略计划具有较强的前瞻性和军事应用价值。美国政府在发布该计划的同时还发布了一份更为详细的正在计划实施的大数据项目清单[1]。该清单包含70余项美国在研大数据计划,其中DARPA负责的军事大数据项目共9项,约占总项目的12.5%,与其他部门相比,占据较大比重。美国国防部在美国政府大数据战略的起草和战略实施中都扮演了重要角色,说明美国政府已经将军事大数据纳入到政府大数据战略的通盘考虑之中。

从美国大数据战略的经费预算分配来看,美军大数据战略也是美国大数据战略中的重要组成部分。网络与信息技术研究开发计划(Network and Information Technology Research and Development Program,NITRD)是美国政府在1991年开始部署的一项具有国家战略意义的研发计划,提供一套框架和机制整合各联邦部门资源以支持高级信息技术研发。NITRD计划囊括了美国政府资助的重大信息技术项目,参与NITRD的各联邦机构通过项目组成领域(Program Component Area,PCA)协调其开展的NITRD活动[12]。根据2017年发布的NITRD财政预算报告,2016年美国政府在大数据战略中总共投入5.5亿美元,其中军事大数据投入1.5亿美元。虽然2018年政府大数据预算减少至5.1亿美元,但军事大数据的投入增加至1.7亿美元。

从美国军事大数据的部署领域来看,美军大数据与政府大数据也有密切的分工和配合。美军大数据主要包括决策和安全领域的大数据战略,而大数据基础设施、大数据产业结构等战略布局则由美国其他部门完成。国防和军队作为美国政府的重要组成部分,其军事大数据战略是在美国政府大数据战略全局考虑之下制定的,而非独立为之。美军大数据战略与非军事部门的大数据战略有较为明确的分工和配合,基础设施等领域由非军事部门完成,为美军大数据战略提供支持。美军聚焦数据驱动决策的大数据战略和设计安全及隐私的大数据战略的制定和实施。

4 结语

美军把数据支撑决策作为其军事大数据战略的核心,与其建设C4KISR军事信息处理系统、全球信息栅格以及网络中心战的理念相一致,是原有军事战略思想的进一步发展和提升。根据DIKW概念链理论,数据是信息、知识和智慧的基础。随着数据采集、传输和处理能力的进一步提升以及大数据技术的发展,信息和知识将越来越依托于数据,指挥员将拥有丰富的信息和知识作为决策依据,决策也将更加科学化和理性化,情绪、心理等因素对指挥员决策的影响将越来越小。

安全是军队存在的根本价值所在,美军把安全作为其大数据战略的基础也在情理之中。随着未来战争越来越依赖大数据,大数据本身的安全自然成为美军的焦点。在确保大数据本身安全的基础上,基于大数据技术维护国家和军队安全也会成为未来的发展方向。美国的军事大数据战略并非孤立制定,而是在美国大数据战略整体框架下制定完成的,美军大数据战略在美国大数据战略中占有非常重要的比重。

猜你喜欢
美国政府军事决策
为可持续决策提供依据
美国政府出手干预加州制定汽车排放标准的权力或被撤销
决策为什么失误了
美国政府对华北伪政权出笼的关注及应对
美国政府工程采购合同管理的主要做法
军事幽默:局
军事
军事幽默
世界军事掠影
关于抗美援朝出兵决策的几点认识