战晓苏
美国国防部近3年的财年报告都指出,大数据前沿技术和深度应用,在军事领域蕴藏着巨大价值,已成为军事科技能力竞争的焦点之一。早在2012年3月29日,美国政府就发布了《大数据研究与发展计划倡议》并作为发展战略重点之一,同时宣布了当年投入2亿美元的科研计划,推动军事大数据科技创新与应用工具开发。
自2012年以来,美国国防部、国防高级研究计划局(DARPA)、有关业务局和各军种研究机构,发布的有关大数据研究与应用项目,从互联网上可以查到的超过50项,其中投入较大的、持续时间较长的项目超过20项。这些项目的研发与运用,有力提升了美军大数据综合处理能力。
发布系列规划计划 从2012年起,国防部及DARPA部署了以X数据(XDATA)和洞察系统(Insight)等为代表的一系列大数据系列研发项目,主要涉及大数据分析挖掘、规则发现、深度学习、数据驱动模型计算、管理与处理和可视化方面的前沿技术,逐步形成了比较完整和全面的大数据研发布局。
DARPA于2015年发布了新型混合计算的概念,2016年5月正式宣布了高效仿真加速计算架构:ACCESS(ACcelerated Computation for Efficient Scientif i c Simulation)计划。该计划旨在开发专为大型复杂体系的演化计算所设计的独立仿真处理系统。系统能够通过大数据计算混合仿真计算,快速预测和发现体系演化趋势。这个计划中就包含了大数据加速分析计算、混合加速仿真计算、高效加速计算的技术攻关安排,以期形成革命性的仿真计算能力。
DARPA于2016年发布了数据驱动的模型发现研发计划(Data-Driven Discovery of Models,D3M),目的是让机器学习如何通过数据驱动进行建模。此类新模型通过构建可选基元库技术、开发复杂模型自动整合技术、创新人机混合交互技术和领域专家知识融合技术,研发数据模型变换多种变量、建模特征抽取、数据态势预测性工具,实现大数据驱动的重要线索发现或演化规律预测。
支持多批研发项目 2012年,美国防部及DARPA,支持了第一批共10个大数据研发项目,主要包括多尺度异常检测项目(Anomaly Detection at Multiple Scales)、网络内部威胁项目(Cyber-Insider Threat)、洞察力项目(Insight)、机器读取项目(Machine Reading)、“心灵之眼”项目(M i n d's Eye)、面向任务的弹性云项目(Mission-oriented Resilient C l o u d s)、加密数据的编程运算项目(Computation on Programming Encrypted Data)、影像检索与分析项目(Video and Image Retrieval and Analysis Tool)、X-数据项目(XDATA)、数据到决策项目(Data to Decisions)。
XDATA项目是DARPA支持的军事大数据处理代表性、基础性项目。该项目重点开发了用于分析大量半结构化和非结构化大数据的计算软件工具,并有能力对数据进行可视化处理。六年来,一些研究成果以开源形式放在互联网上共享。主要研究进展:一是大数据可视化技术代表性的开源软件是Visualization Design Environment(VDE),在开源数据集成、查询和可视化工具包,VDE提供文档实体关系识别、SSCI预测数据库和Flickr元数据图集可视化分析软件工具。二是基于分布式架构的机器学习、数据分析算法,研究在大规模数据集上具有可扩展性的机器学习算法,包括基于分布式计算架构的快速数据分析方法。三是开源计算工具,开发了新型大数据专用计算技术和大数据分析开源软件工具。
洞察力项目旨在提高多源、多类型和海量复杂数据的关联处理和评估分析能力,重点开发了一种综合性、适应性强的新一代情报、监视与侦察专业化大数据系统及其相应技术。该系统通过全自动分析技术的支持,可以实时或近实时的组合分析和深度利用多源数据和信息,专有的特性分析和预测算法可从大数据中探测并识别威胁的来源和程度。
数据到决策项目的主要研发内容:一是研究整合感知、认知和决策支持技术或系统,研发具有自主能力的大数据处理系统,使之可以自主作业并做出决策支持;二是研究大数据态势感知技术和工具,为作战行动提供更好的态势信息保障;三是专门研发帮助情报分析人员从多种语言文本中获取情报信息的能力,发现率和准确率的技术指标定位在提高现有水平的二个数据级以上,并促进作战目标、行动和事件3类线索分析能力快速同步提升。
DA R PA、美军各研究机构和各军种支持了一批大数据研发项目:从科学阐述中预知和理解(FUSE)、文本深度挖掘和过滤技术(DEFT)、创造(CREATE)、战略沟通中的社交媒体(SMISC)、多尺度异常检测(ADAMS)、先进机器学习的概率编程项目(PPAML)、DA P R A开放目录(DA R PA Open Catalog)、广泛业务语言翻译(BOLT)、视觉媒体推理(V M R)、大机理(B i g Mechanism)、隐性信息挖掘(Memex)、心理学信号的检测和计算分析(DCAPS)、自动实时全方位监测(ARGUS-IS)、软件组件挖掘和理解(MUSE)、大型多维度数据集(开发交互搜索Numpy、SciPy和可视化技术)、任务保障的感知能力(MAMA)、大数据集处理利用与分析(PEALDS)、全球定量分析(GQA)、网络攻击自动化非常规检测环境项目(CAUSE)、社交网络中算法性能和硬件的图论研究项目、复杂环境下的性能优化项目、媒体取证项目和ENGAGE项目(ENGAGE)。
从科学阐述中预知和理解项目通过挖掘各研究领域、多语种的科技文献和专利信息,依托大数据智能分析技术发现国防科技领域最新研究动态和热点,定期对新兴技术、颠覆性技术的发展前景进行预测性评估并给出发展潜力排名,预测潜在的发展方向和可能。
创造项目开发了一系列结构化推理技术和众包技术,帮助军事情报分析人员和作战数据领域专业人员,从原因、论据、假设等多方面对不同数据分析结果、样本数据结论以及主要观点进行推理评估与评测,人机协作提炼并完善最终结论,以提高军事大数据情报分析的准确性与深刻性。
6年来,美军通过几十个大数据项目的积累,研发了一批能够实际使用的军事大数据分析处理的专业化系统或工具,并将这些系统或工具运用于军事实践,产生了明显的应用效益。
加强情报深度分析能力 美军通过利用大数据工具提高军事人员对多个战场空间情报的发现和深度认知能力。军事情报源大数据可以从广泛的军用传感器消息源中提取关键数据、实时分析数据,并基于战场多维空间以可视化形式呈现情报结果数据,提供准确深入的战场情报产品支撑。
这些重要进展直接得到了大数据项目研发技术成果的支持,这些技术成果包括作战实体数据识别、实体关系发现定位、开源信息情报抽取等方面的创新研发。基于这些技术研发的情报分析系统可以提升对语言与信息的理解能力,大幅提高情报源大数据的分析、审视和处理效率,更有利于发现潜在的高价值情报信息。
增强战略态势研判与预警能力 美军的多个大数据分析预测类研发项目,提出了“网络-社会-经济-环境”“冲突-安全-平衡-环境”“数据-判断-决策”等预测推理模型和数据驱动模型与技术,对全球和区域的政治经济社会军事环境等数据、社交网络数据以及开源大数据进行分析,能够初步预测评估国家安全态势、军事战略态势和地区安全与冲突态势,有预测性结论支撑。
另外,美军还利用上述大数据项目和技术,组织开发了战略预警工具,主要是在线分析互联网大数据,挖掘重要线索和关联性实体和事件,实时或近实时监控全球整体性恐怖预警态势和热点冲突预警态势,提高战略防御能力。
优化作战筹划能力 军事大数据项目的应用还体现在指控知识发现、指挥规则自主学习、指挥筹划计划与作战任务的关联分析等方面,已逐步实现对实时战场态势、作战体系等大数据进行比较、分析、推理,能够部分提供自主化态势评估、目标选择、计划生成、方案评估等处理能力,提升了作战筹划的合理性、科学性、有效性。
美军初步形成了作战系统和作战任务状态大数据感知能力,通过分析指挥系统中大数据流向变化和关联性改变,实现对作战系统和重要作战任务执行情况的自主化评估和推测性展现。基于大数据推理支持模型,为作战方案计划调整和危急态势处置方案生成提供支撑。
提升军队综合管理水平 美军运用可视化、人机交互等大数据技术,研发了智能化训练管理、人员管理、基地管理、保障管理及演训系统,能够近实时采集、处理、分析不同层级、不同军种部队的基础大数据,自动生成管理状态评价结果。
美国防部基于大数据技术对工作环境进行了升级改造,综合运用关联分析、深度学习等大数据技术,对预测报告、方案指南、工作计划、主要项目、经费预算、进度管理等信息,进行深度比较、关联、分类、评级,找出可能存在的问题或矛盾,进一步针对资源分配控制,提出相关决策建议。
美军认为,云计算、广互联、大数据、智能化相结合的“云联大智”,代表了军事领域信息技术发展新阶段的时代特征。其中,云计算平台和广泛互联网络已成为基础性支撑环境,智能化技术带动了控制、计算、处理、融合、自主能力的全面提升,大数据技术能够将广阔信息数据进行深度发掘分析。将几个前沿信息技术进行深度结合运用,可以全面提升军事能力与战略优势。
不断催化军事理论创新 美军把大数据研发与运用作为未来作战的基础性工程,“从数据到决策”已成为美军应对大数据的基本策略,态势感知技术和数据驱动预测技术已成为当前大数据军事应用的热点,大数据军事应用为美军获取军事优势、实现理论创新提供了重要支点。
公开的美军文献和美国智库报告认为,大数据分析处理关键能力对未来作战的影响主要体现在以下方面:一是解决战场信息高速处理的瓶颈问题,多域融合感知、认知和决策数据,使未来作战能够深度发挥军事数据的作用;二是大数据分析可以提高军事信息处理质量和深度,使指挥控制更加集中到作战问题领域上,使数据驱动辅助决策向数据驱动监视转变;三是推动作战体系从信息化向智能化的整体转变,作战大数据能力的实质性提升使自主式作战成为可能;四是“数据与智能结合”作用更加明显,战争形态的演化会更多取决于决策者智慧与军事大数据智能的共同作用。
美军通过推动一系列大数据研发项目,促进形成大数据思维。大数据思维在各领域的基础性、战略性、先导性地位越来越突出。美军正在逐步建立深度数据决策、全面数据管理的运行机制和管理模式。大数据的积累、整合、分析和深度挖掘,能够揭示战争和作战规律、把握战略发展趋势、发现军队建设问题、提出辅助决策方案支持。
逐步形成大数据技术优势自2011年起,共有上百个美国大学和公司研发团队,参与了美军几十个大数据项目,在多个大数据核心技术领域有了创新性引领性的进展,主要体现在大数据基础理论与支撑平台研究、数据驱动的新型软件研制、大数据分析应用等3个方面。
在大数据基础理论与支撑平台研究方面,一是探讨了大数据基础理论,主要包括大数据分析近似计算理论与自主学习算法、数据驱动深度学习计算理论与算法、数据压缩与加密理论等理论与技术;二是研究了大数据云中心智能管理技术与平台,主要包括超大规模大数据云中心运行支撑技术、数据驱动的资源智能调度与管理技术等。
在大数据分析应用方面,一是攻关了大数据分析的基础理论和技术方法,主要包括大数据环境下机器学习的创新理论和方法、面向流数据的新型分析、复杂高维大数据的可视化分析等理论与技术;二是研发了高时效的大数据计算模型、优化技术与系统,主要包括新型大数据分析计算、大数据规则优化、大规模流数据在线分析等技术;三是探索了特定场景智能感知,主要包括跨时空多尺度关联、目标检测追踪等技术;四是检验了智能感知与理解技术,主要包括复杂体系演化预测模型、支撑多源异构数据关联挖掘技术、临机处置决策模型等理论与技术。
在数据驱动的新型软件研制方面,攻关了基于编程现场大数据的软件智能开发技术方法和支撑环境,探索了大数据环境下群智化软件开发技术。
美军从2012年起率先在军事大数据研发领域占据先机。可以看出,美军大数据能力研发,对掌握战略主动权、全面获得制认知权、拉开与其他国家在军事信息关键领域的竞争差距,都起到了至关重要的作用。