武思军
2020年2月11日,美国著名智库战略与预算评估中心(CSBA)发布题为《马赛克战:利用人工智能和自主系统实施决策中心战》[1−2]研究报告,再次以马赛克战为抓手强调其于2019年12月31日发布的《夺回海上优势:为实施“决策中心战”推进美国水面舰艇部队转型》[3−4]报告中提出的“决策中心战” 作战概念,“决策中心战” 标志着美军在作战理念上抢先迈入智能化时代,具有重要的理论和实践价值.随着马赛克战相关研究、推演和部署的持续升温,决策中心制胜机理有望上升至美军全军层面,其复杂效果链构成的决策困境将成为我国防御体系面临的严峻挑战.我军应紧密围绕“决策中心战”作战理念,前瞻布局针对性防御体系研究,全力构建新型智能化作战管理与指挥控制体系,持续打造未来战争中从武器技术到认知决策能力的全面优势.
“决策中心战”的提出源自美军“消耗中心战”的不可持续发展,当前的美军主力作战单元为陆军战斗旅、海军陆战队远征部队和海军航母打击大队,以消耗中心为战争理念,聚焦通过消灭敌人来寻求胜利,体现了美军大规模、集中力量作战的思想.然而,这种作战思想在面对大国竞争对手时存在各种弊端,如作战灵活性差、主力作战单元易被探测和跟踪锁定等,敌人面对大规模作战单元很容易作出打击高价值目标的作战决策,既存在对抗不当升级的风险,又在成本上不可持续.CSBA 报告认为,随着精确制导武器、远程通信网络等美军优势技术在他国的扩散,类似中国的大国竞争对手已经构建起自己的防御体系,以阻滞和攻击现有美军作战部队以及通信网络,具备快速分解美军相对静态的现有军事体系的能力,并在局部地区占据了导弹数量和质量上的优势.
当前,单纯通过改进军事能力和战术来维持优势的成本越来越高昂,美军正逐渐丧失绝对技术优势,应考虑采用新的制胜机理和作战概念,即注重比对手更快、更好地进行决策,“决策中心战”的制胜关键是让美方指挥官作出比敌人更快、更好的决策,同时降级敌方决策的质量和速度,通过给敌人制造多重困境,阻止其实现目标[5],“决策中心战”把重点放在破坏敌人“观察判断决策行动”(OODA)环的判断阶段[6],充分利用军事冲突中固有的战争迷雾和摩擦,采用分布式编队、军力动态组合和重组、反指挥控制、情报、监视与侦察行动,提高己方的适应能力和生存能力,同时使敌人对美军作战的不确定性增加,降低敌方指挥官决策能力,为了加大敌方决策难度,美军将在广阔地域更高效地、分散地机动,使得敌方即便掌握己方的态势信息,也难以判别作战意图,进而难以确定打击重心和防御方向.
美军认为,指挥控制是美军保持领先中国、俄罗斯及其他潜在对手的领域,是未来的制胜关键.报告指出,“决策中心战”主体作战样式为指挥控制战.具体而言,美军作战力量应在保护己方指挥控制系统不被敌方破坏的前提下提高自身的决策能力,保持己方决策优势,同时在情报的相互支援下,综合运用机动、火力摧毁、电子战与军事欺骗等手段,阻止敌方获得信息,影响、削弱或摧毁敌方指挥控制能力,使敌方处于决策劣势,通过在陆、海、空、天、网络等多个作战领域,创造多种多样、让敌人左右为难的局势,可使敌方指挥控制失效,此外,CSBA 报告指出“决策中心战”的指挥方式为“以情境为中心指挥”,即不强制构建网络中心战所要求的高清晰度、强控制力态势环境,而是依靠战时所处情景和现有资源实施作战,准确判明敌方意图,制定行动计划并组织实施[7],只对能够联络上的部队单元实施指挥控制,前线指挥节点即便在失去与上级联络的情况下,仍能依靠智能决策支持工具独立制定并实施作战计划,达到快速和高质量作战决策的目标.
若完全实施以信息和决策为中心的作战概念,CSBA 认为美军的结构和指挥控制流程均需改变,强化分布及其在信息环境中作战战略的制定,DARPA的“马赛克战”概念提供了实施“决策中心战”作战概念的具体形式[8−9],马赛克战概念的核心思想是通过人为指挥和机器控制的结合,对更加分散的美军进行快速的组合和重组,从而为美军创造适应性和灵活性,同时给敌军制造复杂性或不确定性,这种作战方式将会使部署的军队通过拒止的方式实现威慑,进而达到美国国防战略[10],而对大量分散部队的组成和作战进行管理,需要在人工指挥的基础上结合智能控制相结合的指挥控制方式,这将在指挥控制战领域引起极大变革.
“决策中心战”的实现高度依赖自主无人系统、人工智能两个重要技术基础,需要采用人类指挥、智能辅助与机器控制相结合的指挥控制框架,报告分析指出,美军当前实施“决策中心战”能力尚为有限,无法给敌人造成多重作战困境,此外,作战指挥官高度依赖战区级指挥与控制架构,战区层面环境形势和通信变化情况拖慢了指挥官及其规划参谋的决策和动态指挥速度.为解决这一问题,美国防部应运用和推进新兴的人工智能与自主系统技术,以促进“决策中心战”的实施.“决策中心战”将通过新的指挥控制架构,将人类指挥与运用人工智能的机器相结合,进而赋予基层指挥官控制分布式部署兵力、适应环境和敌对行动的能力,以此解决任务式指挥的局限性,并给敌方决策制造困难,从而实现“以情境为中心的指挥”,就特点而言,人类指挥行为具有灵活性、创造性与适应性,机器控制与人工智能则保证了决策的速度和规模,综合人为指挥与人工智能辅助决策的指挥与控制网络将具备更高的决策能力,给敌人制造多重困境以造成决策劣势,因此,人工智能技术所提供任务式指挥决策支持将在“决策中心战”中起到极其关键的支撑.
军事竞争的下一个主要领域将由信息转向决策,美军意图通过利用其在人工智能和自主系统上的颠覆性技术,进而在“决策中心战”中建立长期优势[11].在以决策中心作战概念为指导的马赛克战构想中,由人工智能实现的决策辅助、自主无人系统、先进传感器网络,以及电子和网络战将对目标防御体系带来极大的复杂性和混乱,并对重要目标实施集中攻击,通过将当前有人一体化平台和部队编队分解为规模更小、功能更少的作战单元,这种以决策为中心的军力设计可以降低单个自主系统取代整个多任务平台的压力,同时,分散部署更有利于自主系统发挥其适用范围广、持久性强的优势,因此,将人类指挥与智能决策、机器控制相结合,可认为是“决策中心战”的重要标志.
为支持新型作战概念及“决策中心战”,美军将采用“效果链”方法对“决策中心战”作战效果进行评估,报告指出,基于“效果链”的评估方式将能够综合评价与估计美军作战部队在“决策中心战”中的效能,“效果链”的数量很大程度上反映了作战部队所能实施力量的复杂性,同时,更多可能的效果链也意味着更强的进攻、防御能力,复杂性及更强大的进攻、防御能力将提高作战力量的快速决策与行动能力,同时降低敌方迅速识别并打击美军要害目标的能力,以此达成“决策中心战”力求的“决策优势”.相比于美海军现有消耗中心的军事计划,基于“决策中心战”提出的力量架构,可在多项指标上提高部队的任务遂行能力,产生更多独立效果链,从而增加对手决策的复杂性,报告指出,“决策中心战”概念将使得作战部队的效果链增加6.9倍,防御能力提高1.6倍,打击能力提高1.4倍.
值得注意的是,美军“决策中心战”概念中的“效果链”并非以往概念中的“杀伤链”[12−13],标准军事杀伤链模型一般指美军提出的“F2T2EA”杀伤链,模型中包括查找(Find)、修复(Fix)、跟踪(Track)、目标(Target)、交战(Engage)以及评估(Assess),一条完整的杀伤链需依次涵盖全部6 项内容,若其中任何环节被中断,整个杀伤链将被中断,由于“决策中心战”以构建自身决策优势和陷敌方于决策困境为制胜机理,“效果链”在交战(Engage)环节将不限于武器交战,而更强调战术机动、干扰、和电子对抗等广泛的作战手段,“效果链”主要指可有效影响敌方行动的流程链,而“杀伤链”更注重应用武器进行有效杀伤.鉴于美海军采用新型防空反X 概念及作战能力,并动用中型无人作战单元担负诱饵及反情报、监视、侦察与目标锁定等任务,以“效果链”为核心的力量态势将具有更强大的综合能力.
态势感知是防御体系的眼睛,高质量的信息融合与态势感知技术是高效决策制定的前提.因此,基于决策中心的防御体系对数据的信息融合及态势感知技术具有极高的要求,为应对美军联合全域作战发展趋势,信息融合的数据应由多军种的不同军事传感器,以及尽可能多的独立传感网络全面获取,以生成足以支撑决策的感知态势.
现有的军用传感器网络已基本具备数据的实时收集与一定的即时信息融合能力,缺乏实时能力的主要是由视觉监控、各类监测传感器网络以及频谱监测组成的感知手段,其中,作为最直接、有效的感知方式,视觉数据由于信息冗余程度高、占用带宽大等特点,并不适合作为数据直接传输.应善用边缘计算节点,利用算法进行目标、运动轨迹与意图识别,再将获取的有用信息作为数据实时收集,此外,新的智慧城市构想已经考虑将各类环境监测纳入实时国土安全防御体系,因此,可以期待这类监测感知资源用于完全即时的作战态势感知.
完成实时数据采集与信息融合的态势感知构架可分为两套系统:一种是局部的、自主的采集与融合系统,它从同一平台或系统上的多路传感器搜集数据,例如某军种系统内的地面雷达和红外信息融合,或者地下铁路网络中的震动、声音和光线监测融合.各局部系统由附近的边缘计算节点承担计算,获取行为层数据;另一种是全局的或全域的采集与融合系统,它是对具有更大空间差、时间差和系统跨度的传感器进行综合、相关处理,例如卫星高光普成像与城市安防监控摄像信息融合,以准确确定敌方部队数量、武器能力以及行动轨迹.
基于决策中心的军用物联网无疑对无线通信的速率、时延等方面都提出了更高的要求,为了满足更高的通信需求,众多新技术可被应用于“决策中心战”防御体系的通信网络中,如更高阶的编码调制方案、部署缓存,以及基于无人机的空中基站等[14],同时,需将现有各类异构无线网络进行有机整合,再按需分配以提升网络整体弹性.
上述技术将大幅提升防御体系通信网络的承载极限,但也增加了管理维度,同时,防御体系在应对马赛克战等“决策中心”作战情景时,作战单元通常较为分散,多战域末端指挥节点协同任务艰巨,因此,所需的终端数量巨大,导致整体通信网络规模庞大.网络规模及管理维度的双重扩增导致复杂度激增,使得传统的基于凸优化或启发式的认知无线电或无线网络管理方法失效,此时,依赖强有力的人工智能手段进行通信网络管理是十分必要的,由于信道时变等原因,无线通信网络的管理是在动态变化的无线环境中对网络的众多参数进行优化,实质为动态环境中的最优决策问题,与深度强化学习的设计目标相契合.因此,深度强化学习将是智能网络管理的重要赋能技术,其强大的学习与决策能力可以对无线通信网络进行包括频谱资源管理、功率资源管理、网络资源管理,以及智能接入控制、智能网络维护在内的多种网络管理,使其在复杂的通信环境中都能够精准地匹配各指挥节点需求,最终提升网络的实际承载能力,保证作战中指挥节点与态势感知网络、作战单元以及其他指挥节点的高效通信.
智能辅助决策技术是决策中心防御体系的核心,需要提供拟制、评估、统筹、作战仿真、优选作战方案和保障方案等辅助决策功能,在快速变化的复杂城市战场中为军事情报分析、战斗实施决心、方案生成和评估等提供有效工具,是辅助指挥员快速、准确、有效地实施决策的强有力手段.
目前较为成熟的人工智能辅助决策可分为3类:1)基于神经网络和知识图谱的人工智能推理机,通过以机器方式学习专家系统、军事知识库中的已有知识和规则,生成人工智能推理机.推理机可以利用掌握的知识和规则对指挥员提出的问题快速推导出解决方案.2)基于深度强化学习的智能体决策,智能体在与环境交互的过程中,根据环境反馈得到的奖励不断调整自身的策略以实现最佳决策,主要用来解决例如作战统筹等决策优化类问题,由于强化学习不依赖已有的知识体系与规则,智能体在博弈中往往能够在充分自我学习后快速超越人类操作,3)基于群体智能的人工智能分配,主要指通过遗传算法、粒子群算法、人工免疫算法、人工鱼群算法等仿生智能算法,解决武器目标分配、作战资源分配等带有明确现实约束条件的优化问题,由于算法发展趋于成熟,计算能力要求较低,群体智能决策有望成为第一种能够实装的人工智能辅助决策.
特朗普上台以来,美国政府奉行“美国优先”的国家安全战略,先后发布新版《国家安全战略》《国防战略》以及《军事战略》等,宣布进入“大国竞争时代”,将中国、俄罗斯等“敌对大国”视作重大战略威胁,CSBA所提出的“决策中心战”概念以及DARPA定义的马赛克战等项目均针对大国竞争目标.
为应对美“决策中心战” 制胜机理对防御作战可能带来的转变与挑战,我军防御体系应尽快对未来面临的复杂对抗态势进行前沿布局与研究,通过借鉴美军“信息中心战” 作战概念中的“系统之系统”-体系,目前我军正构建的一体化防御体系已相对完整,其防御能力在多份美方报告中均得到了一定的肯定,初步具备击败现有一体化美军平台的能力[15],我军的防御体系架构强调各种系统的组合以应对多类作战,聚焦更快速的作战体系集成以及杀伤链的多元化,然而,随着系统集成而构建的体系在作战中是静态的,庞大的系统构架无法在作战过程中动态增加新的能力,扩展性差[16−17],如若美军向“决策中心战” 转变,我方静态的防御体系将难以应对100倍乃至1 000倍增量的“效果链”,为满足未来动态变化的作战需求,需要以创新思维、前沿理念为抓手,对防御体系、网络信息构架、指挥控制要素进行整理与优化,加快防御体系动态对抗能力生成.
防御体系中,自动化、自主性和人工智能是3个相互关联但不同的概念[18−20],自动化是一种技术,通常根据一组可理解和可编程的规则,在没有持续的人工输入的情况下运行,自主性是指将决策一部分委托给人、机器或其组合;人工智能是一种模仿人类行为的分类、预测或决策技术,人工智能是一种先进的自动化形式,以数据驱动并具有强适应性强,而自主性是一种关系结构,实际上,防御体系的推进重点不应是自动化作战,而是协调人工智能、传统自动化和人的复杂组合,以获得更好的效果.
“决策中心战”作战概念的实现不仅需要优化各作战单元的装备与战术策略,更需要借助人工智能、作战云等先进技术,将海量态势感知数据、战场情报实时、精准地转化为有效的作战决策,基于强化学习、大数据推理机以及群体智能算法的人工智能辅助决策技术的发展,将极大地促进指挥与控制系统智能化跨代发展,有效支撑以决策优势为核心的未来指挥控制战,应把握新一轮科技革命对指挥控制带来的推动作用,瞄准制胜未来战场的决策中心化需求,以“装备体系化、体系智能化、智能实践化”为指导,深入挖掘强化学习、智能博弈、云计算等人工智能辅助决策新型技术在指挥与控制领域的应用潜力,将信息优势最大化转化为决策优势,有效应对日益复杂与严峻的空天威胁.