蒋旭丰
经历200多年的历史积淀,兵棋从研讨型、手工型、到复杂的计算机系统支持,当前进入快速发展期。ChatGPT自2022年底推出以来,其强大的“人机对话”能力吸引了全球目光。2023年1月,美国防信息系统局(DISA)将类ChatGPT大语言模型(以下简称大语言模型)底层的“生成式A I技术”(AIGC)列入“技术观察清单”。大语言模型的突破性发展,为计算机兵棋带来新的建设和应用增长点。本文主要针对计算机兵棋发展中的痛难点问题,围绕大语言模型带来的机遇、挑战和未来发展趋势进行研讨。
大语言模型已在人机对话中展现出一系列“无所不能”的能力,目前已得到验证的应用场景包括:为用户提供涵盖广泛领域的问题解答,帮助用户撰写文章、邮件等各种文本内容,根据用户输入的文本分析其情感倾向,为长篇文章生成简洁摘要、帮助用户快速了解关键信息,多语言间的机器翻译,多种编程语言按需自动生成代码,实时在线客户服务等。在军事领域,相关研究表明,对情报分析、军事医学、军事后勤、战场环境支持、导弹制导、通信和网络安全、态势感知和数据融合、人工智能卫星、单兵穿戴系统、军事数据管理、军事建模与作战模拟仿真等建设,大语言模型均有巨大应用潜力。
人类与ChatGPT大语言模型通过电脑聊天
计算机兵棋是典型的人在回路作战模拟系统和工具,因其模拟真实战争、擅于推演不确定复杂的局势、辅助指挥决策方面的作用受到广泛关注,能为军事谋略训练、作战问题研究、作战方案优化和评估等提供有利支撑,在美军中已成为现代战争和作战筹划的关键环节,具有解决复杂军事问题的能力。目前,大语言模型在计算机兵棋上的应用刚处于初步探索阶段。“海空兵棋”社群组织开发了名为“AI军事顾问”的大语言模型应用,拥有基础的军事语言理解和文本生成能力,比如:能基于文档机器翻译完成跨语言文本理解,实现中文对英文专业文档的查阅;能对军事专业术语进行查询,提问“根据兵棋操作手册,如何解释DLZ?”时的回答,基本准确复述手册中关于DLZ概念的描述;能对地形做解读分析,询问“兵棋中地形如何影响战斗?”后的回答,能详细解释地形对作战单位、视距、武器性能等方面的影响。目前,该应用已完成有限的互联网开源情报和相关理论语料训练,一定程度上能辅助计算机兵棋推演。
大语言模型的成功,在军事领域引起广泛关注,也将对计算机兵棋的设计和应用、兵棋推演的准备和评估等,带来新的建设模式和应用创新。
多模态技术加持将带来态势感知新能力。计算机兵棋作为作战模拟的高效工具,基本步骤是由参训人员首先处理各种指控信息,计算机按照规则分析、计算、评估推演活动对整个战争的影响,模拟各种作战实体在虚拟战场环境中的行为操作,在保证训练对抗可信的同时,能很好地加速战争经验和演习数据的总结积累。通过兵棋系统界面,参训参演人员感知战场态势,对推演环境进行认知、理解和状态预测,是指控能力训练的第一步。但参与实体往往多元异质、推演空间规模广阔、协同问题多变复杂,在快节奏的作战推演中,战场环境瞬息万变、战机稍纵即逝,对抗环境下很难及时、全面掌握战场形势,很可能因关键信息错漏缺失,误导得出截然相反的错误判断。大语言模型技术及应用将图像、视频、表格作为输入输出选项,支持与人更加直接的对话交互,开启通往通用人工智能之路,已然构筑起生成式AI技术领域核心基石。大语言模型技术赋能兵棋态势感知,意味着文字、图像、视频等不同语言格式的输入输出数据将得到良好管理,便于基于整体动态环境快速洞悉形势、判断风险利弊,为参训人员提供和其角色、身份、任务相关的信息,帮助其指数级降低头脑信息处理负荷,为后续有效决策奠定基础。
美军运用兵棋推演海湾战争
即问即得知识问答将带来方案对比和兵棋推演新效率。兵棋推演分析能有效评估作战方案,如美军入侵伊拉克、活捉本拉登等军事行动发起前,都在五角大楼兵棋系统推演了很多遍,各种军演都要先行进行兵棋推演以进行作战方案比较和行动计划分析。美军作战条令中明确规定:在初步构想及开发多个作战方案和行动计划后,必须通过兵棋进行分析。辅助参演人员分析、评估、比较作战方案和细化行动计划,是计算机兵棋的显著优势。作战计划一般可分为概念性计划、应急计划、危机行动计划、实时计划等,但不同类型计划对计算机兵棋的使用要求及兵棋对各类计划的支持程度差异巨大。如概念计划常以定性分析为主,兵棋推演往往不能获得重复性统计结果;概念和应急计划均需耗费大量时间构建相应数据库;应急、危机、实时计划都要求参演人员非常熟悉想定所有情况,这无疑都对计算机兵棋的使用效率带来影响。大语言模型技术与兵棋结合,将成为兵棋推演和辅助参训人员的“GPT参谋助手”,基于Prompt指令的即问即答能显著深化参训人员对兵棋想定和己方使命、意图、任务、目标的理解,提速作战行动方案比较分析,汇集多个作战方案计划的优点,加快现行的兵棋推演效率,甚至重写兵棋推演模式。
大模型知识推理能力将赋予兵棋“新灵性”。棋盘、棋子和规则是兵棋的三要素。其中,棋盘指兵棋运行的基础环境,棋子指行为交互的实体,而规则主要用于评判执行军事行动的可行性与完成效果、采取军事行动后对武器装备的作用效果,以及武器装备的效能评估,直接影响推演的组织模式和最终推演结果,是兵棋系统运行的核心。对兵棋规则进行优化,将使得兵棋适应不同的场景,但不管是建模更新、还是专家群体共识达成法,整体规则优化方法的效率总体较低,一定程度上使得兵棋表现较为“呆板”。大语言模型具有的常识推理能力,为活化兵棋规则带来启发,通过基于持续学习得到的军事逻辑,立足现有的战场态势,利用外部的知识库,解决与态势前提和行动假设相关的问题,将赋予兵棋处理不确定性的能力,提升兵棋适应不同推演场景和需要做出调整变化的能力。在兵棋推演过程中,能够帮助参训人员动态预见和展现作战中己方的行动、对方的行动及己方对敌方行动反应的对抗过程。
辅助构建通用智能体将推动兵棋推演新发展。计算机兵棋与人工智能技术结合,构建AI智能体是兵棋智能化的典型应用。以行为树、自动机等知识引导技术构建AI智能体,已在基于墨子、庙算、CMO等国内外兵推人机对抗赛中体现出了一定的智能水平,在特定想定下的机机对抗赛中甚至达到了专业级选手能力。但在构建特定场景、通用AI智能体方面面临复杂困难,主要是任何单一的知识引导、机器学习等技术都有其内在局限性,增加单一维度的空间也将使难度成几何倍数的增长,无法完全解决计算机兵棋智能化发展的诸多问题。大语言模型对海量信息的融合和深度强化学习反馈机制,将使得AI智能体在与环境交互试错中拥有更多的常识积累,使其在多任务、多想定、多轮次的兵棋对抗推演中,能够更快速准确地推动OODA循环。特别是利用大语言模型微调技术,将使得针对性设计兵棋AI智能体专用优化目标变得更加容易,以适应不同规模的集群、群、分群的自博弈对抗。
兵棋推演纳入美军各军种院校培训科目
在给军事领域带来可预期应用潜力的同时,也应看到,计算机兵棋智能化进程正快速发展,大语言模型从突破到与计算机兵棋相互融入,也将面临诸多挑战。
功能结合和深度耦合面临诸多技术难题。模块化功能结合和多种技术打破深度耦合,是大语言模型赋能计算机兵棋的两种可能方式。模型化功能结合能在最大程度上保持兵棋和大语言模型各自建设和发展的基础,赋能和影响计算机兵棋发展。一方面,计算机兵棋系统本身的复杂程度较大;另一方面,大语言模型建设和训练的成本极高,甚至达到百亿美元量级规模,每次调用花费不菲,从训练到部署更是难上加难,且两者都对工程能力有极高的要求,需要漫长的需求提出和满足迭代过程。从概念模型、数学模型、程序模型等各个层面,打通兵棋和大语言模型间的多种技术环节,实现兵棋和大语言模型多种技术的深度耦合,是利用大语言模型、赋能计算机兵棋的根本途径。但这需要对大语言模型和计算机兵棋技术进行充分解构,是学术界和产业界持续关注的开放性问题,以及计算机兵棋持续投入和未来发展的趋势。
兵棋推演在美军建设及作战设计等方面发挥的作用越来越重要
“双重迷雾”叠加更加凸显“黑箱”困境。大语言模型是一堆神经网络的参数,本身不包含具体意义,其行为由训练数据决定,数据量越大、质量越高,模型的能力就越强。技术复杂性和不透明性造成的“黑箱”问题,无法清晰展示输出与输入之间的因果关系,难以阐明在特定条件下会输出何种结果,使用者可能始终无法完全信任其输出的结果,存在人机信任问题和挑战。在大语言模型赋能的计算机兵棋中,回复可能是一本正经地胡说八道,态势判断貌似合理,作战方案计划看似可行,但实际上可能与现实情况大相径庭。可解释性人工智能技术正在持续发展,但当前大模型仍不能提供合理的证据进行可信性的验证。因此,兵棋固有的“战争迷雾”和大语言模型“信息迷雾”双重叠加,将更加凸显兵棋的不可解释性。兵棋推演中所获经验成果的有效性,在检讨反思和复盘评估中,可能会被进一步削弱。
高门槛下的特定应用转化道阻且长。全生命周期自主可控,无法实时地融入新数据、新知识,明显的可回答问题知识边界,需要专业调教才能准确回答等,是大语言模型与计算机兵棋结合应用时需要持续推进解决的问题。目前,百度(文心大模型)、腾讯(HunYuan大模型)、阿里(通义大模型)、商汤、华为(盘古大模型)、科大讯飞(星火认知大模型)等国内企业,主要采取“模型+工具平台+生态”三层共建模式加快大语言模型的建设应用。受限于大语言模型研发所需的算力、算法、数据、人才、资金储备等建设的高门槛,其与计算机兵棋结合主要以“重后台、轻前台”的方式进行。同时,与大语言模型将全互联网数据用于学习相比,军事领域中结构化的作战经验、各类作战场景演练等数据积累仍需持续迭代和专业构建,在计算机兵棋上的应用还受兵棋的普及程度和兵棋大数据建设的影响,借力国内自主可控的大语言模型,构建军事大语言模型和兵棋大语言模型,需要跟进布局和长期投入。
大语言模型的技术突破,无疑能更好地满足信息化和智能化条件下的多专业、多指挥层级融合推演需求,给解决计算机兵棋现存的理论和技术问题带来契机。未来,综合包括大语言模型、大数据和其他人工智能技术最新发展成果,将为构建更复杂、动态调整、可配置的战场环境,构建更为精确的作战模型、更大范围的推演区、更多样的军事作战行为、更逼真的模拟与仿真推演,创造更快捷和便利的技术条件。特别是随着大语言模型等技术的深入发展及其成果在军事领域的转化应用,将更好助力计算机兵棋的智能化进程,促进计算机兵棋系统与实战演练及训练的深度融合,为作战决策、实战训练和军事教育提供有力支撑。