罗 荣 王 潋 马 焱,2 肖玉杰 王 亮
(1.中国人民解放军91054部队 北京 102442)(2.西北工业大学航海学院 西安 710072)
海战场指挥信息系统将侦察、监视、情报、指控、武器、对抗、通信、导航、综合保障等传感器和设备通过可靠畅通的高速网络有机地、无缝地黏合在一起,使情报分析处理系统、作战指挥控制系统、武器火力交战系统达到高度融合,使情报链、指挥链、打击链以及保障链集成一体。它通过海战场交战过程数据采集、处理、传输、分析、挖掘、使用的全环节、全过程,使传感器、通信、频谱、计算、火力、兵力等作战要素或资源在陆、海、空、天、网、电等所有作战空间内实现最佳配置,最终实现侦察、情报、通信、指控、信息战和武器运用及综合保障等功能的一体化,使作战兵力能够实时地或者近实时地透视战场、感知态势、评估威胁,自动精准地跟踪锁定敌方目标,快速科学地优化作战方案,有条不紊地协调反舰导弹、鱼水雷、舰炮、干扰弹、激光等软硬武器资源实施远程精确打击,从而实现传感器-射手无缝衔接的打击过程,实现“传感器设备→指控系统→舰载武器”一体集成的交战过程。因此,海战场指挥信息系统是全舰信息聚集中心、数据计算平台以及决策指挥中枢,必然是人工智能技术大规模应用的典型舞台与前沿阵地,其中感知智能技术非常适用于海战场指挥信息系统中的预警侦察与情报保障装备,而认知智能技术非常适合用于海战场指挥信息系统中的指挥决策装备。深度学习作为人工智能领域研究最为火热的一类综合人工智能技术,即可以作为感知智能技术,模仿人类感知系统进行判断、分类与识别,又可以作为认知智能技术,模拟人类认知系统进行理解、推理与决策。因此深度学习可以应用于海上作战的感知、判断、决策与行动等各个环节,赋予海战场指挥信息系统自主化与智能化特征,提高目标识别、态势感知与指挥决策的准确度与实时性,增强装备信息感知、指挥决策以及火力打击等核心能力。为更好地促进深度学习在海战场指挥信息系统中应用研究,明确主要发展方向,本文阐述了深度学习概念与内涵,归纳了深度学习技术体系,综述了深度学习在军民用领域研究与应用现状,并对深度学习在海战场指挥信息系统中的应用前景进行了展望。本文成果能为相关研究提供参考借鉴。
机器学习是智能科学与技术的重要分支,也是人工智能的主要研究领域,现阶段俨然已成为人工智能的代名词,其概念内涵与特征范畴十分丰富,其技术体系庞大复杂。通俗地讲,机器学习是指一类能从大量历史过程或者已知的样本、数据中学习知识与规律,从而对未来作出准确科学预测的或对未知的样本、数据做出正确有效识别的技术。深度学习技术是现阶段机器学习技术体系中研究最为活跃、成果最为显著、影响最为深远的技术。
深度学习从本质上讲是一个通过模拟人脑神经网络的构成与处理外界信号输入的方式建立一个深层神经网络模型。该模型是一个包括输入层、多隐层(可以多达数十层,通常大于5层)以及输出层的、层内互相独立无连接且层间无向对称连接的网络结构,非常接近人脑的内部结构,能够模拟人脑分析学习的过程,可以对数据进行较好的本质刻画、层次化表达与特征提取,能不断从低层提取原始数据或初始特征,通过多隐层的逐层变换,形成更抽象、高层的特征表达,从而实现特征从底层至高层的映射、从高维到低维的变换、从具体至抽象的转化。其不仅可以有效挖掘出原始数据中潜在的信息与知识,而且可以学习样本数据中的内在规律和表示层次,从而在分类识别中可以获取较高的识别精度,性能远超其他机器学习技术。
深度学习技术体系包括以下三类技术:监督学习技术、非监督学习技术、增强学习技术以及小样本深度学习技术[1~2]。深度监督学习技术主要包括卷积神经网络和循环神经网络等,其核心部分均是网络结构与模型参数,利用带标注的已知数据或样本对初始网络进行不断的训练可以得到这些网络的模型参数。卷积神经网络中信息按神经元在网络中的层次由浅至深地依次进行处理与传输,而且网络没有记忆功能,即层次较深的神经元输出的不会控制层次较浅的神经元参数,两者之间具有相对独立性,因此卷积神经网络本质是前馈神经网络,不适用于进行时间序列数据的学习与处理,主要应用于计算机视觉、模式识别等领域,典型知名的卷积神经网络有 LeNet、AlexNet、CapsNets、ResNet、VGGNet、GoogleNet等[2]。卷积神经网络主要分为检测卷积神经网络、跟踪卷积神经网络、分割卷积神经网络和轻量化卷积神经网络等四个基本类型。检测卷积神经网络主要用于从图像、音频、视频等大量含噪的原始信号中挖掘出有用信息,检测出有用或者感兴趣的目标,主要有Anchorfree系列、RetinaNet系列、FPN系列、RFCN系列、SSD系列、YOLO系列、RCNN系列等[2];分割卷积神经网络主要用于将原始图像、视频按预先设定的规则自动地分割为满足特定需求的区域或者部分,主要有 :PANet、LinkNet、Mask R-CNN、PSPNet、Deep-Lab、FCN等;跟踪卷积神经网络主要用于在视频等连续拍摄的图像中跟踪感兴趣的或者有用的目标,主要包括ADNet、孪生网络系列算法(SiamDW、SiameRPN++、RASNet、SiameRPN、SiameseNet等)、GOTURN、MDNet、TCNN、HCF 等[3];轻量化卷积神经网络用于各种嵌入式系统上实时运行,主要包括XceptionNet、ShuffleNets系列网络、MobileNets系列网络等。与卷积神经网络没有记忆功能不同的是,循环神经网络具有记忆能力,适用于序列数据的学习与处理,包括门限循环单元网络与长时短期记忆网络(又包括 LSTM、Bi-Directional LSTM、Stack LSTM等)等基本类型,主要应用于自然语言处理、时间序列数据分析等领域。循环神经网络之所以具有记忆能力,究其本质可知,其基本深层神经元输出到浅层神经元输入和状态的控制机制。
深度非监督学习技术可分为生成对抗网络、深度信念网络、深玻尔兹曼机以及自编码器等三个主要类型[2]。生成对抗网络由生成网络与判别网络等两个网络模型组成。一个训练好的生成对抗网络能够生成高质量的图像,其内在运行机制是在网络损失度量中包含不利于一个网络而利于另一个网络的部分,构造两个网络之间的竞争博弈关系,学习过程不仅使得生成网络输出将输入噪声信号尽量逼近真实图片来迷惑判别网络,而且还使判别网络尽可能去辨别真假图片来提高分类正确性,从而实现整体性能提升与优化。生成对抗网络主要包括 GAN、SimGAN、BigGAN、infoGAN、EBGAN、WGAN、CGAN等模型,主要应用领域有图像修复、超分重建、人脸合成、手写体生成等[4]。深度信念网络是一种典型的由多层受限玻尔兹曼机堆叠而成的深度神经网络,采取预训练和微调的训练方式,可自动直接从低层原始信号出发,通过不断智能学习与重组低层特征形成更加抽象的高层特征表示,从而发现数据的分布式特征,避免特征提取与选择的人工操作,同时只需少量样本便能训练出很好的分类器,在稀缺认知样本识别中具有一定优势。深玻尔兹曼机是玻尔兹曼机模型中具有对称耦合随机二值单元网络以及无向层连接马尔可夫随机场的特殊子类,与受限玻尔兹曼机只有1个隐层不同的是,深玻尔兹曼机具有多个隐层。深玻尔兹曼机已经成功应用于暂态数据模型学习、时间序列建模、自动语音识别、文档分类、信息检索、降维、分类、协同滤波等信号与信息处理领域。自编码器能够通过无监督学习,生成输入数据的低维表示,从而实现信号降噪与特征降维,一般采用编码器-译码器结构,主要包括VAE、Stacked Denoising AE、Transforming AE等基本类型[2,5]。
深度增强学习技术主要包括策略梯度学习和Q学习等两个基本类型[6~7]。常用的策略梯度学习有Actor-C、蒙特卡洛策略梯度、有限差分策略梯度等,其本质是利用深度神经网络,实现策略的参数化,并通过梯度优化控制参数权重,选择较好的行为实现策略。常见的Q学习方法有DQN、DRQN、Prioritized DQN与Double DQN,其本质是利用深度神经网络,采用估计、决策和更新的迭代过程,逐步逼近贝尔曼方程描述的递归约束关系[2]。
小样本深度学习技术,又可称稀缺样本深度学习技术,是一系列只需使用少量标注的样本或数据即可训练出可使用的深度神经网络的算法的统称,包括少样本深度学习技术、单样本深度学习技术以及零样本深度学习技术等。小样本深度学习通常借鉴基于新理论、新原理、新机制的现代机器学习方法来实现,常见的有模型无关自适应方法、借鉴元学习的方法、借鉴图神经网络的方法、基于原型网络的方法、基于匹配网络的方法、基于孪生网络的方法、基于度量的方法、基于网络参数微调的方法等[2]。
深度学习技术体系如图1所示。
图1 深度学习技术体系
虽然深度学习技术研究与应用热潮在近十多年才开始兴起,但深度学习这一概念早在1976年就被Ference Marton和Rogr Saljo联合提出,并且开始被人们研究。深度学习是相对于浅层学习而言的,其使用的是深度神经网络结构,层数多,参数量大,具有较强的建模、拟合、逼近与学习能力。然而早期研究表明,深度神经网络在训练中容易陷入局部最优,难以充分发挥深度复杂模型潜在的学习能力。因此,深度学习一直未引起人们应有的重视。2006年,Hinton提出了基于受限玻尔兹曼机的逐层学习算法,该算法能够跳出局部最优,克服了传统深度神经网络训练时容易陷入局部最优的缺陷,解决了深度神经网络训练难题。从此以后,深度学习受到人们高度的关注,其研究持续升温并形成一股热潮迅速席卷全世界,在图像识别、语音识别以及自然语言处理等领域取得诸多重大突破与实用成果。2011年以来,语音识别研究人员将深度学习引入语音识别领域,彻底改变了语音识别原有的技术框架,将语音识别错误率降低20%~30%,成为语音识别研究史上划时代的进步。2016年,百度公司利用深度学习技术将安静环境下的语音识别准确率已经达97%,在方言背景下或者语速快的情况下语音识别准确率已经超过人类。2012年,深度学习技术在图像识别领域取得非凡的效果与举世瞩目的成就,在ImageNet评测上将错误率26%降低到15%,性能碾压之前在图像识别领域常用的支持向量机。2014年,Facebook公司利用深度学习技术将人脸识别的准确率提升至97.25%,已经接近人类水平。2015年,基于深度学习技术的图像识别错误率已经低于人类,2016年,基于深度学习技术的图像识别错误率已经达到2.991%。2008年之前,自然语言处理主要的研究方法有隐马尔可夫模型、条件随机场、正则表达式以及字典匹配等,虽然取得了一定的成果,但还远未能达到令人满意的程度。2008年,Collobert等开始将循环神经网络应用于自然语言处理,由于其拥有时间序列处理先天优势,自然语言处理技术取得了极大的突破。目前,有道词典、谷歌翻译、百度翻译等语言翻译工具,百度、谷歌等搜索引擎,以及在各个领域出现的智能问答系统都是深度学习技术在自然语言处理领域中的实用成果。
深度学习作为重要的人工智能技术,预示着一种具有灵感直觉、推理认知和自我学习与进化能力的新的人工智能时代的到来,不仅广泛应用于图像识别、语音识别、自然语言处理等领域,而且也日益向军事渗透,为军事智能化打开了进入快车道发展的大门,在情报侦察、态势感知、辅助决策、协同作战等领域具有光明的应用前景,对于打赢未来信息化战争具有重要支撑作用。因此,世界各国军队对于深度学习技术高度重视、大力投人,进行了卓有成效的探索,并取得了一系列重要进展。
美军高度重视以深度学习为代表的人工智能技术研发与应用。2010年,美国国防部DARPA计划首次资助深度学习项目,参与方有NEC美国研究院、纽约大学以及斯坦福大学等研究院所和高等院校。美军将深度学习技术应用于F-35,B-2等战机,以提高其综合作战效能。例如,F-35战机装备的“自主后勤信息系统”,就应用了深度学习技术,实现了计算机评估、对照清单检查、组织信息和自主决策等功能。截止目前,美空军已经有600多个项目结合了以深度学习为代表的人工智能技术,用于完成各种各样的任务。美国陆军借助深度学习等系列人工智能技术,研发了智能机器人,以替代士兵执行特殊任务。下一步计划将深度学习技术用于无人车和无人机中,包括未来垂直升降机和下一代无人战车。
俄军也非常重视深度学习技术的研究与应用。例如,俄军已经研发出基于深度学习技术的无人机群指挥软件,该软件能同时指挥最多由6个飞行器组成的无人机群组,通过处理相关侦察信息,建立三维地形模型,实现无人机群的自主飞行,并自主对敌方的无人机、导弹等目标进行攻击。
我军目前也在大力开展深度学习技术在军事国防领域的研究与应用,取得一定成果。例如,我军研发了基于深度学习技术的语音识别和合成模块,用于情报处理。我军也在开展深度学习在内的人工智能技术在智能机器人和无人作战系统等方面的研发工作,部分基于深度学习技术驱动的无人装备和系统软件陆续问世并应用于军事实践,对我军现代化建设发展起到了重要促进作用。
深度学习使机器模仿视听、思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步,并在计算机视觉、图像语音识别、自然语言处理、数据挖掘、搜索推荐以及其他相关领域取得很多成果。但随着深度学习基于理论的深入研究和应用领域的不断拓展,深度学习技术自身存在的一系列瓶颈问题也逐渐显现出来,成为了制约深度学习技术进一步突破与深化应用的主要问题。
1)模型黑盒,可解释性差。
算法可解释性指算法要对特定任务给出清晰概括,并与人类世界中已定义的原则或原理联结。深度神经网络一般包含多个隐藏层,网络参数更是数不胜数,通过标注大量数据驱动的误差后向传播来不断优化模型参数。人们很难理解深度神经网络中隐藏层数目、神经元个数和激活函数形式等会对识别结果产生怎样的影响,使得深度学习大多依赖于大量的工程经验和技巧。因此,深度学习模型是一种典型的“端到端”模型,其学习过程犹如“黑盒子”,对参数的选取和运算单元的输出常常无法解释。另外,新的深度神经网络还引入了各种复杂的网络结构,更进一步加剧了可解释性问题的严重性。由于在战略筹划、作战决策等军事领域,错误判断决策往往会带来影响非常大的后果,因此利用深度学习进行重大决策时,往往需要知晓算法所给出结果的依据。所以,深度学习可解释性弱是制约其在军事领域深入应用的关键瓶颈问题之一。为了提高深度学习可解释性,透明化深度学习黑盒模型,可以将深度学习与因果计算、常识推理等技术结合起来,从卷积神经网络的特征分析、卷积神经网络可视化以及基于可解释模块的深度网络学习等方面开展攻关,设计可解释的能自动推理的深度神经网络。
2)过度依赖数据,任务适应性差。
利用深度学习进行目标分类识别的一般过程是:首先准备好大量标注好的数据,选定网络模型结构,确定初步网络参数(比如:激活函数类型、隐藏层数目以及每层神经元个数等),然后应用算力强的计算平台,以“炼金术”方式不断调整优化网络参数,最终得到一个应用于具体场景,适应于特定任务的深度学习模型。由此可见,深度神经网络过度依赖标注数据样本,任务适应性差,场景任务变换后,需要利用大量针对新任务的数据重新训练,周期长,费事也费力。由于军事目标的高度保密性与隐蔽性、感知手段的限制、样本数据标注困难、军事目标更新快、特定军事目标样本少等多种原因,造成军事目标样本数据呈现显著的稀缺特性,无法满足深度学习技术对数据的需求。因此,深度应用到军事领域目标识别难以取得理想效果。为解决深度学习技术过度依赖样本数据,提升其任务适应性,建议将深度学习技术与小样本机器学习技术、迁移学习技术等相结合起来,重点发展基于生成对抗网络的数据生成与增强技术、深度迁移学习技术、元学习技术、零样本学习技术、单样本学习技术、贝叶斯概念学习技术、图神经网络技术等关键技术。
随着舰载武器与信息技术的快速发展,传统的海战场指挥信息系统固有的短板、弱项与瓶颈问题(多源信息融合不充分、目标识别准确度不高、态势感知不全面不清晰、指挥决策质量差与效率低、难以实现态势即时感知与同步认知,从传感器到射手的时延过大导致OODA指挥控制环周期过大等),难以满足新军事斗争的要求。一是由于海战态势日趋复杂异变,传统海战场指挥信息系统的组织形式与运作流程已经难以满足未来海战的需求;二是在现代信息战条件下,海战场作战环境十分恶劣,作战双方都在采用相应的伪装、隐蔽、欺骗和干扰等手段和技术,进行识别和反识别斗争,传统海战场指挥信息系统系统目标精确识别与态势深度感知能力的不足,难以满足未来海战信息保障需求;三是海上编队兵力构成复杂,电磁环境复杂,大量高速甚至超高速武器甚至精确制导武器的使用,隐身目标与超低空突防目标的出现,导致海战场态势错综复杂、瞬息万变,从而使得作战指挥过程中指挥员需处理的信息量激增。有限的大脑存储能力、计算能力、信息检索能力以及判断推理能力,使得指挥员很难处理大量原始信息的同时及时作出大量准确的决策,极大地制约指挥员对战场态势的感知与认知,也极大约束了指挥员经验知识的有效运用。因此,传统的人工或半自动化指挥决策模式已经达到生理极限,无法满足新军事变革下的超低延迟、超高强度、超大容量、全域全维作战要求。人工智能、大数据、云计算等新技术日益成熟,能够对有海战特色的“指挥艺术”、“作战经验”进行学习,推动形成具有自识别、自学习、自适应、自组织的海上信息作战能力。为解决现有海战场指挥信息系统固有的短板、弱项与瓶颈问题,实现我海军指挥信息系统发展弯道超车,必须抓住人工智能技术快速发展的机遇,加快人工智能等新兴技术成果在海战场指挥信息系统中的转化应用与创新发展,研制高效人机交互、人类智能与人工智能共栖的智能化海战场指挥信息系统,从而提高我海军指挥信息系统的智能化水平。
深度学习方法本质是包含多层感知的神经网络模型,通过学习底层数据提取原始特征,然后经过多重组合与逐层压缩,从而获得数据本质特征的表述。若将深度学习方法应用于海战场指挥信息系统,不仅有望很好地描述出现代化海战场上诸多的复杂数据与动态信息,从而更好地挖掘海量数据背后的隐藏特征,有利于提高识别分类的正确率,而且有望及时有效地发现海战场的不确定因素和将要或已经表现出的涌现性特征,有利于增强推理决策的准确性。具体来讲,深度学习可以在海战场指挥信息系统中的目标识别、态势感知以及作战辅助决策等三个主要功能域进行广泛深入应用。
1)深度学习在目标识别方面的应用展望
目标识别(又称身份估计或属性分类)是指对目标敌我属性、类型、种类的判别。目标识别不仅是战场态势与威胁估计的基础,也是战场决策的重要依据。在错综复杂、瞬息万变的海战场上,及时准确的目标识别不仅可以增强进攻能力,而且还能减少误伤,从而提高综合作战效率。随着传感器技术与军事侦察手段的迅速发展,现代海战场部署了舰载、潜载、星载、车载、无人机载等大量的传感器,可以对海战场目标与环境进行全方位、多层次、全天候地探测,从而产生海量的电磁、图像、视频、文本等结构化与非结构化数据,因此军事目标识别随之呈现出超大容量性、高复杂性、强不确定性等诸多新特点。如何快速准确从来自多源传感器的多类型、多时序、多目标的海量电磁、图像和视频等数据中查找出感兴趣的军事目标信息,从而为指挥决策提供精准高效的情报服务,是打赢未来海战的重要挑战之一。深度学习技术颠覆了传统人工智能系统的运行规则,使得计算机能够模拟大脑的运行模式,通过多层卷积神经网络学习识别抽象模式,可以完成需要高度抽象特征的人工智能任务,从而解决可以一些通用的目标识别问题,为有效应对上述挑战提供了可行之径[8]。
2)深度学习在态势感知方面的应用展望
战场态势是指敌我各作战要素(主要包括装备情况、兵力部署情况、天气条件、地理环境等)的状态、变化与发展趋势。战场态势中蕴含着大量的非线性信息和不确定因素,具有很多复杂性、涌现性特征,态势数据也呈现出了多源异构、非结构、海量且价值密度低等典型的大数据特性。传统智能化战场态势理解方法因基于线性、确定性理论已无法满足现代战场态势感知的任务需求,严重制约信息优势的达成,致使智能辅助决策系统以及指挥员都难以实时或者近实时地给出可靠科学的作战决策结论,显著影响了作战效果。深度学习方法本质是一个多层感知的深度网络模型,其结构模拟了大脑皮层的层次学习结构,具有强大的非线性处理能力以及逐层理解自动分析提取的结构、良好的“记忆”性质,体现出非线性表达、多层学习、自主提取等独特优势,目前己被誉为最接近人脑的智能学习方法,为研究错综复杂、瞬息万变、信息海量的战场态势评估问题提供了智能化的技术手段。深度神经网络的多层神经元能够综合浅层的态势要素,实现态势理解和预测。深度学习技术在态势感知方面的主要作用是实现对战场态势的高级理解,侧重点在于态势感知的理解过程与预测过程[9~10]。
3)深度学习在作战辅助决策方面的应用展望
作战辅助决策是以控制论、军事运筹学、管理科学、模糊数学等为理论基础,以信息技术、仿真技术、计算机技术等技术为手段,利用模型、数据、规则、知识等解决半结构化或非结构化的决策问题来辅助作战指挥员分析判断情况、确定作战方针、定下作战决心、制定作战方案进而实施作战指挥一类综合性技术。传统基于先验知识与规则的作战辅助决策方法,实现作战指挥实体对战场态势的理解与决策指令的自动生成,暴露出求解空间不完备且难以形式化,态势样本实例特征维度过高且样本数量少,辅助决策模型适用性不强等诸多问题[8]。随着具有网络化、智能化、体系化为主要特征的现代化战争的日益临近,利用人工智能技术分析、理解、预测战争,并从中辅助指挥员适时、快速、准确地做出决策的需求越来越迫切。随着以深度学习为核心的人工智能技术的突破和发展,为海战场指挥信息系统智能化开拓了新的技术途径,而基于深度学习的作战辅助决策也势必成为形成与对手不对称优势的关键。近年来,以AlphaGo为代表的系列人工智能模型取得的成功表明深度学习技术在面对大数据和瞬息万变的战场环境时所具有的智能处理和推理决策的能力,不仅证明了其用于作战辅助决策智能化的可行性,而且一定程度从侧面反映出其应用于作战辅助决策巨大潜力与光明前景。
深度学习具备强大的非线性特征提取与融合抽象能力,可解决许多简单的线性方法无法合理描述解决的问题,具备逐层理解、自动分析提取的结构,使得深度学习方法能够深入挖掘海量战场信息背后的许多隐含知识,具有良好的“记忆”特性,对于需要先验知识的感知评估与推理决策类问题提供了很好的支持。为更好地促进深度学习在海战场指挥信息系统中应用研究,明确主要发展方向,本文在阐述深度学习概念与内涵、归纳深度学习技术体系以及综述深度学习研究与应用现状的基础上,从目标识别、态势感知以及作战辅助决策等三方面对深度学习在海战场指挥信息系统中的应用前景进行了展望。