赵佳欢 杨海明 邱令存
上海机电工程研究所,上海 201109
在现代信息化战争中,战术意图识别是战场态势感知的核心内容之一,是指挥员作出决策的重要依据[1-2]。传统的意图识别方法需要指挥员结合战场环境、目标属性、目标状态和敌我兵力部署等一系列特征作出判断。这些特征与意图之间很难用显式的数学公式表达,主要依赖于指挥员的经验知识。随着现代战争中信息规模剧增,传统的意图识别方法普遍需要面对信息过载的问题,即面对大量的数据信息,如何选出有用的信息并加以合理的利用。为减少对专家经验知识的依赖,解决信息过载的问题,需要设计一种高效的智能化意图识别模型[3]。
基于模板匹配、贝叶斯网络和证据理论等方法的意图识别模型普遍存在一些局限性[4-7],比如领域专家知识的显式表示问题、战场态势时序信息处理的问题等。循环神经网络(Recurrent Neural Network, RNN)是深度学习领域中备受关注的模型之一[8-9],在语音识别、机器翻译等序列数据处理领域有着广泛应用。本文以RNN模型为基础建立战术意图识别模型,解决目标特征自动提取、序列数据处理等问题,然后将注意力机制引入意图识别模型,提出一种融合注意力机制的战术意图识别模型,同时在注意力分布计算过程中,设计了新的点积打分函数,减少计算资源的消耗,提升模型训练时的收敛速度,最后通过仿真验证了改进后意图识别模型的有效性。
意图是指希望达到某种目的的设想和打算[10],而战术意图指在某次具体的作战过程中,为完成某一特定任务而做的基本设想和打算。对敌意图识别是指根据战场上我方信息源所获取的敌方信息,综合推理判断出敌方目前的作战意图。
图1为空中目标群及其意图的层次图,该图所含的意图类型并非空中目标意图类型的全集,仅是给出了战场指挥员关注的、对敌我双方对抗有关键作用的意图类型。需要明确的是,只要是判定来袭目标为敌方军事单位,无论其是执行何种任务、遂行何种意图,都会对我方造成一定程度的威胁,唯一的区别在于是直接威胁或是间接威胁。直接威胁意图会直接导致我方重要目标蒙受损失,间接威胁意图虽然不会直接造成我方的损失,但是可能会为后续敌方行动提供情报支撑,属于间接威胁。
图1 空中目标群/意图层次分解
战场上的威胁主要来源于军事目标,一般认为民用目标不会构成威胁。而军事目标又可分为独立目标和集群目标,但在现代信息化战争中,多兵种多组织协同作战能发挥更大的作战效能,不同意图的实现需要各类不同战机编队配合完成,下面给出几类常见的战术编队:①突击编队,主要执行摧毁诸如指挥所、军用机场等重要预定目标的任务,是实现攻击意图的主力,一般由歼轰机、轰炸机、强击机等组成;②火力压制编队,执行反辐射作战任务,摧毁对手地面防空导弹阵地,由“野鼬鼠”(Wild Weasel)战机组成,携带反辐射导弹;③电子压制编队,执行干扰压制对手地面防空导弹阵地,由电子干扰机组成;④掩护编队,掩护己方其他编队在战区内的活动,由歼击机和多用途飞机等组成;⑤预警指挥编队,搜索监视空中目标,指挥并引导己方战机,由预警机组成;⑥战术侦察编队,对重要区域进行侦察,由侦察机组成。
本文以攻击、侦察和撤退这3大类入手对敌方意图进行分析。
攻击是战场上威胁程度最高的意图类型。现代战争中攻击任务大致可分为突防攻击和防区外攻击。突防攻击,指突击编队在压制编队成功开辟空中走廊的前提下,对地面目标实施打击,一般用于打击敌方纵深目标;防区外攻击,指在电子压制编队协同下,载机于防区外发射远程武器进行打击。遂行意图需要多兵力多机型编队合力完成,攻击意图一般由突击编队、压制编队、掩护编队、预警指挥编队中的几种组合完成。
侦察是为了获取对手相关情报,比如兵力部署、战斗编成、指挥所位置、武器装备等关键情报,一般于战斗行动发起前进行。为强调侦察行动的灵活性、隐蔽性,侦察任务编队一般由侦察机群组成,有时也会携带掩护编队等,具有暴露即退的原则。
撤退是指战斗单元在执行任务过程中被敌方单位阻截而受损,或完成既定任务后,从作战区域内退出的行动。
战术意图识别过程显然是非合作式的,敌方必然会隐藏其真实意图,对战术意图的研究必须充分认识其具有的欺骗性和对抗性。传统意图识别方法主要依靠指挥员凭借经验作出判断,这种方式过度依赖专家经验知识。战场上目标种类和数量繁多,战场数据规模剧增,指挥员在识别意图的过程中将面临信息过载的问题。
注意力机制是认知神经学中的概念,是人脑的一种复杂认知机制[11-12]。人脑在同时接受到来自视觉、听觉等各方面的大量信息时,仍能稳定地工作,是由于注意力机制有意或无意地提取出部分有用的信息进行处理,同时过滤掉冗余信息。
工程实践中的计算资源通常是有限的,但深度学习模型需要处理大规模数据,如何合理分配有限的计算资源是一个急需解决的问题[13-15]。为此,本文借鉴人脑的聚焦式注意力机制,将其引入基于RNN的战术意图识别模型中,使网络能对输入信息进行选择,自动提取目标特征,解决信息过载的问题,提高意图识别模型的识别准确率。
在注意力机制的计算过程中,主要可分为2个步骤:一是计算注意力分布;二是根据注意力分布,计算所有输入的加权平均。
1)计算注意力分布
假设有k组输入信息X=[x1,x2,…,xk]T,其中每个xi,i∈[1,k]都是n维输入向量,表征意图识别问题中敌方目标在某一时刻的状态信息。在意图识别过程中,并不需要将所有时刻的信息全部完整地输入到神经网络中,可以从X中挑选出与意图直接相关的信息输入模型。为达到此目的,引入一个查询向量(Query Vector)表征与意图的相关,查询向量可以是动态生成的,也可以是可学习的参数。同时利用打分函数对输入信息与查询向量之间的相关性进行评估。
在给定查询向量q和输入信息X的前提下,选择第i个输入向量的概率αi计算公式如式(1)所示。
(1)
式中:z=i表示选择被选择信息的索引值,αi为注意力分布(Attention Distribution),s(xi,q)为打分函数。常用的加性模型打分函数如式(2)所示,
s(xi,q)=VTtanh(Wxi+Uq)
(2)
式中:W,U和V均为可学习参数。
计算打分函数时,加性模型需要计算双曲正切函数,运算效率较低,为此提出一种点积模型作为新的打分函数,如式(3)所示,
(3)
点积打分函数在实际计算过程中更好地利用了矩阵相乘,避免计算双曲正切函数可以减少计算资源的消耗,提升模型的收敛速度,进一步提升识别准确率。
2)计算加权平均
式(1)计算得到的αi可以简单理解为,在给定一个查询向量q时,第i个输入向量受关注的程度,接着需要依据αi对所有的输入信息进行汇总。注意力机制选择信息的本质是求所有输入信息在注意力分布上的期望,图2给出了注意力机制的示意图。
图2 注意力机制示意图
该信息汇总方式的计算公式如式(4)所示。
(4)
循环神经网络(Recurrent Neural Network, RNN)是一类具有记忆功能的神经网络,属于反馈型神经网络。与前馈型神经网络相比,RNN与生物神经网络更为相似。RNN在处理时间序列数据上更有优势,通过其独特的循环层结构,时间序列数据可以依据循环输入网络,各个时刻隐藏层的输出不仅与当前时刻的输入有关,还包含了之前所有时刻的信息。
本文在基于RNN的意图识别模型的基础上,引入注意力机制,提高意图识别模型的性能。意图识别问题本质上是一个分类问题,当RNN模型用于分类问题时,多采用N-1的拓扑结构,即输入为N个数据,输出只选择最后一步的状态。图3给出了按时间展开的N-1型循环神经网络分类模型。
图3 按时间展开的N-1型循环神经网络分类模型
在图3中,x1,x2和xt分别为各时刻的战场态势输入数据,且有xi∈R1×m,i∈{1,2,…,t},m为输入数据的维数;s1,s2和st分别是各时刻RNN隐层的输出状态,且有si∈R1×n,i∈{1,2,…,t},n为隐藏层神经元数量;ot为最后时刻RNN的输出,表征目标的战术意图,且有ot∈R1×l,l为待分类的意图类型数量。U和V分别为输入层与隐藏层之间、隐藏层与输出层之间的全连接权值矩阵,且有U∈Rm×n,V∈Rn×l;W为隐藏层与隐藏层之间的循环权值矩阵,且有W∈Rn×n。
RNN模型的前向计算过程如式(5)至式(8)所示。式(5)首先计算初始时刻的隐藏层状态输出,该状态仅与初始时刻的输入x1和权值U有关,
s1=f(x1U+b)
(5)
式中:f为非线性激活函数,本文选择LeakyReLU函数,该函数的表达式为
(6)
式中:a∈(1,+∞)。
接着是依次顺序循环计算各个时刻的隐藏层状态输出,该输出还与上一时刻的隐藏层输出有关,
si=f(xiU+si-1W+b),i∈[2,t]
(7)
最后依据最后一步隐藏层的状态向量st与全连接矩阵V可得最终输出向量,
ot=stV
(8)
结合图4说明如何将注意力机制应用到基于RNN的意图识别模型中。该改进的模型与传统的“N-1型”RNN模型的区别在于,RNN的分类输出结果不再仅依赖于最后一个时间步的输出状态,而是需要对各时间步的输出状态依据式(1)计算得到的注意力分布进行加权平均。图4给出了按时间展开的融合注意力机制的意图识别模型。
图4 融合注意力机制的意图识别模型
该意图识别模型主要包括数据输入层、状态循环计算层、注意力机制作用层、信息汇总输出层4个主要组成部分。
1)数据输入层
意图识别模型需要接收某一时间段内的数据,从而对目标意图作出判断。输入数据主要包括目标距离各重要区域的空间位置信息、速度信息、相对运动信息等多维信息。
假设有m个重要目标可能会遭受敌方攻击或侦查,敌方航空兵的基本战术编队为1.2节所提的6种。结合图5说明输入数据具体格式,其中数据的下标表示时间。
图5 输入数据格式
数据输入模型前,还需要对数据进行0-1归一化预处理,然后将某一段时间内的数据依次循环输入意图识别模型。值得注意的是,不同意图的实现,并非全部具有1.2节所提到的编队,因此,当某一特定编队缺失,则将其对应位置信息全部置0。
2)状态循环计算层
3)注意力机制作用层
4)信息汇总输出层
该结果可作为后续威胁评估、火力分配等任务的参考因素,也是战场指挥员全面掌握战场态势的有效手段之一。
本小节将对提出的融合注意力机制的意图识别方法进行仿真验证。数据来源于某战场态势仿真平台,该平台设定的空袭作战样式来源于海湾战争时期轰炸巴格达出动的“Q攻击编队”。海湾战争是冷战后有大量高科技武器投入实战的大规模武装冲突,其展现了现代高科技条件下作战的新情况和新特点。“Q攻击编队”展示了对防空导弹阵地所掩护目标的典型空袭模式,主要包含了争夺制电磁权、实施防空压制、对地攻击等一系列步骤。
表1给出某次针对地面指挥所的攻击任务的兵力构成情况。
表1 某次攻击指挥所任务典型兵力构成
1991年1月19日当天,伊拉克首都巴格达由包括SA-2、SA-6、SA-8在内的各类中近程防空导弹阵地护卫,为简化分析,假设防御方需要重点保卫的目标为3处,防空阵地若干,战场位置分布如图6所示。
图6 战场位置分布示意图
以上述战场环境为背景,战场态势仿真平台共生成1.04GB的数据,其中包括对指挥所、军用机场、某特定重要目标进行攻击或侦查以及撤退这7类意图。以9∶1的比例将数据划分为训练集和测试集,训练集包含2395400条数据,测试集包含266200条数据。
为保证深度学习模型具备良好的泛化能力,要求数据规模越大越好,但是规模大小是相对的,一般认为数据在百万条以上或者达到GB量级,就能满足要求。因此,本文的数据集规模是满足要求的。
在模型训练时设置总的迭代步数为200。图7和图8给出了引入注意力机制前后,意图识别模型在测试集上准确率和F1得分的对比,表2给出了意图识别模型训练时关于收敛性的参数,表3给出了意图识别模型各项性能指标的对比。
表2 模型训练参数对比
表3 引入注意力前后模型各类指标对比
图7 引入注意力前后模型准确率对比
图8 引入注意力前后模型F1得分对比
从图7可以看出,将注意力机制引入基于RNN的意图识别模型后,模型在测试集上的表现明显更好,不仅初始的准确率更高,而且更快达到峰值,并且最终的准确率更高。
从图8可以看出,将注意力机制引入基于RNN的意图识别模型后,模型初始的F1得分差别不大,但随着迭代步数增加,改进后的模型F1得分明显高于改进前的F1得分。
从表2可以看出,改进后的模型在单步训练耗时上更久,但收敛步数更少,收敛时间更短,收敛速度更快。这是由于在引入注意力机制的过程中,增加了诸如注意力分布、加权平均等额外计算步骤,导致改进后的模型在单步训练中需要消耗更多的计算资源,但也恰恰因为引入了这些额外计算步骤,使得模型能对目标信息进行有效选择,去除冗余信息,解决信息过载的问题,用更少的步数达到收敛,使得最终收敛时间比改进前更短,收敛速度更快。
从表3可以看出,改进后的意图识别模型各项性能指标,包括准确率、精确率、召回率和F1得分,都有不同程度的提升。
从图9可以看出,由于点积打分函数相较于加性打分函数,更好地利用矩阵相乘,避免计算双曲正切函数,减少计算资源的消耗,在实际计算中运算效率更高。在应用梯度下降法更新网络参数时,网络能以更快的收敛速度达到更高的准确率。说明点积打分函数能进一步提升注意力机制的作用效果,意图识别模型有更高的准确率。
图9 改进打分函数前后的模型准确率对比图
在防空反导作战背景下,识别敌方来袭空中目标的战术意图具有重要意义。本文首先分析了几类典型战术意图类型,然后建立了基于循环神经网络理论的意图识别模型,解决传统意图识别过程中人工提取特征、时序数据处理等难点,接着引入注意力机制对模型进行改进,提高模型的识别准确率,解决信息过载的问题,最后依据实际战例数据,通过仿真验证了融合注意力机制的意图识别模型的性能。仿真结果显示,改进后的意图识别模型在准确率、精确率、召回率和F1得分等各项性能指标上均有不同幅度的提升,且本文提出的将点积模型作为打分函数可以进一步提升注意力机制的作用效果。结果表明,本文提出的融合注意力机制的意图识别模型,能有效对敌方来袭空中目标的战术意图进行准确的识别。