基于循环神经网络的空中目标类型识别

2020-07-15 12:57:54赵佳欢杨海明邱令存

航天控制 2020年3期

赵佳欢杨海明邱令存

上海机电工程研究所，上海201109

0 引言

目标类型识别是防空作战领域的研究热点。在现代信息化战争中，识别敌方来袭目标的类型是指挥控制系统做出正确决策的重要依据，准确地识别目标类型有利于精确的威胁评估和合理的火力分配，从而提高我方防空武器系统的作战效能[1-2]。

面对高动态不确定性的战场环境，空袭目标种类和数量剧增，如何根据雷达目标序列数据准确而又快速地识别目标类型是一个急需解决的问题。传统的方法主要依据目标的高度和速度特性对目标类型进行判断[3]，文献[4-5]利用贝叶斯网络对目标类型进行识别，该方法存在的问题是对于目标高度、速度等一系列非离散的数据，需要依据经验进行离散化，该过程专家主观因素比重过大。文献[6]提出一种基于支持向量机(Support Vector Machine, SVM)的目标识别模型，该模型结构简单，在小样本训练集上表现优秀，但在面对大规模样本时将消耗大量的机器内存和运算时间，且经典SVM算法很难处理多分类问题。

不同类型的目标，其运动特性、行为特性有所不同，其差异性会体现在目标不同维度的特征中。传统方法仅仅依据目标的速度和高度特征进行目标类型的判断，但有些类型的目标运动特性起伏大，不同类型的目标之间在高度、速度特性上会有重叠，这些因素都降低了识别的准确率。除了目标速度、高度等特征以外，本文考虑引入雷达目标信噪比(Signal-Noise Ratio, SNR)特征用于目标识别，增加识别准确率。而SNR特征起伏大，规律不明显，传统目标识别方法通常不将其作为识别特征之一，而智能化模型循环神经网络(Recurrent Neural Network, RNN)能从大量的历史样本自动学习得到特征，适合处理雷达的时序数据。

RNN是一种深度学习模型，深度学习(Deep Learning, DL)通过多层网络结构和非线性激活函数的组合，将低层次特征转化为高层次特征[7]。RNN由于其特殊的循环输入结构，是众多深度学习模型中公认的最适合处理时序数据的模型，能从大量历史雷达数据中挖掘出隐藏在时间层面的目标特征，并以网络权值的形式记录下来。这种方法仅从雷达数据层面入手，不需要改良现有雷达的体制，便于实际的工程应用。

1 典型空中目标类型

现代战争空袭目标种类和数量剧增，防空反导作战面临的主要威胁可分为2大类：飞机类和导弹类。选择具有代表性的隐身飞机、常规飞机、空地导弹、巡航导弹、随队掩护电子干扰机这5类典型的空中目标作为研究对象。

隐身飞机利用各种技术手段削弱雷达反射、红外辐射信息，躲避敌方探测系统的侦测，具有极强的突防及攻击能力，是各国军事专家的研究热点[8-10]。随着美军F-35各机型陆续服役，我国周边地区国家诸如日本、澳大利亚等国家订购的F-35相继下线交付使用，隐身战机对我国安全形势造成极大威胁，反隐身需求越来越迫切。区分隐身飞机目标与常规飞机目标具有重要意义。

空地导弹是指从航空器上发射攻击地(水)面目标的导弹，与普通的航空炸弹相对，具有目标毁伤概率高、机动性强、隐蔽性好的特点。

巡航导弹是指一类以巡航状态在稠密大气层内低空飞行的导弹，美国的战斧巡航导弹在巡航飞行阶段的高度一般在50m左右，掠海飞行高度可达7～15m，能有效避开雷达搜索，躲避拦截。

电子对抗是作战双方利用电子设备在电磁维度进行的斗争，为了削弱甚至破坏对手电子设备的作战效能，保护己方作战单位。电子对抗是现代战争中一种重要的作战手段[11-12]，本文以典型的随队掩护电子干扰机作为一类研究目标。随队掩护干扰是指电子干扰机在指定空域内跟随攻击编队战机飞行，释放干扰，掩护攻击编队。

2 基于循环神经网络的目标识别

2.1 循环神经网络结构及原理

RNN是一种以序列数据为输入，且所有循环节点按链式连接的神经网络。最早由Jordan和Elman分别于1986年和1990年提出，目前RNN在语音识别、机器翻译等领域有广泛的应用，但在目标识别领域的研究较少。RNN具有记忆性、参数共享并且图灵完备，在学习时间序列非线性特征时具有独特的优势，而雷达目标数据都是大量的时序数据，因此应用RNN对目标进行识别具有很大的可行性。

图1是单向循环神经网络及其结构展开图。

图1 RNN结构图

图1中x是多维时间序列数据，依次循环输入RNN，s为隐藏层输出，o为输出层输出，U是输入层与隐层全连接权值矩阵，V是隐层与输出层全连接权值矩阵，W是隐层与隐层之间的循环权值矩阵。

RNN最大的特点在于引入了隐层自身之间的循环结构，从其展开图中可以得到，t时刻隐藏层的输出st不再仅依赖于U和xt，还依赖于新的权值矩阵W以及上一时刻隐藏层的输出st-1，正是因为这种特殊的结构，RNN才能有效地处理时间序列数据。

随时间反向传播(Back Propagation Through Time, BPTT)算法是RNN模型最经典的优化算法，与传统的BP算法不同，BPTT算法中计算误差不仅在空间上传播，还会在时间尺度上传播。

BPTT算法主要有以下3个步骤：1)根据当前时刻的输入和上一时刻隐层的输出，计算当前时刻各神经元的输出；2)从最后一个神经元开始，在时间尺度和空间结构上分别反向计算各个神经元的误差项；3)计算各个权值的梯度，采用梯度下降法进行权值的更新。

2.2 目标识别算法

基于RNN的目标识别算法如图2所示。

该算法主要有3大步骤，首先是利用训练集数据对目标识别循环神经网络进行训练，在训练次数达限后，转入网络的测试阶段，若准确率达标，则进入网络实时分类识别阶段，否则需要重新设置超参数，再次进行训练。

其中主要包含了5个核心内容：数据预处理、网络结构确定、损失函数确定、网络测试评估、实时分类识别。

图2 RNN目标识别算法

2.2.1 数据预处理

首先需要分析样本数据结构，将数据集以8∶2的比例划分为训练集和测试集，训练集数据用于优化循环神经网络的权值，测试集用于测试训练完成的模型的识别性能并调整合适的超参数。

本文所用的数据集中目标特征包含了相对距离R、方位角A、俯仰角E、速度的三轴分量、径向速度V、高度H以及信噪比。为了消除不同特征属性之间数量级差异较大造成的不良影响，提高RNN的收敛速度，增加模型识别的准确率，需要对雷达数据进行归一化处理。本文采用常用的min-max归一化。min-max归一化方法对原始数据做简单的线性变换，使得结果映射到[0,1]区间上，对于某一维数据中的任意x，归一化公式为

(1)

xmin表示该数据集里的最小值，xmax表示该数据集里的最大值。

最后需要对样本标签转换为独热(One-Hot)编码形式。独热编码能很好地处理离散型属性的编码问题，并在一定程度上起到扩充特征的作用，具体编码如表1所示。

表1 One-Hot编码形式

2.2.2 网络结构确定

接着需要确定网络结构，设置合适的超参数，比如学习率η、网络层数、各层神经元数量、循环次数、激活函数、批处理容量等。超参数是指在网络学习过程中不发生变化，需要事先依据经验进行设置，并在后续仿真中具体确定的参数类型。

学习率η用于控制每次更新时网络权值调整的大小，与网络收敛速度和识别准确率息息相关。如果学习率设置过小，虽然最终能达到较高的识别准确率，但是模型收敛速度慢；如果设置太大，模型的识别准确率波动较大，且不一定能收敛。因此需要确定合适的学习率η，同时保证网络的收敛速度和识别准确率。据经验，学习率的典型值在0.001到0.1之间。

网络层数和各层神经元数量直接确定了RNN模型的结构。一般而言，网络层数越多，神经元数量越多，模型的准确率也会越高，但受限于计算机存储空间和计算量的限制，往往需要在满足准确率要求的情况下，确定最简单的网络结构，从而减小存储空间和计算量的消耗。

循环次数是指RNN循环输入的次数，一般循环次数越多，识别准确率越高，但是实时性会受到影响。

激活函数一般选择非线性函数，可以使神经网络具有表征复杂非线性映射关系的能力。

批处理容量是在网络权值优化过程中，每次迭代训练所使用样本数据的数量。一般来说，在合理范围内，越大的批处理容量使梯度下降方向更准确，振荡越小。若设置过大，可能会陷入局部最优；若设置过小，引入的随机性更大，难以收敛。

2.2.3 损失函数确定

损失函数又称为代价函数，通过计算当前分类结果与期望结果之间的差异，进一步计算出每个神经元的误差，最后根据BPTT算法优化网络权值。BPTT算法的核心思想是根据误差关于网络权值U,V和W的梯度，用梯度下降法更新U，V和W的值。

这里选择交叉熵损失函数，公式为

(2)

其次需要确定训练过程中给网络喂数据的方式，本文选择小批量梯度下降法(Mini-Batch Gradient Descent, MBGD)，既可以克服经典的梯度下降法需要计算全体样本损失值导致的计算复杂度高的问题，也可以解决随机梯度下降法(Stochastic Gradient Descent, SGD)学习过程噪声多，并不是每一步都向最优化进行的问题。

2.2.4 网络测试评估

在测试数据集上对网络性能进行测试，涉及到的主要评估指标有准确率(Accuracy)、精确率(Precision)、召回率(Recall)及F1得分。下面给出这些指标的具体定义。

准确率：所有被正确识别的样本数量占全体样本的比例。

精确率：每一类都有各自的精确率，即所有识别为X类的样本中真正属于X类的比例。

召回率：每一类都有各自的召回率，即所有实际为X类的样本中被正确识别的比例。

F1得分：每一类的F1得分为该类的精确率和召回率的调和平均数，公式为

(3)

其中，PX为X类的精确率，RX为X类的召回率。对于分类模型总的F1得分为各类的F1得分的算数平均值。

2.2.5 实时分类识别

当战场传感器的实时数据经过预处理之后，直接输入训练完成的RNN网络进行实时的目标识别，识别过程如图3所示。

图3 基于RNN的目标识别模型

当雷达探测到来袭目标，对目标数据进行预处理，得到9维的目标特征向量，包括了目标的相对距离R、方位角A、俯仰角E、xyz三轴上的速度分量、径向速度V、高度H和信噪比，然后将每一拍的目标特征向量依次循环输入到RNN网络中，最终网络输出目标类型结果，完成实时目标识别。这里输入的拍数需要视具体情况由雷达频次和识别实时性共同确定，由公式n=f×t计算得到，n为拍数，f为雷达频次，t为人为设定预期需要在发现目标后多久时间内给出识别结果。

3 仿真分析

仿真校验使用的数据集来源于某型号真实检飞数据，数据规模为21276，每条数据都包含了40拍的目标状态，即RNN模型的循环次数为40次，其中各目标种类占比为常规飞机31.2%、隐身飞机20.9%、空地导弹13.3%、电子干扰机18.2%和巡航导弹16.4%，雷达数据包含了目标相对距离、方位角、俯仰角、速度、信噪比等状态。

仿真实验平台硬件设备：处理器Intel(R) Core(TM) i5-6500 CPU@3.20GHz，内存8GB,集成开发环境为Spyder3.2.8，编程语言为Python3.6，深度学习框架为Tensorflow1.9.0。

仿真参数设置如下：RNN循环次数40，激活函数为双曲正切tanh函数，批处理容量为128。

3.1 网络结构确定

本小节通过仿真实验确定最优的网络结构，包括网络的层数和各层神经元的数量。图4是不同网络结构下测试集的识别准确率对比。

图4 不同网络结构下模型识别准确率对比

可以看出，单隐层结构下，一定范围内增加神经元数量能显著提高模型识别准确率，当数量增加到一定程度，比如从32个增加到64个，识别准确率上升不明显，但计算量大幅上升；双隐层结构下，虽然用16～16的结构就能达到单隐层结构32个神经元的准确率，但是双隐层结构相对复杂，需要的计算量大。综合考虑准确率与计算量，这里选择单隐层32个神经元的网络结构。

3.2 学习率确定

本小节通过仿真确定最优的学习率，图5给出了不同的学习率对于模型收敛速度的影响。

图5 不同学习率模型识别准确率对比

当学习率为0.1时，准确率能很快到达峰值，但准确率仅有0.45，且波动幅度大；当学习率为0.0001，模型在迭代200步后才接近收敛，收敛速度慢，最终准确率为0.85；当学习率为0.01或0.001时，收敛速度快，最终准确率为0.95。

为保证模型收敛的快速性及较高的准确率，本文将学习率设置为0.001。

3.3 目标识别模型性能分析

3.3.1 信噪比的影响

图6给出了3类不同目标的信噪比特征对比图。

图6 不同目标SNR对比

从图6可以看出，隐身飞机的SNR特征相对于常规飞机起伏较小，数值也较低，而空地导弹的SNR特征虽然也有起伏，但是从直观上看程度比隐身飞机大，比常规飞机小，在数值上也小于常规飞机。可见不同类型目标的SNR特征有一定的区别，可以将其作为目标识别的特征之一，RNN模型能从大量数据中学习得到隐藏在SNR中的特征。下面将研究引入SNR特征对识别模型识别准确率的影响。

首先仅依据目标的相对距离、方位角、俯仰角、高度、速度特征属性对目标类型进行识别，并给出模型在测试集上的准确率、F1得分等各项指标。然后研究了雷达目标SNR特征的引入对于目标识别模型性能的影响。表2中①代表引入SNR特征前的模型各项指标，②代表引入SNR特征后识别模型的各项指标。

表2 信噪比对识别准确率的影响

准确率与F1得分是衡量分类模型性能优劣的重要指标，可以看到，当目标识别模型的输入未包含SNR这一特征时，识别准确率为89.9%，F1得分为0.760；当加入SNR这一特征时，识别准确率为95.3%，提高了5.4%，F1得分为0.822，提高了0.062。

从多角度看待问题，能对问题有更全面的认知。根据表2可得结论，结合雷达目标SNR特征，可以有效提高目标识别的准确率，证明空中目标识别过程中，目标相关特征属性越多，越可能提高识别模型的准确率，为后续雷达其他相关信号能用于目标识别提供了支撑。

3.3.2 RNN与其他方法的对比

本小节将基于RNN的目标识别模型与其他传统目标识别方式进行对比。

贝叶斯网络是一种概率图模型，可以解决目标识别过程中不定性和不完整性的问题；SVM是机器学习中最经典的分类算法之一。

表3给出了3种模型的识别准确率。

表3 不同目标识别方法准确率

可以看出，RNN模型的识别准确率最高，SVM次之，贝叶斯网络的准确率最低。构建贝叶斯网络时有分布独立的假设前提，但在实际目标各属性之间基本不可能完全独立，并且构建网络时极其依赖专家经验知识，导致识别准确率较低。经典SVM算法是针对二分类问题提出的，对于多分类问题，有其一定的局限性。而RNN模型在选择了适当的超参数后，能自动学习得到目标类型特征，并以网络权值的形式记录下来，结果表明该模型能达到95%的识别准确率。

4 结语

传统目标识别方法使用的目标特征单一，往往仅凭目标速度、高度做出判断，但不同类型目标的速度、高度特性上会有一定重叠，导致传统目标识别方法准确率低。本文利用智能化算法将雷达目标SNR特征融入到目标识别方法中，构建了基于RNN的目标类型识别模型，扩展了使用的目标特征属性维度，提高了识别准确率。最后应用某型号真实检飞数据，检验该方法的有效性，并与朴素贝叶斯网络模型和SVM模型进行了对比。仿真结果显示朴素贝叶斯网络模型的识别准确率为63.0%，SVM模型的识别准确率为80.8%，而RNN模型的识别准确率达到了95.3%，且引入雷达信噪比特征能提高识别准确率。结果表现，RNN智能化模型能有效地将SNR特征融入到目标识别过程中，并能得到较高的识别准确率。