基于LSTM与1DCNN的导弹轨迹预测方法

2023-02-01 03:05宋波涛许广亮

系统工程与电子技术 2023年2期

宋波涛, 许广亮

(1. 西北工业大学无人系统技术研究院,陕西西安 710072;2. 上海机电工程研究所,上海 201108;3. 北京机电工程研究所,北京 100074)

0 引言

弹道导弹是现代战争中极具威力的进攻性作战工具,尽可能快速地探测并发现目标导弹,并且准确地预测其飞行弹道,对目标导弹的拦截具有重要意义。

导弹轨迹预测的方法目前可以分为两种,一种是传统的基于滤波的方法。原始的滤波方法[1-3]只能获得位置及速度估计信息,在实际中已很难使用。后来学者们对其进行改进,使用位置、速度、加速度作为状态变量,将加速度的变化视为一个惯性环节的模型,然后通过扩展卡尔曼滤波(extended Kalman filter,EKF)算法得到较为精确的状态信息,但是此种方法需要知道目标飞行器的相关参数,从而获得目标未来加速度的变化趋势,而实际中这些参数难以获得,从而造成预测误差很大的情况。针对上述问题,文献[4]使用介于常速度和常加速度模型之间的Singer模型来表征目标气动力加速度的变化,提出了一种自适应卡尔曼滤波,但是由于目标的机动形式多样,很难用固定的跟踪模型对其进行描述,从而导致状态模型总是存在静态误差。此外,还有诸多文献使用多模型滤波方法[5-6]、无迹卡尔曼滤波方法[7-8]和考虑模型摄动的卡尔曼滤波方法[9-10]等滤波方法对目标状态进行估计,但是对目标加速度的变化不敏感,因而预测效果不佳。文献[11]对稀疏数据情况下小椭圆轨道目标的再入机动飞行弹道进行预测,但预测误差较大。文献[12]研究了雷达群目标跟踪条件下的弹道预报方法,此方法只有在群目标间不能发生机动运动时才能取得较好的预测效果。

另一种是基于深度学习的方法。近年来随着计算机技术的飞速发展,人工智能技术也进步迅速,其中以神经网络为代表。很多学者尝试使用深层次的神经网络对弹道导弹等大机动飞行目标的轨迹进行预测,预测方案多为使用特殊网络对目标的历史轨迹进行学习,对运动模式进行推断,从而预测未来的轨迹。

文献[13]通过在反向传播(back propagation, BP)神经网络和遗传算法的基础上进行改进,提出一种使用神经网络来预测大机动飞行器的飞行轨迹的方法。文献[14]使用K-means聚类算法,将目标群航迹数据自适应聚类,之后利用BP神经网络对目标的航迹进行学习,从而预测目标轨迹,上述两种方法在短时间内都可以取得较高的预测精度。但由于BP神经网络自身的局限性,当预测时长增加时,预测误差会急剧增大。文献[15]基于广义回归神经网络(generalized regression neural network,GRNN),设计了一种滑窗式滚动预测算法。GRNN是径向基(radial basis function, RBF)神经网络的一种改进,RBF神经网络具有良好的拟合能力,理论上可以逼近任意的连续非线性函数。该算法是一种新的目标轨迹的预测思路,但对大机动弹道的预测效果甚微。文献[16]使用基于Elman神经网络对战斗机的空战轨迹进行预测,Elman神经网络与RBF和BP等前馈型神经网络不同之处在于其在结构上除了输入层、隐含层和输出层外,还具有一个承接层,用于构成局部反馈,因而更加适合处理时序数据,但是此方法也存在无法长时间预测的问题。

本文结合深度学习中的长短期记忆(long short-term memory, LSTM)网络与一维卷积神经网络(1-dimensional convolutional neural network, 1DCNN)对弹道导弹的轨迹预测问题进行研究,建立了适用于轨迹研究的三自由度质点动力学和运动学方程,然后通过改变升阻比的方式得到不同再入方式下的目标轨迹,调整初始参数,构建目标轨迹数据库。之后,基于LSTM网络与1DCNN设计了一种目标弹道分类器对目标进行分类。最后,基于1DCNN设计神经网络,对目标轨迹进行预测。由于基于深度学习的目标轨迹预测在使用时不需要对目标进行建模,克服了传统算法由于未知目标气动参数而难以对加速度变化进行预测的缺陷。同时,在实际中可根据真实的弹道数据进行模型的训练并不断对数据库进行更新,此方法具有更强的适应性。

1 目标数学模型及轨迹数据库建立

基于深度学习的目标轨迹预测方法是建立在对目标轨迹大量的观测数据的基础之上的,因此必须建立一个目标的轨迹数据库。将目标导弹视为质点,忽略地球自转以及哥氏力、离心力的影响,可以建立适用于轨迹设计的三自由度方程[17]:

(1)

导弹的再入类型主要取决于升阻比,由其气动外形决定,升阻比的大小影响着弹道导弹的轨迹跟踪能力、横向机动能力以及航程能力。弹道导弹常用的再入方式有弹道式再入、半弹道式(弹道-升力式)再入以及升力式(滑翔式)再入。不同再入方式下导弹的飞行轨迹不同。为设计的方便,仿真时,直接给定升阻比,得到不同再入类型下的目标轨迹,然后通过调整再入高度、再入速度、航迹角等初始参数就可以得到每种再入类型下的多条轨迹。下面给出再入速度为1 300 m/s,为简化问题,不考虑目标的侧向机动,假定目标在铅垂平面中运动,即将航迹角设置为0°,同时将坐标投影到地面坐标系中,再入高度在80～90 km的3种轨迹如图1所示。

在实际中容易测得的物理量有目标的位置信息与速度信息,因此选择将各条轨迹的射程、高度及速度数据保存形成轨迹数据库。

图1 3种再入类型目标轨迹Fig.1 Three types of reentry target trajectories

2 LSTM-1DCNN轨迹预测方法

2.1 LSTM网络

循环神经网路(recurrent neural network, RNN)是一种专门处理时序数据的网络[18-20]。RNN和其他网络最大的不同就在于RNN具有记忆功能,RNN的神经网络单元不仅仅与输入和输出存在联系,其与自身也存在一个回路,其基本结构如图2所示。由图2可见,RNN中上一个时刻的网络状态信息将会作用于下一个时刻的网络状态,因此RNN可以将序列中不同时刻关联起来。但是标准RNN在处理长时间序列时由于计算量的爆炸式增长,会出现梯度消失与梯度爆炸的现象而难以使用。因此,RNN的改进网络LSTM网络[21-23]被提出。

图2 RNN结构图Fig.2 RNN structure diagram

与RNN相比,LSTM网络增加了一路输入输出(单元状态)及3个门控单元,分别是输入门、遗忘门和输出门,其网络单元结构如图3所示。图中Ct-1表示上一时刻的单元状态,ht-1为上一单元的输出,xt是当前时刻的输入,Ct与ht表示当前时刻的单元状态与输出。

图3 LSTM网络单元Fig.3 LSTM network unit

在LSTM网络中,首先决定上一时刻状态的保留情况,这一功能由遗忘门完成,计算公式为

Ft=σ(Wf·[ht-1,xt]+bf)

(2)

式中:σ(·)表示Sigmoid激活函数;Wf表示遗忘门的权重;bf表示遗忘门的偏置。遗忘门通过Sigmoid函数将输入与上一时刻的状态映射为0～1之间的值来决定上一时刻状态的保留情况,1表示完全保留,0表示舍弃。

(3)

式中:Wc与bc分别表示构造候选向量时的权重与偏置。然后通过sigmoid函数选择其遗忘的比例

it=σ(Wi·[ht-1,xt]+bi)

(4)

式中:Wi与bi分别表示输入门的权重与偏置。

最后,由输出门需要决定输出值：

(5)

Ot=σ(Wo[ht-1,xt]+bo)

(6)

ht=Ot·tanh (Ct)

(7)

式中:Ct为当前时刻的单元状态；Wo,bo分别表示输出门权值与偏置,当前时刻的输出ht为当前状态Ct经过tanh后与Sigmoid层的输出Ot相乘后的结果。

通过上述的3个门控单元以及单元状态的传递,LSTM可以处理长时间序列。

2.2 1DCNN

卷积神经网络(convolutional neural network,CNN)可以将简单的数据特征通过卷积与池化映射到复杂的高维空间,不同维度的CNN的区别在于输入数据的维度及卷积核的滑动方式不同[24-26]。1DCNN是CNN的一种,是除RNN外另一种常用的处理序列数据的神经网络[27-29]。当时序数据的数据量较小时,小型的1DCNN可以替代RNN,而且速度更快,计算代价通常更小。1DCNN的工作原理如图4所示。其中卷积核的维度为5×1,移动步长为1,只沿着时间序列增加的方向移动。通过使用卷积核在序列数据上滑动网络便能提取到序列特征。

图4 1DCNN工作原理Fig.4 Working principle of 1DCNN

2.3 轨迹预测方法

不同再入类型的目标导弹其轨迹形状不同,如果使用统一的模型对目标的轨迹进行预测，则对网络的复杂程度要求很高且很难取得良好的预测效果。本文首先采用基于深度学习的方法，依据再入类型对目标进行初步分类,然后根据不同的目标类型对其分别进行预测。轨迹预测总体流程如图5所示。在实际使用时,首先由雷达对目标进行跟踪,获得目标的轨迹信息,然后将当前测得的部分轨迹数据在已经训练好的轨迹分类器中进行分类,得到目标所属的类别,然后选择当前类别下已训练好的轨迹预测网络,基于当前测得的目标轨迹数据对未来的轨迹进行预测,最后对目标进行拦截。

图5 轨迹预测整体流程图Fig.5 Overall flow chart of trajectory prediction

2.4 数据及划分

为充分使用轨迹数据库中的数据,挖掘特征,使用重复分割与滑动窗口处理的方法对样本数据进行处理。首先使用某一确定时间长度的窗口对数据进行切分,然后以一定的步长移动窗口,直到遍历整条轨迹,最后对所有的轨迹段添加类别标签,对其他轨迹也做相同的处理,分段数据的生成方式如图6所示。对于轨迹分类时用到的数据需对射程、高度、速度3个维度的数据进行处理,并将得到的数据段进行保存。

图6 轨迹分类样本生成示意图Fig.6 Schematic diagram of trajectory classification sample generation

对于轨迹预测数据,网络的训练样本及标签均是轨迹数据,数据的生成方式如图7所示。首先仍是要确定一个时间长度的轨迹段作为训练输入,然后将其后需要预测的时间长度的数据作为输出,即对应的标签,最后训练样本与标签都以相同的确定长度的步幅滑动,直到轨迹的末尾,对其他轨迹也做相同的操作,并对训练样本与标签进行保存。在进行轨迹预测时需要对射程、高度两组数据进行处理。

图7 轨迹预测样本生成示意图Fig.7 Schematic diagram of trajectory prediction sample generation

2.5 网络结构选择

对于目标分类网络,结合LSTM网络与1DCNN设计了一种LSTM-1DCNN目标分类网络,首先由LSTM层提取目标的时序特征,再由1DCNN层寻找局部特征,由此完成目标的分类。而对于目标预测网络,由于1DCNN层具有计算速度快实时性好的优点,而LSTM网络的运算速度较慢,因此预测网络单独使用1DCNN层进行设计。对于LSTM层来说,网络结构的选择就是选择每层存储单元的个数。对1DCNN层则需要对每层使用的卷积核的个数、卷积核的长度以及移动步幅进行设置。此外还需要对各网络层的层数进行合理的选择。

3 仿真结果

3.1 轨迹分类

目标导弹的轨迹数据在输入之前要首先进行标准化处理,具体公式为

(8)

式中:xi表示输入x的第i维;μi,δi为训练集预估的第i维的均值和标准方差;xistd是标准化后的结果。标准化后的数据是均值为0,标准方差为1的样本，从而允许在网络训练过程中更容易找到对类别影响大的特征。导弹的轨迹数据库中的数据有3个维度,即射程、高度及速度,都需要进行标准化处理。

轨迹分类时从轨迹数据库中任选由第2.4节中所产生的轨迹数据段3 000段,每种再入类型各1 000段,窗口长度选择为30 s,即通过30 s的观测数据对目标进行分类。3 000条样本数据中使用80%做训练样本,20%做测试样本。同时从训练样本中取20%作为验证集以实时观测模型的性能。

本文结合LSTM网络与1DCNN设计了一种LSTM-1DCNN目标分类网络,其参数设置如表1所示。

表1 LSTM-1DCNN模型参数

在训练时使用adam算法进行梯度下降,使用交叉熵损失函数,初始学习率设置为0.001,训练500个周期(epo-ch)。为对比模型性能,同时设置只使用LSTM层与1DCNN层的网络进行对比。3种网络训练过程中精度的变化如图8所示。同时将分类精度统计于表2中。

图8 训练精度变化曲线图Fig.8 Training accuracy change curve

表2 分类精度统计

由实验结果可见,随着训练次数的增加,3种分类网路的分类精度均趋于稳定,其中1DCNN的分类效果最差,最终训练集精度为72.4%,测试集精度只有71.8%;LSTM分类效果优于1DCNN,训练集精度为77.7%,测试集分类精度为76.4%,较1DCNN提高约5%,说明LSTM网络更加适用于轨迹数据。本文所设计的LSTM-1DCNN网络的轨迹分类精度最高,训练集分类精度达到86.0%,测试集分类精度达到84.8%,整体分类精度较LSTM网络提高约8%,明显优于前两种网络。

3.2 轨迹预测

轨迹预测中使用的数据为目标导弹的射程与高度。文献[30]表明对射程与高度两个维度的数据分开预测可以取得更好的预测效果,因此对轨迹数据的射程与高度分别进行预测。对射程与高度数据先进行标准化处理,方法同第3.1节。由于在实际中无法得到未来数据(即输出数据)的均值与标准方差,因此使用输入数据的均值与方差对输出进行标准化。与分类不同的是,轨迹预测时神经网络的输出数据是标准化后的轨迹数据,因此为得到预测轨迹的真值还需要对预测结果进行反标准化处理,反标准化公式为

x=xstdδ+μ

(9)

式中:xstd表示神经网络的输出值(射程或高度);μ,δ为测试集输入数据的均值和标准方差;x是反标准化后的结果。

轨迹预测是在对目标进行分类后进行的,在本文中分别使用3种目标轨迹对网路进行训练并对训练好的网络进行保存，形成3个目标预测网络,将实际观测值作为网络的输入即可得到预测值。

本文设计了一种基于1DCNN的轨迹预测网络,参数设置如表3所示。

表3 1DCNN模型参数

在训练时使用adam算法进行梯度下降,损失函数使用均方差,初始学习率设置为0.001,训练300个周期。

在轨迹预测中,做3组对比实验,分别使用30 s的轨迹预测60 s、90 s、120 s,轨迹预测误差为对测试集中所有轨迹段进行预测后得到的射程平均误差与高度平均误差的平方根,预测误差如表4所示。

表4 不同预测时长下3种目标轨迹预测误差

由表4可见,无论哪种目标,增加预测时长后轨迹预测误差都会增大,其中半弹道式轨迹的预测误差最大,在预测120 s时最大的预测误差为3 153.1 m,造成其误差较大的主要原因是半弹道式再入目标在落地之前有一个较小幅度的拉起,这段轨迹较难预测。相同预测时长下升力式轨迹的预测误差最小,主要原因是在训练时各类目标都使用了400条轨迹数据,由于升力式再入的目标轨迹飞行时间最长,因此训练的样本数据较多,神经网络更加容易学习到样本的变化趋势。

图9是升力式再入目标预测120 s时网络的训练过程中训练集与测试集损失的变化情况。可见随着训练次数的增加,训练集与测试集的误差逐渐减小并趋于稳定。

图9 训练损失Fig.9 Training loss

从测试集中每种目标各取一条轨迹使用预测网络预测其未来120 s的轨迹,3种目标轨迹的实际值与预测值如图10所示,图11为预测轨迹与实际轨迹之间的绝对误差曲线。从仿真结果可以看出,对于弹道式、半弹道式及升力式再入目标的轨迹,在预测初始时期精度非常高,误差在500 m以下,随着预测时间的增加,预测误差有逐渐增大的趋势,尤其是在80 s以后预测误差增大的速度很快。在120 s内,弹道式、半弹道式及升力式再入目标的绝对误差最大分别达到4 500 m、7 000 m和4 300 m左右。同时对其他轨迹段进行测试,120 s内弹道式与升力式再入目标的最大预测误差在5 000 m以内,半弹道式再入目标的最大预测误差在7 300 m以内。

图10 3种目标预测轨迹与真实轨迹Fig.10 Three types of target predicted trajectories and true trajectories

图11 预测结果绝对误差Fig.11 Absolute error of prediction results

3.3 不分类直接预测实验

在不对3种类型的目标进行分类的情况下直接使用3种目标轨迹进行预测网络的训练,然后对测试集中的轨迹进行预测。使用30 s的训练输入预测120 s,统计测试集中3种目标轨迹在该预测网络下的平均绝对误差如表5所示。

表5 不分类时3种目标轨迹预测误差

对比表4与表5可见,先对目标进行分类可以减小预测误差,120 s内的弹道式、半弹道式、升力式的平均预测误差分别减小了619.2 m、707.0 m与503.1 m。

3.4 与其他网络对比实验

以升力式再入目标为例，与BP神经网络、RNN、LSTM网络及分类使用的LSTM-1DCNN进行预测精度对比,训练输入时长为30 s,预测时长为120 s,训练300个周期。预测绝对误差统计及训练用时如表6所示。

表6 不同网络预测误差及训练用时对比

由表6可见,在当前数据集下BP神经网络的平均预测误差达9 005.6 m,标准RNN的误差为4 236.1 m,两种网络的预测误差较大;虽然LSTM网络的误差较小,但是训练时长显著增加,不利于网络的更新;LSTM-1DCNN预测误差最小,但训练时间仍较长。综合考虑训练时间与预测精度两方面因素,1DCNN是轨迹预测的最优选择。

4 结论

本文针对弹道导弹的轨迹预测问题,提出了一种基于LSTM与1DCNN的目标轨迹分类网络对目标进行初步分类,同时使用1DCNN设计轨迹预测网络,分别对3种目标进行预测,得到以下结论:

(1) 使用LSTM-1DCNN可以有效对目标进行分类,分类精度高于LSTM网络与1DCNN,分类精度达到84.8%,满足分类的任务需求。

(2) 在利用1DCNN对目标轨迹进行预测时,虽然随着预测时长的增加,轨迹预测误差有逐渐增加的趋势,但是仍在合理范围内,说明网络结构选取合理。

(3) 对比仿真结果表明,先对目标进行分类再对目标轨迹进行预测可以有效提高轨迹预测精度。同时在与其他网络对比中,综合考虑训练时间及预测精度,1DCNN具有最大的优势。