基于长短期记忆神经网络的航迹预测研究

2022-07-25 09:42唐一鸣

现代计算机 2022年9期

唐一鸣

（中国民用航空飞行学院空中交通管理学院，广汉 618300）

0 引言

随着民航业的发展，越来越多的人选择乘坐飞机作为自己的出行方式，有限的空域资源和日渐增加的航班量需求的冲突日益增加，空域资源不足和空中交通拥挤的现象日渐严重，以飞行计划和雷达监视目标管理为基础，基于扇区运行的空中交通管理体系逐渐难以满足未来的航班量增长。对此，美国发布了NextGen计划，欧洲提出来SESAR 计划，国际民航组织（ICAO）提出了ASBU 计划，基于航迹运行（Trajectory-based operation，TBO）的理念随之被提出，为实现TBO，四维航迹被作为重点研究对象。

自航迹运行模式被提出后，国内外开始对四维航迹预测开展了研究。国际方面，1986年，Erzberger 率先在民用航空领域提出了航迹预测技术。依托此航迹预测技术，美国宇航局（NASA）设计了一系列终端区空域进场管理工具（CTAS）。随后NASA 在丹佛机场利用波音737机型将实际飞行轨迹与预测轨迹进行了对比研究。

1996年，欧洲航行安全局（Eurocontrol）将航迹预测作为空中交通管理研究协调计划（PHARE）的主要项目进行设计与测试。随后Eurocontrol 在“欧洲空中交通管制协调实施计划”（EATCHP）中从定义、数据以及性能角度分析了航机预测的需求。

1998 年，Tomlin 等基于多目标混合系统对航空器的冲突解脱问题展开研究，使用混合控制系统算出每架航空器最大的安全初始条件，可以保证在突发因素的干扰下仍然能够安全运行，最终通过调整速度和航向实现冲突解脱。

Matsuno 等针对解决四维航迹预测不确定性因素问题，研究了一种基于广义多项式的伪谱法解决方法，但文中涉及到的因素不够全面，仅考虑了与时间相关因素的影响，未考虑到不随时间变化因素的影响。

国内方面，陆志伟等在极大代数的基础上实现了多航空器无冲突4D 航迹生成，基于航路模型的同时，基于极大代数设计出了一套终端区航迹交叉汇聚模型，从而有效规避终端区航空器在相同高度的航路交叉点的潜在飞行冲突。杜文彬等基于航空器动力学模型，根据飞行各个阶段的动力学特点，建立了基本飞行模型的飞行剖面。

汤新民等通过运用混杂系统理论分析了航空器飞行阶段，对飞行阶段进行划分，以及指定航空器的运行剖面参数，通过分析飞行过程中不同飞行阶段的动力学模型，计算出某一时刻距某一点的距离和高度，进而实现四维航迹的预测。但其划分航段的过程太过理想化，航空器在实际飞行过程中的诸多动力学参数难以获取，理想的阶段划分与实际航段不一定相符，实际飞行过程中应当同时考虑管制意图对实际飞行的约束，管制意图和驾驶员意图在模型中没有得到相应的体现。

综上所述，整个飞行过程中的影响因素较多，难以在建模阶段考虑全面。随着神经网络的发展，对于航迹预测的方式不再局限于智能优化算法和运动学建模上，数据挖掘类方法对历史航迹信息能够更充分地挖掘利用，一条航迹本质上是一组时间序列，航迹数据具有累计影响的特点，航迹之间具备很强的时间关联性。传统的BP 神经网络无法对时间关联性强的问题进行有效准确的解决，但随着神经网络的发展，一种擅长处理时间序列问题的长短期记忆（Long Short-Term Memory，LSTM）神经网络被提出，结合ADS-B数据，LSTM神经网络能很好地对航迹进行较为精准的预测。

1 神经网络模型介绍

自深度学习被提出以来，越来越多的经典模型被设计出来，其中循环神经网络（Recurrent Neural Network，RNN）是1990 年开发出来的经典模型。RNN 模型在全连接神经网络的基础上增加了前后时序上的关系，从而能较好地处理时间序列，但对于长序列数据仍然无法较好地处理，其对信息的记忆时间跨度十分有限，存在着明显的“长期依赖”缺陷。针对RNN 模型的弊端，本文将采用LSTM 模型来弥补这一缺陷。

1.1 RNN模型

RNN 是指一种随着时间推移，重复发生的结构。在自然语言处理（NLP），语言图像等多个领域有非常广泛的应用，其最大特点就是能实现某种“记忆功能”。RNN 的基本结构如图1所示。

图1 RNN神经网络基本结构模型

其中，表示输入数据，表示神经网络单元上一时刻输出的、作为当前时刻的权重矩阵，表示输出数据，与其他神经网络不同，RNN 神经网络的神经网络单元不仅仅是输出，和输出存在关联，其自身也存在一个回路。

若将循环去掉，RNN 模型就是传统的神经网络。为了更好地了解RNN 模型，需要将RNN的隐藏层拆开来看，如图2所示。

图2 RNN模型隐藏层的展开示意图

其中，表示输入层到隐藏层的权重矩阵，表示隐藏层到输出层的权重矩阵，表示隐藏层的值，- 1、、+1 表示时刻，s表示在时刻的样本的记忆。可以看出，s受到s和X的影响。

其中，表示隐藏层的激活函数。

RNN的输出层公式如下：

其中，表示输出层的激活函数。

RNN 模型虽然能处理时间序列问题，但无法对长期记忆进行精准处理，随着航迹时间序列的增长，RNN 将无法对信息保持持续性记忆、无法充分挖掘时间跨度较大的信息，所以RNN模型在处理时间跨度较大的问题时并不完全适用。航迹数据是一组较为连贯的数据，未来时刻的航迹数据受前一历史时刻的航迹数据影响较大，所以需要使用能克服这一缺点的模型来对航迹进行预测研究。

1.2 LSTM模型介绍

长短期记忆（Long Short-Term Memory，LSTM）神经网络是特殊的RNN 循环神经网络，尤其适合顺序序列处理，其内部由遗忘门、输入门和输出门组成了门控机制，用来对神经网络中的信息进行传输控制。LSTM 的关建属性为细胞状态以及“门”结构。细胞状态相当于信息向下一循环传输的路径，可以将其看作网络的“记忆”。遗忘门决定要将什么样的信息内容从细胞状态中舍去，输入门决定将什么样的信息在细胞状态内存储，最终再由输出门决定将什么样的信息进行输出。

如图3 所示，LSTM 包含短期记忆单元h和长期记忆单元C，在短期记忆单元h的基础上新增单元C来保持长期记忆，即细胞状态。x表示在t 时刻输入，C表示上一时刻的状态值，h表示上一时刻的隐藏层的值。x和h经过遗忘门时，经过计算得出需舍弃的信息。计算得出输出到细胞状态的值在0 和1 之间。0表示全部舍去，1 表示全部保留。三个门结构、更新后的细胞状态和隐藏层的值计算如下：

图3 LSTM神经网络结构模型

2 模型验证结果与分析

2.1 模型设计

在上述LSTM 模型原理的基础上，本文针对飞行器航迹预测问题对LSTM 模型的输入层节点、隐藏层节点数、输出层节点数进行进一步设计。

输入层用于控制当前时刻的候选状态有多少信息需要保存，输入的数据决定了输入层的节点个数，为了保证模型训练的效率，选取主要特征进行模型训练。根据对目标影响程度的大小，将影响较小的数据适当减少。

隐藏层为模型运算层，隐藏层节点数的设置会影响预测精度，过少会导致模型网络复杂度低、特征学习不充分、预测精度降低。隐藏层节点数过多则会使模型受数据噪音干扰过大，使得模型泛化能力差。

输出层作为模型的最后一层，针对航空器航迹的主要研究目标来确定输出节点个数，本文主要采用的维度为高度、经度、维度、时间。

2.2 模型框架

本文主要研究目标是四维航迹，即通过历史航迹信息对未来一段时间的航迹曲线进行预测，为了将航迹信息提取出来，结合LSTM 模型的特性建立基于长短期记忆神经网络的航迹预测模型。

图4 LSTM航迹预测模型框架

本文使用的航迹数据来源于ADS-B，ADS-B航迹数据每一条航迹在时刻的航迹特征信息表示为：

其中，，，，，，依次表示飞行器在时刻的纬度、经度、高度、时间、速度、航向。

对ADS-B 数据进行处理之后，将航迹数据输入到LSTM 模型中，经过模型每一层LSTM 后都采用随机失活（Dropout）降低神经网络节点间的相互依赖性来防止过拟合，最后模型输出的信息表示为：

从而根据预测所得航迹提前规避潜在冲突的发生，并且有助于ATM 做出合理、高效、安全的决策指令。

3 模型验证结果与分析

3.1 仿真所用数据预处理

本次仿真实验使用的是国内某真实航路上ADS-B 获取的历史飞行航迹数据，航班飞行路径如图5 所示。ADS-B 能够实现飞行信息共享，对与空管活动中所截获的航迹信息能够及时地提供给飞行各方相关单位，相较于传统雷达监视技术，ADS-B 具备远程截获、信息格式简单、信息处理成本低等优点。目前我国机场大多已经具备ADS-B 设备及技术支持，故而对ADS-B截获数据的分析和应用更具重要意义。

图5 飞行路径展示

3.1.1 ADS-B 数据格式

从ADS-B 所得的某一刻的数据是某架航空器在某一时间对应的航迹点信息。通过航空器的识别信息，可以获取该航空器的一连串航迹信息。所以通过ADS-B 获得的航迹数据不是连续的线性存在，而是由一系列离散的航迹点构成。

现假设有一历史航迹集T，其中包含了多个历史航迹，可表示为

其中，T表示中的第条航迹。

每架航空器对应的航迹不同，每条航迹是由多个航迹点组成的集合

其中，P表示航迹T上的第个航迹点。

每个航迹点包含了不同的特征，每个特征点包含多个航迹点特征。

其中，m表示航迹点P的第个特征。

本文所使用的每条ADS-B 航迹数据包含特征如下：

具体特征信息见表1。

表1 航迹点特征

3.1.2 ADS-B 数据处理

ADS-B 数据会受到多方面因素的干扰，截获的航迹点难免会出现异常航迹点，例如会有重复航迹点、偏离航迹点、航迹点缺失等问题，因此对于初步获得的ADS-B 数据需要针对目标问题进行预处理。如图6 所示，将航班号3U8063 的ADS-B 的位置和高度数据显示出来，然后根据显示出来的问题进行有针对性的处理。

图6 3U8063航迹数据离散点示意图

航迹数据的重复现象主要集中在时间上的重复和空间位置上的重复。航迹点重复会影响数据的适用性，因此需要把每条航迹的重复信息点删除掉。如表2所示，包含部分重复的航迹点数据示例。

从表2可以看出，第一组与第二组的航迹点数据的时间数据重复，第四组与第五组航迹点数据的经纬度数据重复，因此需对这两组数据做出取舍。整个飞行过程中，航空器处于不同阶段时，高度、速度、航向数据可能出现相同情况，故在去除航迹点数据过程中不考虑这三个指标。表2经过处理可得表3。

表2 重复航迹点数据示例

表3 重复航迹点去除后示例

ADS-B 航迹点数据本身会存在丢包现象，导致部分航迹点缺失。如再经过第一步的重复航迹点去除，会让部分航迹数据出现缺漏现象，为保证航迹呈现出来的连续性和平滑性，我们需要对航迹点数据进行补充。本文主要采取三次样条插值法来对缺失的航迹点数据进行处理。

3.2 数据集划分

在整个实验仿真过程中，需要将数据集进行划分，分为训练集、测试集与验证集，其比重为80%、10%、10%。通过创建模型、拟合训练集、寻找初始参数值，再利用验证集对模型的超参数进行进一步调整，最后通过测试集对模型进行评估。随着模型的训练，误差曲线逐渐趋于稳定，展现出的效果较为理想，如图7所示。

图7 航迹预测模型训练验证误差示意图

3.3 预测误差衡量指标

本次实验采用平均绝对误差（）和均方根误差（）作为评价指标。是预测值与观测值间绝对误差的平均值，是预测值与真实值之差平方的期望值，这两种误差的值越小，则说明模型的性能越好，与的数学表达式如下。

其中，P表示时刻预测航迹，R表示时刻实际航迹。

3.4 模型对比

为了验证本文所采用的模型的有效性，分析对比BP 神经网络模型与LSTM 神经网络模型的预测效果。在两种模型中输入相同的数据集，且保证训练集、测试集、验证集三个数据集的占比相同。BP 神经网络与LSTM 神经网络的误差对比如图8所示。

图8 两种模型误差对比

从图8 可以看出，LSTM 的与值均小于BP 对应值，体现了LSTM 模型的航迹预测性能更优秀，较强的记忆能力使得LSTM 模型能更好地记忆历史航机数据，其特有的输入门、遗忘门和输出门的结构使得LSTM 模型对长序列问题的学习分析能力显著提高。

3.5 模型结果分析

本次实验仿真主要以MATLAB 2021a 作为平台展开，为了验证模型预测值与真实值的误差，在模型训练、预测过程中使用不同的参数，发现参数会对模型的训练及结果产生不同的影响。对模型性能进行对比评估，利用测试集数据验证，检验模型的预测能力。

由图9、图10、图11可以看出，结合ADS-B数据的LSTM 模型预测的高度、经度、纬度与实际数值十分接近，模型拟合度较高，非常接近实验预期结果，表明LSTM 模型可以达到航迹预测的需求，达到了本文的实验目的。

图9 高度预测结果

图10 纬度预测结果

图11 经度预测结果

4 结语

基于航迹运行是下一代空中交通管理体系（NextGen）和欧洲单一天空实施计划（SESAR）的实施基础，四维航迹预测是基于航迹运行的核心，因此，本文针对四维航迹预测的研究是有意义的。本文提出使用LSTM 模型预测航迹的方法，结合实用的ADS-B 数据，充分挖掘航迹历史数据中有价值的航迹特征，准确地预测未来航迹数据，使得航迹预测在实际运行中具备了参考价值。

本文实现了预测航迹的目标，但仍存在许多不足。LSTM 能够较好地挖掘时间序列信息，但对空间序列信息不够敏感，且在理想仿真环境中的噪声是人为设置保持不变的，而实际运行时噪声是不确定和未知的，在适用性和通用性上模型还有待改进。今后的工作将会针对这些问题做进一步研究，使预测所得的航迹能更加准确。