王靖涛 林 琳 焦 毅
(中国民用航空飞行学院 广汉 618300)
广播式自动相关监视系统(ADS-B)正逐步成为空中交通管理(ATM)的基础,ADS-B 系统数据的安全性决定了整个ATM 系统监视数据的可靠性。ADS-B 系统主要任务是提取和处理航空器的位置和其他附加信息,以形成清晰直观的飞行航迹。但ADS-B 在设计之初为降低成本,忽视了安全问题,其在没有任何认证和加密的情况下广播消息[1],导致攻击者可以对ADS-B 系统进行干扰、窃听、修改、消息注入和删除消息等攻击[2]。因此,为维护航班运行安全,使用有效的方法检测抑制欺骗干扰极其重要。
ADS-B干扰信号可以被认为是异常航迹的一种,分类方法经常被用于相关的检测任务中。例如,Olive 和Basora[3]提出了一种检测飞行途中空中交通管制区流量异常飞行轨迹的方法。CHEN Shichuan 等[4]使用inception-residual 网络模型对大量的ACARS信号和ADS-B信号分类。
ADS-B干扰检测也可通过提取信号时序特征的方法进行异常检测,Habler 等[5]提出采用长短时神经网络(LSTM)的seq2seq 模型判定ADS-B 异常。Akerman[6]提出利用ConvLSTM 编解码器检测指定范围内由航空器ADS-B 信息汇集形成的图像流中的异常,王文益等[7]使用基于1DCNN-BiLSTM 的模型,提取ADS-B 信号特征并识别出欺骗信号。
但ADS-B 信号的时序信息受多种因素的影响,尤其是在航向、高度多变的终端区航路段,应尽可能充分考虑影响航迹的因素,才能更充分地提取航班的时序信息特征。Pang[8~9]结合天气因素对航迹进行预测,提升了不同天气条件下航迹预测的准确率。Zhang[10]考虑飞机意图、环境条件等对航迹进行预测。Mayara[11]提出了一种数据驱动的方法,利用机器学习方法学习实际的轨迹模式和扩展终端区域内飞机运动的概率模型。Zeng[12]提出了一种sequence-to-sequence deep long short-term memory network(SS-DLSTM)方法,并将飞机的经度、纬度、高度、速度和航线等因素考虑在内预测了终端区航班航迹。上述研究通过结合多种影响航迹的因素,提高了预测航迹的准确率,更有助于区分是否存在干扰信号。
终端区航迹多变,正确识别出终端区内存在的ADS-B干扰需结合更多影响航迹的因素重构航迹。本文综合考虑了终端区影响航迹的因素,使用TCN模型重构航迹,将预测数据与原数据计算重构误差,将误差值放入SVDD 分类器中分类,若数据重构误差若大于阈值,则检测为ADS-B 异常信号。实现了航迹复杂情况下的ADS-B 信号干扰检测任务。
为防止ADS-B 虚假信号对航班的飞行的干扰,需要准确识别ADS-B干扰信号,而影响终端区航迹的因素较多,需要综合考虑可能影响航班航迹的因素并收集相关数据。
航班ADS-B 数据由机载设备自动广播发射自身运行信息(经纬度、速度、高度、呼号等)的ADS-B 信号[13]。除了考虑经纬度、高度、速度等连续型变量对航迹变化的影响,本研究还将考虑机型、航班所处时段等离散型便变量对航迹的影响。
一个终端区内可能包含多个机场、多个进出港点,且终端区空域内航线错综复杂,在繁忙时期大量的航班会造成空域拥堵,对管制员调配与飞行员飞行带来挑战。空中交通管制系统的运行是基于一些特定的规则,如要控制的航班数量、飞行时间,过多的航班数量导致航迹运行的不确定性更高,如果航迹调配过大,可能会被认为是虚假航迹或者异常航迹,因此,有必要考虑终端区内航班数和航班的进港排序对航迹的影响。
对于即将落地的航班而言,终端区空域就是飞行的最后空域,而航班落地也要考虑机场的某些因素。比如某些有两条跑道的大型机场,跑道的使用情况有明确的规定,需予以考虑。
飞机运行的各个阶段都会受气象影响,风、能见度等能都直接影响飞行员对飞机的操控,风向可能直接影响航班落地降落于跑道的哪一端,这会对终端区航迹产生产生较大影响。
此外,航班下降阶段,较低的能见度影响飞行员视线,这可能导致飞机产生偏离,并影响航班安全。因此需要充分考虑气象因素对航迹的影响。本研究从全称航空例行天气报告(Meteorological Terminal Aviation Routine Weather Report)网站上获得了深圳机场相关的气象数据,包括风向、风速、能见度、温度、修正海压等。
ADS-B 的攻击类型主要有报文注入、报文篡改、DOS 攻击等,都会都民航安全产生较大影响。但实际中难以获取到ADS-B 被攻击后的异常数据,模型检验用的测试集为模拟构造的异常数。以报文注入为例,本研究模型报文注入攻击的方式是采用航路替换的方式模拟,将另外一架具有相似飞行状态的航班飞行数据替换原始部分航迹,如图1所示。
图1 ADS-B信号航路替换图
时序卷积网络(TCN)由Bai 等[14]提出,TCN 在以一维卷积神经网络基础上结合因果卷积、扩张卷积与残差链接,形成了一种能够有效处理序列数据的新型卷积结构[15],此方法能够有效避免RNN 中时常出现的梯度消失或爆炸的情况。
TCN 结构中组合的因果卷积和膨胀卷积可以将时间序列与有效的历史记忆相结合。
因果卷积指TCN 结构中上下层的神经元之间存在着因果关系[16],保证模型不能颠倒序列顺序,即该时刻的输出仅与上一层中该时刻对应输入及更早时刻输入进行卷积,与未来时刻无关。如图2所示,此时卷积核尺寸取值为3,每一层的该时刻输出都是由前一层对应的位置及前两个位置的输入共同计算得到,并且随着隐藏层层数的增加,一个输出所对应的输入越多,所需要考虑的时间序列数据时刻越久。令卷积核为K=(k1,k2...km)(m 表示卷积核的大小),输入的时间序列为P=(p1,p2..pl),Pl的因果卷积可以表示为
图2 TCN结构图
为防止出现梯度消失的情况,TCN中加入了扩张卷积。通过增加卷积核的大小及扩张系数值,使得数据的感受野增大,形成更长时的卷积“记忆”。扩张卷积允许对卷积输入进行间隔采样[17],通过设置扩张系数d 的值可以将每两个相邻层之间卷积神经元的数量减少到原来的1/d,使相同深度的网络可以获得更大的视野。Pl处的扩张卷积运算可以定义为
为解决梯度消失问题,TCN中也使用了残差连接以加深网络。网络加深有利于提取更丰富的特征,但单纯地加深网络会导致稳定性变差,造成梯度消失、梯度爆炸等问题[18],引入残差块可以保证模型具有更稳定的性能。
残差块由两个部分构成,一部分包含了膨胀因果卷积操作和非线性映射,对输入残差块的序列Pi进行计算,公式如下:
其中:Wa、Wb分别表示两个卷积层的权重向量。
另一部分是一维全卷积操作,用于保证输入序列Pi和输出序列Pi+1具有相同的长度,残差块的输出计算如下:
支持向量数据描述SVDD 主要是将正常的特征数据x∈Rn×d(n 表示样本个数,d 表示特征维度)映射到高维的特征空间中,并找到一个是能包含目标样本的超球体,在尽可能包含目标样本的同时最小化该超球体,将非目标样本排除在超球体外,从而达到区分正常类和异常类的目的。
SVDD的优化问题如式(6)和(7)所示:
式中R 代表超球体半径,a 表示超球体球心,ξ表示松弛因子,C 表示权衡超球体体积和误分辨的惩罚系数。
结合拉格朗日乘子法,原优化问题转换为拉格朗日对偶问题,如式(8)所示:
式中αi表示样本对应的拉格朗日系数,表示样本映射到高维空间中所用的核函数。求解获取所有样本对应的拉格朗日系数αi,且满足式(9)中条件的样本为支持向量xv,根据支持向量组成的样本集合S 由式(10)和(11)推导得到超球体的球心a 和半径R :
在实验中,首先使用TCN模型对深圳机场终端区内的航班轨迹进行预测重构,即用前几个时刻的数据构造出下一个时刻的数据,时间序列经过重构网络后会得到一组重构时间序列,再利用重构数据与原始数据之间的差值作为分类器的样本,最后根据训练好的分类器判定重构的数据是否为异常值。
实验中使用的是2021年降落于深圳机场的某些天的终端区航班ADS-B 数据,经分析,补充了空域航班数量、天气、机场情况的特征,共89672 条,18 项特征,将原始数据预处理后按照时间顺序以8∶2 的比例划分为训练样本和测试样本。分别预测经纬度、高度,并将其余15 项特征变为协变量。由于数据数量级相差较大,需要对数据进行归一化处理。
将处理后的数据代入模型,可得到重构后的航迹。经交叉验证后,得到最有参数,重构航迹如图3所示。
图3 重构航迹与真实航迹
ADS-B干扰信号检测为二分类问题,可将ADS-B 数据将分成正常类或异常类[19]。二分类问题通常对应四种情况:真实信号预测为真TP、真实信号预测为假FP、异常信号预测为FN、异常信号预测为假TN。且分类结果有以下特性:
真阳性率TPR:表示分类器正确归于正常类数据占实际所有正常数据的比例。
假阳性率FPR:表示被分类器错误归于正常类的异常数据占所有异常数据的比例。
准确率Accuracy:表示整个测试数据集中预测正确的概率。
精确率Precision:表示实际为正常数据占预测结果为正常数据的比例。
召回率Recall:表示实际为正常的数据被预测正确的概率[20]。
本研究中的SVDD 分类模型在训练中采用网格搜索法获得了高斯核函数最优参数,训练的球体半径为0.218。模型利用真阳性率TPR 和假阳性率FPR 形成的一个工作特征(ROC)曲线,曲线下方的面积AUC 越接近1 表示模型预测的准确性越高。分类实验共使用500条数据,其中正常数据300条,异常数据200,模型测试的准确率为96.7%,模型召回率为94.7%,分类结果精确率为92.02%。
本文综合分析了多种影响终端区航迹的因素,使用TCN 模型重构航迹后,使用SVDD 模型对人工生成的ADS-B 异常数据进行检测,验证了TCN 模型结合多变量预测能够精确重构航迹,后使用SVDD模型能够有效完成异常样本的分类工作。