刘帅康,曹 伟,管志强,杨学岭,许金鑫
(南京舰载雷达研究所,南京 210000)
近期,随着俄乌战争的爆发和美国对南海防空识别区的屡屡挑衅,使得目标识别的需求变得空前迫切。历史上以色列空军偷袭伊拉克核反应堆的巴比伦行动就是典型的案例,行动中以色列将F15 和F16 战斗机编队伪装成民航机,从而完成了偷袭伊拉克核反应堆的任务。随着空中目标飞机性能的不断提升,国家空防安全面临的威胁日趋严峻,这就要求防空系统必须准确快速地识别出空中目标的架数和类型。仅将飞机分为直升机、螺旋桨和喷气式3 类已不能满足现代化战争的需求,在敌方来袭时,如果能够更加精准地判断出敌方飞机的大小、类型,甚至型号的话,将会极大地提高我方的战略优势,从而更好地应对突发战况。
赖陈潇等利用经验拟态分解法消除机身分量,分解出微多普勒信号,并利用循环自相关函数强化周期特征,最后利用该周期特征对3 类飞机进行分类[1];王万田等使用单波门稀疏回波数据重建目标频谱,并从重构的回波数据中提取基于微多普勒的振幅偏差系数、时域波形熵和频域波形熵等特征来对3 类飞机进行分类[2];夏赛强等通过闪烁间隔、分形维数、调制带宽和二阶中心矩4 个特征,分别从时域和频域提取窄带雷达目标回波特征,对3 类飞机进行分类,得到了较高的识别率[3]。目前,对于窄带雷达空中目标识别还停留在分为3 类的阶段,然而分为3 类已不能满足现代化战争的需求,本文将空中目标进一步细分为7 类。
由于人工提取特征严重依赖于特征提取算子,且参数设置阶段依赖于专家知识,这限制了这些方法在困难场景中的普遍适用性,使用神经网络可以很好地解决这一问题。梁复台等使用CNN 对窄带雷达空中目标进行识别,在多帧回波测试集上得到了较高的识别率[4];曹展家等使用Bi-LSTM 对雷达目标进行处理,克服了CNN 对雷达一维时间序列数据不敏感的问题[5];周强等利用生成对抗性网络模型(generate adversarial networks,GAN)生成的雷达一维图像,克服了CNN 中数据量不足带来的过拟合问题,有效提升了目标识别的准确率[6]。
辅助生成对抗网络(ACGAN)是GAN 的变体,与GAN 相比,ACGAN 增加了分类功能,能更好地适应于目标分类任务。为了使ACGAN 具有处理目标频域内部时序特征的能力,本文从实际场景出发,对ACGAN 进一步改进,提出了将CNN 结合堆叠的Bi-LSTM 嵌入到ACGAN 中用于窄带雷达目标的细分类。使用本文方法进行实验,在实测数据上取得了较高的分类精度。
对目标类型进行说明,然后对数据进行去零频、机身平移、归一化和数据扩充等预处理。
依据旋翼直径、发动机个数和机长将3 类飞机进一步细分为7 种类型,详细目标类型说明如下:
对于直升机,旋翼直径与直升机机长通常成正比,机长又与载重人数成正比,因此,根据直升机旋翼直径可将其分为重型直升机、中型直升机、小型直升机。重型直升机旋翼直径大于20 m,主要用于重型运输和重型起重等,典型的重型直升机有直-8和米-17;中型直升机旋翼直径在15 m 左右,主要用于攻击任务、突击任务和中型运输等,典型的中型直升机有S70 等;小型直升机旋翼直径一般在10 m左右,主要用于侦察任务和民用等,典型的小型直升机有直11 和EC-120 等。
对于螺旋桨飞机,由于螺旋桨个数不同,调制数据会发生变化,当前大多数螺旋桨为双发和四发螺旋桨,因此,可以依据螺旋桨飞机发动机个数将其分为双发螺旋桨和四发螺旋桨。双发螺旋桨一般机长小于25 m,主要用于短程载客和短程通勤等,典型的双发螺旋桨有运-5 和运12 等;四发螺旋桨机长一般超过25 m,主要用于空警和商用等,典型的四发螺旋桨有空警200 和运9 等。
对于喷气式飞机,由于喷气式的旋转部件遮盖严重,旋转部件的回波强度非常小,机身回波较强,可依据机长将喷气式分为大型喷气式和中小型喷气式。大型喷气式机长一般大于25 m,主要是客机和作战支援飞机等,典型的大型喷气式飞机为运-20、波音747 等;中小型喷气式一般长度小于25 m,主要是战机、私人飞机、无人机和小型作战支援飞机等,典型的中小型喷气式飞机有歼轰7、无人机等。
不同类型的飞机具有不同的用途,对3 类飞机的进一步细分类能够更加精细地判断目标的类别,从而更好地应对突发状况。
数据预处理过程包括去零频、机身平移、归一化和数据扩充4 部分。
原始数据如下页图1(a)所示,采用Kalmus 滤波器对其非悬停的目标进行零频抑制处理[7],其函数的表达式可以表示如下:
零频抑制可以防止零频对调制信息的干扰,抑制后的效果如图1(b)所示。
将机身平移到中间位置,防止因飞机飞行速度不同而对分类造成干扰,机身平移后的图像如图1(c)所示。
幅度的归一化可以防止在分类时出现幅度敏感性问题,归一化后的图像如图1(d)所示。
为了减少对数据集的依赖,提高系统的泛化能力,本文使用3 种方式对7 类目标数据分别进行扩充:1)沿频谱数据中心位置进行垂直翻转;2)对频谱数据向左或向右平移1、5 或10 个单元;3)对频谱数据加0.5、0.8、1.2 或1.5 幂次方。根据以上3 种方法调节参数可以将数据集扩大到原始数据集的50~100 倍。
改进ACGAN 模型是由CNN 结合堆叠的Bi-LSTM 嵌入到ACGAN 中得到。下文介绍ACGAN 模型和适用于频谱内部时序特征的改进ACGAN 模型。
2014 年GOODFELOW 等提出生成对抗性网络模型[8],生成对抗性网络模型的生成器可看作是一种正则化方法,很大程度上可以解决窄带雷达由于数据量不足而造成的过拟合的问题[9]。由于GAN为无监督学习,模式过于自由导致训练过程不可控,ODENA 等提出了ACGAN[10]。
ACGAN 的结构如图2 所示,将噪声和生成类别输入生成器G 中,得到生成数据,将生成数据和真实数据依次放入判别器D 中,得到输入数据的真假标签和类别标签。
图2 ACGAN 结构图Fig.2 ACGAN structure diagram
与GAN 相比,ACGAN 在生成器G 和判别器D的输入中增加了目标的样本标签信息,这样既有助于提高判别器的分类能力,又能提高生成器的生成能力。另外,还修改了判别器D 的结构,增加了辅助解码网络,使判别器不仅可以判断输入数据的真伪,还可以输出样本数据的类别标签,判断每条目标数据所属的类别。
ACGAN 的损失函数由判别损失LS和分类损失LC组成。
则ACGAN 判别器的损失函数如下所示:
生成器损失函数如下所示:
原始ACGAN 中的生成器和判别器使用的是卷积神经网络,卷积神经网络只能孤立地处理当前的数据,无法将上一时刻输入数据的信息传递给下一时刻,不适用于窄带雷达时序数据。此外,浅层模型在描述目标的整体结构特征方面的能力也很有限。本文使用CNN 结合堆叠的Bi-LSTM 模型来解决这个问题。模型结构如下页图3 所示。
图3 改进辅助生成对抗网络模型结构图Fig.3 Improved structure diagram of auxiliary generation adversarial network model
如图3 所示,CNN 能够提取输入序列具代表性的特征,有效避免了由于输入序列过长而导致的信息冗余;另外,Bi-LSTM 将窄带雷达数据分成两个独立的LSTM 模型,可以更好地利用雷达目标的先验信息对数据进行处理,最终由正向和反向的输出值共同决定输出层的结果。将多个Bi-LSTM 堆叠到合适的深度,可以更好地提取高级物理结构特征。
根据xtest在各个类别中的概率分布,推断xtest最大可能的类别式为:
本文搭建的网络模型所采用的数据集来自X波段对空警戒雷达,工作频率10 kHz,相关脉冲数为640 个。样本类别数为7 类,共计4 815 个数据,每类挑选约70%组成训练集,挑选约20%组成验证集,剩余约10%组成测试集。使用Adam 梯度下降方法,判别器的学习率设置为0.000 1,生成器的学习率设置为0.000 002,训练数据分批处理,每批处理128 个数据,训练次数为300 次,堆叠两层双向LSTM。在训练集上对模型进行训练,并用验证集验证模型的泛化能力,最后用测试集测试模型的效果。数据集的划分结果如表1 所示。
表1 数据集划分Table 1 Dataset division
设置训练过程中模型的评价指标为精度,即样本的正确识别概率,记录每次迭代后样本损失函数值和精度值。迭代300 次,训练集和验证集的精度和损失值随迭代次数的变化情况如图4 和图5 所示。图4 中,迭代次数达到200 次后,随着迭代次数变化,训练集和验证集精度基本趋于稳定,图5 中,训练集和验证集中的生成器损失和判别器损失也趋于稳定,模型几乎达到最优。由于实测数据中存在一定的噪声,所以训练集最终的精度会略高于测试集,最终训练集精度稳定在92%附近,测试集精度稳定在90%附近。通过测试集测试的精度为90.93%,生成器生成的图像如下页图6 所示,从图中可以看出生成的数据与输入数据具有很高的相似度,这充分体现了ACGAN 的样本扩充能力。
图4 训练和验证精度图Fig.4 Accuracy diagram of training and verification
图5 训练和验证损失图Fig.5 Loss diagram of training and verification
图6 生成目标效果图Fig.6 Effect diagram of generating targets
测试结果的混淆矩阵如图7 所示,图中纵轴代表预测标签,横轴代表真实标签,从混淆矩阵中可以看出,3 类飞机类间分类错分的概率很小,再进一步细分类时,处于临界处的空中目标很难准确分类。例如直升机分类是依据旋翼直径进行分类,其中,重型直升机包括直-8,旋翼直径为18.9 m,中型直升机包括S70,旋翼直径为16.7 m,两者相差较小,错分的可能性偏大;喷气式依据机长进行分类,同理也容易将其类内错分;而螺旋桨是依据发动机个数进行分类,界限较为清晰,错分的概率值很小。另外,当双发螺旋桨发动机受到遮挡比较严重时,容易和中小型喷气式错分。
图7 测试集的混淆矩阵Fig.7 Confusion matrix of the test sets
将CNN[4]、Bi-LSTM[5]、ACGAN[6]和本文所搭建的改进ACGAN 4 种方法进行对比,测试集的精度值如表2 所示。
表2 识别结果对比Table 2 Comparison of the identification results
通过对比可知,ACGAN 和Bi-LSTM 识别精度均高于CNN,说明了在样本不足时,使用ACGAN 的优越性以及Bi-LSTM 在处理长序列数据的优势。另外,本文所提出的基于改进ACGAN 的窄带雷达空中目标分类方法与前三者相比,在识别精度上有所提升,说明了本文提出方法的优越性。
本文提出了一种基于改进ACGAN 的雷达空中目标细分类方法,解决了窄带对空警戒雷达难以对目标进行细分类的问题。重点讨论了网络模型的构建,将CNN 结合堆叠的Bi-LSTM 嵌入到ACGAN中,用于窄带雷达目标的细分类。基于X 波段对空警戒雷达实测数据的对比实验表明,与其他方法相比,本文提出的方法具有更高的空中目标细分类识别能力,分类准确率高达90.93%,进一步证明了本文所提方法处理时序数据和防止过拟合的能力。