杨敏佳 白雪茹* 刘士豪 曾 磊 周 峰
①(西安电子科技大学雷达信号处理国家重点实验室 西安 710071)
②(西安电子科技大学电子信息攻防对抗与仿真技术教育部重点实验室 西安 710071)
由于逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)具有全天时、全天候、远作用距离、高分辨率等独特优势,因此在太空态势感知和防空反导中发挥着重要作用[1–4]。相较于1维高分辨距离像,目标的高分辨ISAR像为其散射中心向未知成像平面的2维投影,并且蕴含着重要的尺寸、结构等形状信息和姿态、朝向等运动信息,从而为雷达自动目标识别提供了丰富特征[5,6]。
传统的ISAR目标识别方法主要依据图像特性进行人工特征(如区域特征、边缘轮廓特征、散射点特征等)提取及分类器设计。但是,该过程需要大量的先验知识或专家经验,耗时较长且难以推广[7,8]。近年来,深度学习广泛应用于ISAR目标识别领域并获得了优良的性能[1,9,10]。该类方法可实现基于数据驱动的自动特征提取,具有较强的泛化能力。另外,由于ISAR目标非合作,其姿态及转台参数未知。受观测及成像条件限制,可获取的高质量ISAR像通常较少(1幅或几幅),即存在小样本问题。在这种情况下,深度网络会出现特征可分性不强、识别性能迅速下降等问题,从而为稳健的特征提取与识别带来了极大挑战[11,12]。
小样本学习(small-data learning)为解决样本匮乏时的ISAR目标识别问题提供了有效途径[13]。该方法通过借助具有充足样本的常见目标类别对模型进行训练,进而将获得的识别能力泛化到全新的小样本目标类别中。在给定训练集(包含具有充足样本的常见目标类别)和测试集(包含全新的小样本目标类别)后,嵌入学习(embedding learning)[14–16]等基于任务驱动的小样本学习方法首先通过重复随机采样来分别构建训练任务集和测试任务集。具体而言,任务集中的每个任务均包含支撑集(由有标签样本构成)和查询集(由无标签样本构成),任务目标是依据支撑集对查询集中的样本类别进行判定。此后,该类方法采用训练任务集进行模型训练,使其在测试任务集中同样获得良好的识别效果。特别地,若每个任务包含C个不同目标类别,每个目标类别包含K个支撑样本,则称该任务为 C-way K-shot任务。作为嵌入学习的经典结构,原型网络[16](Prototypical Network, PN)首先将样本从原始空间映射到更低维的嵌入空间;进而通过计算嵌入空间中各类别的中心(即嵌入向量的均值)综合同类信息并获得各类别原型;最终通过比对查询集样本对应嵌入向量和各类原型之间的欧氏距离实现类别预测。但是,该模型未考虑到支撑集样本对识别贡献度的差异。
研究[14–16]表明,支撑样本的质量(代表性)会对小样本目标识别的精度产生极大影响。由于不同雷达参数下目标的ISAR像通常会产生较大形变,同时实测数据中存在遮挡效应和强点闪烁现象,因此图像质量变化较大。在这种情况下,如何合理地为每个任务中不同的支撑样本分配对应的权重,并且有效地将其对识别贡献度的差异引入模型已经成为小样本ISAR目标识别领域的重点和难点。针对该问题,本文提出基于高斯原型网络(Gaussian Prototypical Network, GPN)的小样本ISAR目标识别方法。根据实际中多数目标的特征呈高斯分布这一特性,GPN对嵌入空间特征进行统计建模,将输入样本映射为嵌入空间中的高斯分布(由均值向量和精度矩阵描述),从而有效刻画样本特征的统计特性,并且能够通过精度矩阵的学习引入不同样本质量对识别贡献的差异,避免离群特征对识别的不利影响。在此基础上,通过计算各查询集样本对应嵌入向量与各类高斯原型的马氏距离实现类别预测。实验结果表明,本方法在飞机目标实测数据集上可以获得良好的小样本识别结果。
基于GPN的小样本ISAR目标识别流程如图1所示,其主要包括数据产生、模型训练和模型测试3个部分。在数据产生阶段,随机生成器通过对训练集和测试集进行随机采样不断生成支撑集和查询集。对于C-wayK-shot任务,首先从相应数据集中随机挑选出C个类别,每个类别再随机挑选K个样本作为支撑集,同时将C个类别中的剩余样本作为查询集。在模型训练的前向传播阶段,GPN通过嵌入网络将支撑集样本映射为嵌入向量及其精度矩阵,进而计算各类别的高斯原型。之后,通过计算查询集样本对应嵌入向量到各类别高斯原型的马氏距离获得预测标签。在反向传播阶段,根据预测标签与真实标签计算损失,从而指导模型参数的更新。在模型测试阶段,模型参数固定,直接将支撑集和查询集输入模型并执行与训练过程中相同的高斯原型计算与距离度量操作来获得对未知类别目标ISAR像的预测标签。接下来,对网络各模块结构及其功能进行详细介绍。
GPN通过softmax函数计算xi属 于各类别的概率。特别地,xi属于第k类的概率为
在训练过程中,本节采用5类飞机(F15C, F16,F18, F117和MiG29)的电磁仿真数据对网络参数进行迭代更新优化。在测试过程中,采用与训练过程类别不同的3类飞机(安26、雅克42、奖状飞机)的实测数据ISAR像进行小样本识别性能分析与对比。
电磁仿真数据所采用的5类飞机模型如图3所示。在本地坐标系中,雷达俯仰角为145°,方位角为0°~360°,载频为17 GHz,成像带宽为1 GHz,采用物理光学法进行电磁计算[1],所得各目标回波数均为10920。接着,将积累角设为3°, 4°, 5°并采用距离-多普勒方法进行高分辨成像,可获得3种不同分辨率的ISAR像。本节图像纵向均表示距离单元、横向均表示方位单元。同时,每隔1°方位角成像1次,因此每种分辨率得到360幅ISAR像。在此基础上,将每张图像中的目标居中并裁剪为128×128,并从中剔除特征描述性不强的图像(如部分结构反射太强导致轮廓特征丢失等),挑选其中200张作为实验所用数据集。最终,电磁仿真数据集共得到3000张图像。在成像积累角4°时,5类飞机的典型成像结果如图3所示。同时,图4给出了F16飞机不同积累角下的成像结果对比。可以看出,积累角变化会使ISAR像产生方位维的拉伸或压缩。
实测数据对应的3类飞机光学图像和ISAR像如图5所示。此时雷达工作于C波段,带宽为400 MHz。每类飞机包含90张结构清晰、聚焦良好的图像,尺寸均为128×128。
图6给出训练集中5类不同型号飞机(F15C, F16,F18, F117和MiG29)电磁仿真数据典型ISAR像的特征分布可视化结果与分布检验结果。为便于高维特征可视化,本文使用t分布随机领域嵌入[19](tdistributed Stochastic Neighbor Embedding, t-SNE)将嵌入空间中的高维特征降至2维,并分别绘制所有类别目标特征分布的3维可视化及2维可视化结果,分别如图6(a)和图6(b)所示。其中,F16特征分布的2维可视化结果如图6(c)所示。以分位数-分位数图[20]的形式对F16特征在两个维度上分别进行分布检验,结果如图6(d)所示,其中2种颜色表示2个维度的特征。若该图中散点分布越接近线性,则输入数据分布越接近高斯分布。其他4类目标特征分布的2维可视化及分位数-分位数图与F16类似。从可视化及分布检验结果可以看出,每类目标样本特征的统计特性均近似于高斯分布,该结论与GPN的假设相同。
实验选择成像积累角分别为3°, 4°和5°的电磁仿真数据ISAR像作为训练集,从而分析GPN对训练样本形变的适应性。同时,分别进行3-way 1-shot和3-way 5-shot两组实验,从而分析支撑集样本数对识别性能的影响。在模型训练过程中,将学习率设置为10–3、迭代次数设置为1000,并采用Adam优化方法[21]来搜索并更新模型参数。在测试过程中,由于1次实验具有随机性和偶然性,不能准确反映模型性能,因此用随机生成器反复迭代生成1000组实验数据并进行1000次独立重复实验。最终,将实验结果绘制表格并列出识别准确率的平均值、最大值、最小值和标准差。PN与GPN识别结果对比如表1所示。可以看出,在3种成像积累角下,GPN较PN在1-shot和5-shot两种任务下的平均识别正确率都有明显提升。但是,测试准确率的最小值也反映出依然存在部分低质量带标签样本,从而使得对应识别精度降低。
同时,GPN所得嵌入向量的t-SNE可视化结果如图7所示,统计直方图如图8所示。结合表1可以看出,3-way 5-shot的平均识别正确率均高于3-way 1-shot,并且各类目标对应嵌入向量的聚集性及识别稳定性更好。因此,少量增加支撑样本数量可以显著改善小样本ISAR目标识别效果。
表1 PN与GPN识别结果对比
整体上,无论是3-way 1-shot还是3-way 5-shot任务,当训练集数据成像积累角为4°时识别性能达到最优,因此,训练集与测试集之间的不同差异会在一定程度上决定模型学习的效果,从而影响模型的泛化性能。针对目标的实测ISAR图像小样本识别问题,合理地构建电磁仿真数据会对识别结果起到较好的促进作用。
为了进一步验证所提GPN在小样本ISAR目标识别问题中的有效性,本节将其与传统深度网络进行了对比实验。具体而言,选取包含6个卷积层的经典DCNN模型,并分别构建1-shot和5-shot实验场景。由于传统ISAR目标识别方法在训练过程中不纳入其他类别样本的信息,因此仅选择实测数据作为实验数据。当实验场景为K-shot时,从实测数据的每个类别中随机选取K个样本作为训练集,其余的样本作为测试集。最后,将DCNN模型的实验结果与GPN的实验结果进行了对比,如表2所示。
表2 小样本条件下传统DCNN与GPN识别结果对比(%)
由对比结果可以看出,在每类有标签样本仅有1幅的情况下(1-shot),现有深度神经网络DCNN几乎失效,而GPN平均识别准确率比DCNN高出约28%;在每类有标签样本仅有5幅的情况下(5-shot),DCNN的识别准确率仅有68.24%,而GPN的平均识别率为92.44%,比DCNN高出约24%。因此,GPN能够解决现有深度神经网络在处理小样本ISAR目标识别问题时识别性能下降甚至失效等问题,同时能够实现稳健特征提取与识别。
针对现有基于深度卷积神经网络的ISAR目标识别方法在训练样本不足时性能下降甚至失效等问题,研究了基于GPN的ISAR小样本目标识别方法。该方法首先通过嵌入网络获得输入样本的嵌入向量及精度矩阵,进而通过支撑集构建了各类别的高斯原型,最终通过计算查询集样本对应的嵌入向量与各类别高斯原型的马氏距离来实现类别预测。相比于PN,所提模型将嵌入向量建模为高斯分布,并且充分考虑了支撑集样本对识别贡献度的差异。实验结果表明,本方法在飞机目标实测数据集上可以获得更优的识别结果。未来将研究基于样本多特征融合及形变稳健的ISAR小样本识别方法。