融合注意力机制的雷达欺骗干扰域适应识别方法

2022-11-29 10:59孙闽红陈鑫伟仇兆炀滕旭阳

电子与信息学报 2022年11期

孙闽红陈鑫伟仇兆炀滕旭阳

(杭州电子科技大学通信工程学院杭州 310018)

1 引言

随着数字射频存储器[1](Digital Radio Frequency Memory, DRFM)技术的快速发展，有源雷达欺骗干扰已成为主要的雷达干扰手段之一。如何采取有效方法识别有源欺骗干扰，以保证雷达有效工作，是雷达抗干扰中迫切需要解决的问题。

现有基于特征差异的识别方法包括利用发射信号优化[2]、物体表面散射强度[3]、极化特性差异[4]、到达时间差差异[5]以及相位调制后多普勒图像差异[6]等来识别雷达欺骗干扰。以上方法都是针对单一样式的雷达欺骗干扰进行研究，但随着复合干扰手段的出现，这类方法在实际应用中存在一定局限性。

近年来，随着机器学习理论研究不断深入，有着稳健信息表征能力的深度学习成为研究热点，被成功应用于异常检测、图像分类、缺陷检测等领域。同时，国内外学者也致力于雷达欺骗干扰的智能识别研究。文献[7]对干扰下的雷达接收信号进行时频分析，用栈式稀疏自编码器对时频特征进行降维，最后利用Softmax分类器完成有源欺骗干扰的识别。文献[8]通过Hilbert信号空间理论建立干扰信号特征空间，提出了基于信号特征空间的概率神经网络分类算法。文献[9]提出结构改进型的AlexNet用于广播式自动相关监视欺骗干扰检测。文献[10]提出一种基于奇异值分解与神经网络的干扰识别方法，采用奇异值分解法对干扰信号进行预处理，再用神经网络作为分类器实现干扰识别。以上研究通常包含两个前提条件：一是训练样本集与待分类样本集间具有一致的特征分布；二是有充足的标注样本供给训练稳健的模型。然而，在现实场景下，以上前提条件往往难以满足。迁移学习是解决这一问题的有效方法之一，它是在源域与目标域概率分布不同条件下解决如何使用源域数据来预测目标域数据标签的问题，域适应(domain adaptation)需要满足两个域间的标签空间一致，是有条件的迁移学习问题，也是当前迁移学习问题的研究重点[11]。域适应主要包括基于距离度量与基于对抗学习两大类方法。前者度量域间分布差异的指标包括最大均值差异(Maximum Mean Discrepancy, MMD)、Wasserstein以及KL散度(Kullback-Leibler Divergence, KLD)等，代表算法有深度适配网络[12](Deep Adaptation Network, DAN)、联合分布自适应[13](Joint Distribution Adaption, JDA)等。借鉴了生成对抗网络的思想，后者代表算法有域对抗网络[14](Domain Adversarial training of Neural Networks,DANN)等。

针对现有研究的不足，本文将DANN引入到雷达抗欺骗干扰，提出了融合注意力机制的深度残差域对抗网络(Attention-based Residual Domain Adversarial training of Neural Networks, Attention-RDANN)的欺骗干扰域适应识别方法。应用基于对抗网络思想的域适应技术实现从源域到目标域上的迁移识别，并通过空间通道注意力机制使网络训练聚焦于时频图全局空间特征和高响应通道，以忽略时频图像中可迁移性低的区域从而抑制负迁移的发生。该方法在标注源域数据的基础上，利用未标注的目标域数据进行训练，进而对目标域数据进行分类，即利用源域已有知识，借助特征提取器与标签预测器、域分类器之间的对抗，将源域数据和目标域数据特征分布对齐，来解决不同数据分布情况下的雷达欺骗干扰识别问题。

2 系统模型

雷达检测欺骗干扰有无及干扰类型识别可建模为如下的多元假设检验问题

其中， H0表示无干扰状态；Hi表示受第i种干扰状态，i取1～5，对应5种不同欺骗干扰类型，分别为距离欺骗、速度欺骗、距离速度联合欺骗、频谱弥散[15]、切片组合干扰[15]。x(n)表示雷达接收信号，s(n) 为真实目标回波，ji(n)表示第i类欺骗干扰信号，ω(n)表示雷达接收机内部噪声。

不同于基于统计检测的方法，本文采用时频图作为模型输入信息，利用在H0和Hi情况下接收信号时频图像的深度特征差异，借助深度学习及迁移学习在图像分类方面的优势完成欺骗干扰识别。

3 基于Attention-RDANN的欺骗干扰识别

残差神经网络[16](RESidual neural NETwork,RESNET)可以有效地解决随着网络深度增加产生的网络退化的问题，卷积注意力模块[17](Convolutional Block Attention Module, CBAM)可以通过训练注意力权重来强调图片中的重要信息，以达到抑制无关信息的效果。本文将注意力残差模块与DANN的对抗思想相结合进行欺骗干扰识别，算法流程如图1所示。首先通过信号预处理、时频变换和二值化将原始雷达欺骗干扰信号样本处理成时频域灰度图样本，经过图像归一化、裁剪、翻转等图像预处理后生成张量样本，然后将源域数据与目标域数据共同输入Attention-RDANN网络进行特征向量提取，以 H散度[18]度量两个域样本间的特征向量分布差异，借助标签预测器与域判别器间的对抗不断迭代优化，得到最后的分类模型。此外，该方法只需要源域数据标签，而并不需要目标域数据标签，以达到通过域适应使得网络适应目标域数据的目的。

图1 算法流程图

3.1 DANN网络

本文通过应用改进的DANN网络进行欺骗干扰感知。鉴于生成对抗网络[19](Generative Adversarial Nets, GAN)在人工智能领域的优异表现，DANN借助GAN的生成对抗学习思想，来学习源域及目标域样本间的可迁移特征。其模型示意图与结构图如图2所示。

图2 DANN网络

DANN结构主要包括特征提取器、标签预测器与领域判别器3个部分。特征提取器的作用是将源域及目标域数据分别映射到相应的特征空间，使标签预测器能够通过所提取的特征分辨具体的源域数据干扰类别，而领域判别器不能区分所提取的特征来自源域或是目标域。此外网络通过引入 H散度度量不同领域间深度特征的分布差异。给定两个领域和，x表示定义在它们之上的数据，给定一个空间H，则和之间的 H散度为

其中，I[a]为指示函数：当a成立时其值为1，否则其值为0，η为尽可能区分和两个域的函数，n1和n2分别表示源域和目标域各自的样本数。同时其目标域泛化误差上界为

其中

即RDs(η)与RDt(η)分别表示源域与目标域上的泛化误差，c表示一个常数，η∗∈η，表示其中任意一种区分源域和目标域的函数。算法的目的即最小化dH(Ds,Dt)和RDs(η)的同时最小化目标域分类误差RDt(η)。

DANN网络可以通过对抗学习到可迁移特征，但是它的特征提取模块结构过于简单，面向复杂时频图像不足以提取稳定的特征，而引入注意力机制残差块可以在加深网络的同时增强对时频图像特定区域的表征能力，从而提高网络的识别精度。

3.2 注意力机制残差模块

增加神经网络层数可以提取到更加丰富的特征，更有利于信号时频图像的分类。但加深网络学习过程中梯度消失是时有发生的问题，残差学习通过加入直接映射一定程度上解决了深度学习网络的梯度消失问题。此外许多研究人员验证了在神经网络中引入注意力机制能够增强模型的特征表达能力。不同于人类视觉感知，网络训练过程中根据识别需求只需要关注时频图像信号部分，本文引入残差学习与CBAM至网络特征提取模块以提高识别性能。

在欺骗干扰检测识别中通过引入残差学习到DANN特征提取模块以解决梯度消失问题，其块结构如图3所示，输入输出特征向量关系式可表示为

图3 残差块结构

其中，xl和xl+1分别表示第l+1层的输入和输出向量，F(x,{Wi})表示其残差特征向量。加入直接映射保证了第l+1 比第l层包含更多的时频图信息，并且网络参数量保持不变，每层仅多了1项求和，计算量几乎不变，故对时间复杂度并无影响。

而回波信号的时频图像经过残差网络得到的特征矩阵包含多个通道，这些通道信息重要性并不相同，故而以变换权重来实现特征通道的过滤来优化特征，其表达式为

其中，f表示输入该模块的特征向量，A vgPool和MaxPool 分别表示平均池化层与最大池化层，σ表示激活函数。该模块将输入的特征f通过平均池化和全局最大池化的特征表征向量分别送入共享多层感知机(Muti-Layer Perception, MLP)，而后将共享网络输出的特征向量对应量进行求和得到和向量，对其进行激活得到该模块最终的输出权重系数Mc，这个权重系数与通道数相同，体现了图像不同通道特征的重要程度，最后通过相乘对输入特征向量进行加权得到细分后的特征向量。其时间复杂度主要变化体现在池化层及全连接感知机层上，全连接层的时间复杂度与输入矩阵尺寸密切相关，其时间复杂度可表示为 T ime∼O(N2·Cin·Cout)，N表示池化后的特征图边长，Cin表示输入通道数，Cout表示输出通道数。而经过池化后运算量得以大规模削减。

区别于通道注意力，空间注意力聚焦于对识别有价值的图像空间，两者相辅相成，分别关注位置和内容，其表达式为

该模块同样将输入的特征f分别进行平均池化和全局最大池化压缩，不同的是此处不再是求和，而是通过按通道对应拼接后利用7 ×7大小的卷积核进一步维度压缩，对其激活得到该模块的输出权重系数Ms，这个权重系数与原特征维数相同，体现了图像不同区域特征的重要程度，最后通过与原特征向量相乘对其加权得到细分后的特征向量。其时间复杂度主要体现在池化层上，池化层的时间复杂度可以表示为T ime∼O(M2·n2·Cin)，其中M表示每个卷积核输入特征图的边长，n表示池化窗口边长。

本文Attention-RDANN模型的注意力机制模块结构如图4所示，两个模块间以顺序连接方式工作。结合上述时间复杂度，单个注意力机制残差块结构的时间复杂度可表示为

图4 注意力机制残差块结构

其中，D表示有D个卷积层，Ml表示第l个卷积核输入特征图的边长，kl表示第l个卷积核的边长，Cl−1与Cin表示输入通道数，Cl与Cout表示输出通道数，n表示池化窗口边长，N1表示空间注意力模块输入特征图边长，N2表示通道注意力模块池化后输入全连接层的特征图边长。

3.3 Attention-RDANN网络

在欺骗干扰识别问题中，目标域数据缺少标注是卷积神经网络识别性能不佳的主要问题。本文通过改进的DANN网络来学习源域及目标域数据中的可迁移特征去实现雷达欺骗干扰识别。本文所提方法的模型结构如图5所示。通过这个网络既可以实现深层特征提取同时避免梯度消失现象，又可以自适应地学习到图像中空间与通道的权重，然后根据权重去增强对检测有意义的特征并抑制无意义特征，从而避免负迁移现象的发生。此外，本文为了适应欺骗干扰检测任务还对DANN网络结构做了一些修改：(1)去掉最后一个最大池化层，防止图像丢失低级特征。(2)去掉源域分类器最后一个全连接层，并且将最后softmax适应数据改为2/6类，全连接层(Fc)包含大量参数，这是为了减少类别同时去除冗余参数。网络初始权重采用在线预训练权重。

图5 Attention-RDANN网络结构

此处分别以Gf,Gy与Gd表示特征提取器、标签预测器与域判别器3个模块各自的输入输出间函数，输出分别表示信号时频图深度特征向量、网络预测的干扰数据类型及网络判定的干扰数据领域。将源域样本与目标域样本深层特征分别表示为S(Gf)和T(Gf)。则基于式(3)的源域与目标域间 H散度为

其中，n1,n2分别表示源域目标域数据的样本数，此处把 H 看作特征空间中的一个超平面，通过域判别器模块映射函数Gd来估计式(8)的最小值部分。

当给定一个信号时频图样本(xi,yi)，其标签预测器与域判别器的损失分别表示为Ly(Gy(Gf(xi)),yi)和Ld(Gd(Gf(xi)),di) ，di表示第i个欺骗干扰时频图样本的域2元标注。则网络整体总目标函数为

4 仿真实验与分析

4.1 干扰数据仿真

本文利用Hammerstein模型仿真体现干扰机引入的欺骗干扰信号与真实信号间的细微差异。首先把雷达发射机和干扰机看作两个不同的静态非线性子系统，则可以用不同的无记忆多项式模型表示该系统。此外把传输信道看作一个动态线性子系统，并以FIR滤波器表示。通过将两个子系统级联，得到该非线性系统的模型关系式为

其中，M表示系数数量，x(n)表示输入信号，y(n)表示输出信号，r2i−1表示该多项式系数，uk是信道响应系数，N是FIR滤波器的阶数，w(n)∼N(0,σ2)是加性高斯白噪声。以下仿真实验中使用的实际参数如表1所示，设置多项式系数的阶数为7，FIR滤波器的阶数为3。将发射信号附加幅度、时延、多普勒频率等调制信息后，输入该非线性模型，得到5类欺骗干扰信号。

表1 Hammerstein非线性模型参数表

4.2 实验参数设置

为了评估本文方法对于在雷达欺骗干扰识别领域的可行性及有效性，本文通过检测雷达回波中是否存在距离假目标、速度假目标、距离-速度同步假目标、频谱弥散干扰和切片组合干扰5种雷达欺骗干扰进行仿真实验，雷达发射信号参数如表2所示。

表2 仿真参数设置

按照上述流程产生接收信号，对接收信号以点数4000分出各类样本，剔除异常样本后对信号做时频分析得到不同时频图样本各800个，源域与目标域6种信号类型共9600个样本，在标注源域数据和未标注目标域数据中每种干扰类型分别任意取600个时频图样本作为训练集，将剩余每个类别200个时频图样本作为测试集。

本文模型中优化算法为随机梯度下降法，学习率lr=0.01, batch_size=32, momentum=0.9，激活函数为ReLU。深度学习框架为Pytorch，版本为1.4.0，Python版本为3.6.8。实验都是在一台CPU为Intel(R) Core(TM) i7-8750H 2.20 GHz, GPU为NVIDIA GeForce GTX 1060MaxQ的电脑上运行，内存为16 GB，硬盘容量为512 GB的固态硬盘，所有数据仿真产生都是通过MATALAB 2018b编程实现。

4.3 对比实验设置

为了验证本文算法的优越性，选取有代表性的方法做性能对比，其中包括采用基于时频图像Zernike矩特征[20]的特征提取方法，迁移成分分析[21](Transfer Component Analysis, TCA), DAN, JAN和Source_only算法。其中Zernike作为传统特征提取方法，本身不具有分类器，采用的分类器均为SVM分类器，并且仅用源域数据训练，目标域数据测试，这里不进行迁移；TCA作为典型的特征迁移方法，所用特征为上述传统特征，即输入为经过提取时频图Zernike特征；Source_only网络对比实验表示只用源域数据训练，目标域数据测试来为迁移实验作对照。

4.4 结果与分析

实验1 不同雷达欺骗干扰类型数据集间的迁移。对3.1节处理后的雷达欺骗干扰时频图数据进行仿真实验，并与3.3节的Source_only算法进行对比得到不同算法下的检测识别性能，如表3所示。其中源域与目标域分别包含真实回波与距离欺骗、速度欺骗、距离-速度联合欺骗、频谱弥散5类信号的一种，即做二分类检测识别有无假目标。表中Rd表示距离欺骗，Vd表示速度欺骗，R_Vd表示距离速度联合欺骗，SMSP表示频谱弥散，C＆I表示切片组合干扰。以上述仅源域训练(Source_only)实验做参照实验，做不同雷达欺骗干扰类型数据集间的迁移，其中各类信号的信噪比设为10 dB，各类干扰与真实回波的干信比设为6 dB。

从表3可以得到，对于不同干扰类型的数据而言，由于域间数据具有一定的差别，当采用Source_only方案，即只用源域训练，对目标域数据的识别率普遍较本文域适应方法低，原因在于两个域数据存在一定差异，域适应方法可以通过将目标域数据一并训练以减小特征空间差异，而普通深度学习方法在训练阶段时并没有用到目标域数据的信息，体现了本文对抗适配迁移学习方法对于雷达欺骗干扰识别的有效性。同时有部分实验两种方法识别性能相差不大，这是因为两个域间差异不大，不同方法都能较好地进行识别。有部分实验迁移后识别性能反而降低，则是出现了负迁移现象，现有的克服负迁移的研究方法包括样本选择思想和传递式域适应方法[11]。实验表明在出现未知新型干扰时，本文域适应方法对于雷达欺骗干扰识别具有一定现实意义。

表3 不同雷达欺骗干扰类型迁移效果对比

实验2 不同干噪比雷达欺骗干扰数据集的迁移。对3.1节中处理后的雷达欺骗干扰时频图数据进行仿真实验，与3.3节设置的对照算法进行实验对比，如表4所示。其中源域与目标域分别包含仅真实回波以及真实回波与距离欺骗、速度欺骗、距离速度联合欺骗、SMSP、C＆I 5类信号的一种共6类信号样本，其中真实回波的信噪比固定为10 dB。第1列表示源域数据集的干噪比为20 dB，目标域数据集的干噪比为10 dB，第2列则表示源域数据集的干噪比为10 dB，目标域为20 dB，从而做不同干噪比下雷达欺骗干扰数据集的迁移，表中每个实验取50次实验结果平均值。

从表4可以看出，在同时存在多种欺骗干扰类型情况下，传统特征算法识别性能不佳，表明在雷达欺骗干扰样式多样、电磁环境复杂情况下，传统特征不再具有普适性。并且经过TCA迁移后的检测识别率比只用SVM分类结果反而更低，体现传统特征的可迁移性较低。对比Source_only算法，本文方法分别提高了17.1%和16.7%，说明不同干噪比下的时频图数据具有一定的差异，体现了本文方法有利于解决数据分布差异的问题。相比DAN及JAN迁移学习算法，本文算法体现了更好的性能，相比DAN提升了16.7%和17.5%，相比JAN提升了3.6%和3.7%。而相比DANN算法，本文算法在特征提取层引入注意力机制残差模块后，单次平均时间增加了0.15 s，单次识别时间略微增加，符合3.2节时间复杂度分析，而性能有不同程度的提升，分别提升了2.1%和2.2%，体现了注意力机制残差模块的有效性。

表4 不同方法识别效果对比

为了体现本文方法所提取深度特征的可迁移性能，对Source_only方法和Attention-RDANN方法提取出来的网络深度特征进行了T分布随机近邻嵌入(T-distribution Stochastic Neighbour Embedding, T-SNE)降维和可视化，其中源域为20 dB干噪比的雷达欺骗干扰时频图数据，目标域数据干噪比为10 dB。将网络输出的512维的特征向量通过T-SNE降维至2维，归一化后的可视化结果图6和图7所示，其中不同颜色代表不同类型的雷达欺骗干扰样本。

图6 Source_only的T-SNE降维可视化

图7 本文方法的T-SNE降维可视化

通过图7可以看出，相比仅用源域训练，目标域测试(未迁移)的特征可视化结果中，本文方法在模型输出特征空间内两个域间各个类型的特征更好地对齐了，即通过域适应使得模型映射到可迁移的特征空间，将目标域不同类型的真实回波与雷达欺骗干扰数据较好地分类识别，体现了本文对抗适配迁移学习方法对于雷达欺骗干扰识别的有效性。

为了进一步验证本文算法对于雷达欺骗干扰样式分类识别的性能，需要评估该算法识别结果受干噪比的影响程度。设置源域为干噪比20 dB的数据，目标域数据的干噪比变化范围为10～20 dB。分别进行本文Attention-RDANN算法、未迁移情况Source_only方法与源域与目标域一致情况做对比，其中源域与目标域一致指两者特征空间无差异，得到识别结果如图8所示。每个实验取100次实验结果平均值。

图8 不同条件下的欺骗干扰识别性能对比

从图8可以看出，当源域与目标域干噪比一致时，识别率基本稳定在98%，有细微的波动，原因在于各个干噪比下的网络训练和测试数据一致，但各个干噪比下的训练数据间是不一致的，导致随机性引入了网络训练，不同训练集训练不同网络，故与理想状态识别率固定不变相比存在一定的上下波动。Source_only方法下，即不进行迁移，仅用源域数据训练，目标域数据测试情况，识别率普遍低于本文提出算法，且随着源域与目标域的干噪比差距越来越小，两者识别率越来越接近。相对于Source_only方法，本文经过域适应方法有明显提高，说明当需要识别的欺骗干扰数据集与网络训练欺骗干扰数据集有一定差别时，所提方法能够有效地改善识别性能。

5 结束语

本文提出一种融合注意力机制的雷达欺骗干扰迁移识别方法，该方法首先对雷达接收信号进行了时频分析；然后通过注意力残差模块网络对回波时频图进行特征提取，并利用标签预测器与域分类器间的对抗对特征提取器进行反馈训练，达到使网络适应目标域数据的目的，该方法训练不需要目标域数据的标签；针对不同的源域与目标域数据开展实验，实验结果表明，相对传统特征，深度特征具有更强的鲁棒性与可迁移性，将注意力机制与适配网络相结合，聚焦于图像关键区域，提高了模型的识别性能。然而该域适应方法仅关注了欺骗干扰数据深度特征的整体分布，忽略了深度特征空间和类别空间之间的相关性。如何克服域适应的负迁移现象以及进一步利用类别空间助力域适应，将会是下一步研究的重点方向。