金 涛, 王晓峰, 田润澜, 张歆东,*
(1. 吉林大学电子科学与工程学院, 吉林 长春 130012; 2. 空军航空大学航空作战勤务学院, 吉林 长春 130022)
雷达辐射源识别[1]是电子战的一个重要组成部分和关键步骤,在完成信号截获和脉冲参数分析后,需要对信号进行进一步分析,以得到辐射源型号甚至是个体信息。传统的雷达辐射源识别方法需要手动提取并选取特征,比如文献[2]提出了基于多尺度信息熵的雷达辐射源识别方法;文献[3]提出基于脉冲角度特征的雷达辐射源识别方法来进一步提升识别准确率。这些方法过于依赖情报人员经验[4],并且在低信噪比时表现不足;另一方面,雷达技术的不断进步使得当前电子对抗侦察所要面对的电磁环境[5]日益复杂,时域、频域和空域交迭情况错综复杂,所以迫切需要探究适用于雷达辐射源识别的新方法。
为了探究替代传统雷达辐射源识别的方法,众多学者将机器学习引入雷达辐射源识别,如文献[6]提出基于时频图像纹理特征的雷达辐射源识别方式;文献[7]提出基于小波不变矩来进行辐射源识别,且都取得了不错的成果。但是机器学习存在模型普适性较差、难以识别有交迭的不完整数据、训练模型需要运用大量样本等问题。随着这些年深度学习在图像、语音识别[8-9]、自然语言识别领域的不断突破,如何将深度学习[10-15]运用到辐射源识别领域,从而有效提升识别效率和精度成为当前重点关注的问题。以往文献中,往往先将辐射源幅度序列转换为时频图像进行识别,如文献[16]将提取的时频图像放入埃尔曼网络中进行识别;文献[17]用栈式稀疏自编码器来提取特征并识别信号;文献[18]使用卷积神经网络进行雷达信号波形识别。将幅度序列转换为时频图像需要耗费大量的工作量,时频图像在低信噪比时识别效果也较差,因此无法应用于实际战场。
在此背景下,本文提出了一种基于改进一维卷积神经网络[19-20](one-dimensional convolutional neural network, 1DCNN)与时间卷积网络(temporal convolutional network, TCN)[21]的新型分类方法。相较于需要输入时频图像的方法,本文模型能够直接输入辐射源幅度序列。序列数据相较于时频图像,所需内存更小,因此不仅能够节省大量转换时间,而且能够同时处理更多数据。另外,本文模型还能够自主学习和提取特征,相较于人工提取特征的方法能够更加准确快速地提取信息,从而有效提升识别准确率和识别精度。
TCN是在传统卷积神经网络基础上进行改进和优化而得到的一种新型网络结构,主要是由卷积神经网络和残差[22-23]结构连接构成,同时引入因果卷积和空洞卷积[24]。因果卷积能够实现序列建模,空洞卷积能够在不增加池化层的前提下扩大感受野,并学习长序列数据。TCN的网络结构如图1 所示。TCN结构具有以下特点:
(1) 并行性:由于卷积神经网络每一层使用相同的卷积核,因此一个长序列输入可以用TCN并行处理;
(2) 灵活的感受视野:引入空洞卷积能够在不增加池化的同时扩大感受野,所以TCN网络拥有灵活的感受野;
(3) 可变的输入长度:TCN中加入了0-padding使网络能够输入不同长度的数据;
(4) 梯度较为稳定:不会因为不同时间段共享参数而导致梯度爆炸或者消失;
(5) 更小的内存训练:TCN里同一层卷积核共享,所以能够占用更少内存。
对于雷达辐射源识别来说,如何迅速准确地识别出信号是要解决的首要问题。相较于常见的神经网络模型,TCN能够做到保证准确率的同时更加迅速地识别辐射源信号,主要原因有以下3点:① TCN能够并行处理雷达辐射源信号,相较于常见串行处理数据的循环神经(recurrent neural network, RNN)、长短时记忆网络(long short time memory, LSTM)网络等,其速度更快。② 通常来说,网络层数越多,训练越复杂,识别雷达辐射源信号所耗费的时间越长。TCN采取空洞卷积,能够识别长辐射源幅度序列的同时减少层数的数量,进而缩短训练时间。③ 常用于雷达辐射源识别的RNN和LSTM等网络,采用逐层传递信息的方式,TCN采用残差连接,能够跨层传递信息,所以训练速度更快。
TCN一般采用ReLU激活函数[25],该激活函数确实能在一定程度上加快模型的收敛,但是ReLU激活函数在训练过程中是很脆弱的,很容易就会导致神经元坏死等问题。
为了解决这个问题,需要寻找一个代替ReLU的激活函数,常见的选择方向有指数修正单元ELUs或者参数化线性修正单元如Leaky ReLU[26]等。ReLU是将所有的负轴上的值都设为零,如图2(a)所示;ELUs在负轴上采用较小的指数函数代替ReLU负轴上的零值,使得负轴上的值能得以保留一部分,如图2(b)所示;Leaky ReLU是给负轴的值赋予一个非零斜率,如图2(c)所示,合理地选取斜率值不仅能在一定程度上增加模型在零点附近的拟合能力,还会降低模型过拟合的风险。
当向模型中输入辐射源幅度序列时,随着幅度序列的不断增长,会出现信息过载问题,为了解决这个问题,引入注意力机制[27]。注意力机制能够计算当前输入序列和输出的匹配程度,匹配度越高,网络也就越重视输入序列里面包含的信息。Attention计算得到的匹配度权重,只限于当前序列对,并不是整体权重,因此能够根据输入序列和输出的不同来变换权重。对于雷达辐射源识别来说,注意力机制能帮助深度学习模型将已经输出的辐射源信号类型与输入的辐射源幅度序列相匹配,并计算出相应的匹配度权重来帮助网络进一步提升整体识别准确率。对于易于漏选、错报的弱小信号,注意力机制也能够通过计算输入的弱小信号与输出的匹配程度,并计算匹配度权重来提升识别准确率。注意力机制的具体实现流程如图3所示。
一系列的<“键”,“值”>数据对构成“源头”中的数据,首先选定一个“询问”,通过计算“询问”和各个“键”的相似性或者相关性,并通过相似性的不同得到每个“键”对应“值”的权重系数,然后使用softmax将这些权重系数归一化处理,最后将“值”和权重系数进行加权求和,即得到了最终的注意力数值。
对于注意力机制而言,“询问”表示辐射源信号,源头中的“键”和“值”含义相同,就是输入的辐射源信号中每个信号所对应的权值。通过对辐射源信号进行加权求和,得到最后的注意力辐射源信号,从而使模型关注更重要的辐射源信息来更加快速准确地完成对辐射源信号的识别。注意力机制在辐射源幅度序列识别中采用自动加权方式,可以通过加权的方式将源模块ms和目标模块mt相联系。目前常用的计算方式为
(1)
(2)
式中:Wa、Ua、Va表示权值矩阵;mt和ms在辐射源识别中表示“辐射源信号”和“每个信号对应的权值”;dot表示点乘;general加入了参数Wa表示更通用的点乘;Concat表示拼接;perceptron表示感知机。
本文在原有TCN的基础上进行改进,同时引入1DCNN和注意力机制,模型结构如图4所示。本文的结构主要由一维卷积层、TCN层、Attention层3部分组成。
第一部分是改进的1DCNN,相较于常见的卷积神经网络,本文首先在第一层卷积层前加入批归一化层[28]来加快模型拟合速度,然后将ReLU激活函数替换为Leaky ReLU激活函数,最后在全连接层中加入权值初始化来加速训练过程。第二部分是TCN层,本文采用了两层TCN,并将其中的ReLU激活函数替换为Leaky ReLU激活函数来增加模型零值附近拟合能力。第三部分是Attention层,该层位于全连接层前,能够帮助模型提取关键特征输入到全连接层中,提高分类准确率。
卷积层1的卷积核数量为32,卷积核的时域窗长度为5,最大池化层的窗口大小为2;卷积层2的卷积核数量为16,卷积核的时域窗长度为5。时间卷积网络1的第一个卷积层的卷积核时域窗长度为5,卷积核数量为32,第二个卷积层的卷积核时域窗长度为5,卷积核数量为16;时间卷积网络2采用与时间卷积网络1相同的参数,这4个卷积层分别由两个残差网络连接;全连接层的参数设置为8,用来分类8种辐射源信号。为了防止过拟合,在网络中加入Dropout,大小设置为0.2。
步骤 1将数据输入到本文的网络之中。
步骤 2将读取的数据预处理后以14∶7∶9的比例分为训练集、测试集、验证集,并将其随机打散。
步骤 3将要分类数据的标签变成独热码的形式。
步骤 4设置datetime用来获取模型训练时间。
步骤 5本文采用Adam优化算法来快速得到最优解,避免模型达到局部最优解。初始学习率设置为0.001,最大训练轮数设置为50。
步骤 6在训练过程中验证集损失可能会先减后增,这是过拟合的一种表现。为了避免过拟合对实验结果产生影响,本文引入了早停机制,当验证集误差不再减小,且再经过3轮的训练仍不再减小的情况下提前终止训练,否则模型会完成50轮训练后再终止。
本文所要分类识别的雷达辐射源信号有8种,分别为调频连续波(frequency modulated continous wave, FMCW)、多相码(Frank,P1,P2,P3,P4)、二进制相移键控(binary phase shift keying, BPSK)和Costas。载频取值范围均为1~1.2 kHz,除Costas之外,其余7种信号采样频率为7 kHz。每个信号的参数如表1所示。
表1 信号的主要参数
根据实际信号特征,采用 Matlab 仿真生成实验数据,信噪比范围为-20~10 dB,间隔2 dB;各个信噪比下每类信号均产生2 000个样本,样本长度固定为1 024。实验采用的实验测试平台为Intel(R)Core(TM)i7-10750H,NVIDIA GeForce RTX 2070 super。本文的神经网络模型是在TensorFlow平台上所搭建的,学习框架采用Keras2.3.0,平台为PyCharm 2018.3.6 x64,编译器为Python 3.6。
实验 1本文所采用的网络是在TCN的基础之上进行改进,并引入改进的1DCNN和注意力机制得到的。首先分析引入注意力机制后对改进TCN识别辐射源信号的影响。本文的注意力结构放在时间卷积网络结构之后,加上Attention的结构图如图5所示。
这时网络结构变成N对N,因为要将多个特征输入到注意力层。本文所采用的是注意权值不共享的注意力层,从数据集中选取1 024个序列数据,将注意力层给这1 024个幅度序列数据分配的权重系数可视化如图6所示。从图中可以看出,当数据流入注意力层之后,注意力机制会计算已经输出的辐射源信号类型与输入的辐射源幅度序列的匹配程度,并根据匹配程度分配不同权重系数,在选取的1 024个序列数据中有3个数据与输出匹配程度较高,因此相应的权重系数较高。
TCN+注意力与TCN的准确率、损失和训练时间对比如表2所示。从表2中可以看出,加入注意力机制之后,TCN对于雷达辐射源的识别能力有较为明显的提升,但是模型训练所用时间大幅增长,这不符合雷达辐射源快速识别的要求。为了解决这个问题,在TCN+注意力网络之前加入改进的1DCNN帮助时间卷积网络提取特征来加速训练。下面分析加入改进1DCNN前后的影响。
表2 TCN加入注意力前后对比
TCN+注意力网络加入改进的1DCNN前后的准确率、损失、训练时间如表3所示,并在表3中对加入时间卷积网络的准确率、损失、训练时间进行对比。从表中可以看出相较于TCN+注意力网络,加入1DCNN之后,在准确率和损失基本保持不变的情况下,训练时间能够较为明显的缩短。对比CNN+TCN+注意力(CTA)网络与TCN,可以发现在训练时间基本一致的同时,CTA网络的准确率和损失明显优于TCN。
表3 加入改进1DCNN前后对比
为了对比不同激活函数对本文深度学习模型的影响,将激活函数ReLU、Leaky ReLU、ELUs分别替换到本文所用的深度模型中,其他参数保持不变,得到的结果如表4所示。从表4中可以看出,Leaky ReLU在准确率和损失方面对比其他两种激活函数有较为明显的优势,所以选择Leaky ReLU作为本文神经网络激活函数。
表4 使用不同激活函数的准确率和损失对比
实验 2为了进一步探究本文所采用的网络(简称为CTA)与本文网络中所用的TCN的优势,选取了采用相同参数的时间卷积网络与本文网络进行对比;同时,为了进一步探究本文所采用的深度学习模型对比常见深度学习模型的优势,选择经典的深度学习模型AlexNet[29]、VGG19[30]、ResNet18[31]进行对比。5种模型采用相同的数据集,得到5种模型在不同信噪比条件下识别准确率如图7所示,5种模型训练所用的时间、训练轮数、准确率和损失如表5 所示。
首先对比采用相同参数的时间卷积网络与本文所采用网络,可以看出,虽然TCN网络训练速度稍快,但是,本文所采用的网络模型相较TCN网络在准确率上有较为明显的提升。尤其是当信噪比处于-20~-10 dB的时候,本文所采用的神经网络模型明显优于TCN网络,这说明在低信噪比情况下,本文所采用的神经网络模型,能够更加准确地识别出雷达辐射源信号。
表5 5种模型训练情况
从图7中和表5中可以看出,相较于其他3种经典模型,本文所采用的神经网络模型,无论训练时间还是准确率方面都具有明显优势,这说明本文所采用的神经网络模型训练难度对比其他3种经典网络模型较低,更适合应用于雷达辐射源识别;AlexNet对比其他几种模型网络精度最低,虽然单轮所花费的时间较短,但是所需要的轮数较多,因此不适合用于雷达辐射源识别;ResNet18和VGG19对于雷达辐射源识别的准确度基本相似,但VGG19所用时间明显低于ResNet18;综合比较时间卷积网络和常用的经典网络模型,本文所采用的网络模型能够较好地均衡分类精度和时间,能够更加准确快速地识别雷达辐射源信号。
实验 3为了探究本文所采用的模型对不同雷达辐射源信号识别的能力。将本文训练得到的网络模型在不同信噪比下对8种辐射源信号进行识别。可以得到模型对8种信号在不同信噪比的识别情况如下图8所示。
从图8中可以看出,当信噪比高于-10 dB的时候,本文所采用的模型对于8种信号的识别基本可以达到100%,即使信噪比处于-16 dB时,模型对于8种信号的识别精度依旧能达到90%,能够基本满足模型低信噪比下对于信号识别精度的要求;当信噪比的值继续下降时,模型对于8种雷达信号的识别精度也会随之继续降低,当信噪比处于-20 dB时,可以看出Costas信号受到信噪比的影响最大,精度会降低到55%左右;P3码受到的影响最小,精度依旧会保持在77%以上;对于BPSK和Frank信号来说,当信噪比处于-20 dB时,识别准确率会降低到63%左右;对于其他4种信号识别结果将为均衡,都保持在72%以上。当信号的信噪比较低时,传入模型中的信息会包含大量噪声和干扰,这些噪声和干扰会被模型当作信号特征导入模型,所以当信噪比较低时识别精度会显著下降。
8种信号的整体混淆矩阵如图9所示。从图9中可以看出,绝大部分信号能够被准确的分类,能够明显看出一条清晰的对角线。对于这8种信号,在-20~10 dB信噪比下,平均准确率均能达到94.7%以上,能够做到较为准确的识别。从图9中也可以看出,P3和Frank信号受噪声影响相对较小,BPSK和Costas更容易受到噪声影响。
本文在TCN的基础之上,引入改进后的1DCNN和注意力机制,并且通过改进激活函数等方式进一步优化神经网络模型性能。引入注意力机制,将辐射源信号依照权重系数进行筛选,使网络更加集中于重要信息,能够有效提高模型对于辐射源信号识别准确率;加入一维卷积神经网络能较明显加快网络训练速度。通过仿真实验对比表明,对于8种辐射源信号,本文提出的网络结构能够做到快速准确的识别,有效地平衡了识别速度和识别精度。