许 全,谭守标,孙 翔,樊 进
(1.安徽大学集成电路学院,合肥 230000;2.安徽大学网络信息中心,合肥 230000)
特定辐射源识别是指从接收到的信号中识别单个无线电发射器,其主要是通过对雷达信号“指纹”特征分析,可以有效实现在调制类型和参数几乎相近的情况下,对不同雷达发射器的识别。在军事通信、电子侦察、战场网络态势感知等领域具有至关重要的作用。
文献[5]、[6]、[7]使用传统的特定辐射源个体识别技术,通过提取信号的某些指纹特征,并基于该特征成功实现了对特定发射器的识别。但是这些技术需要辐射源信号发射器的参数保持不变,并且对这些基本参数做到精确的测量与计算。由于CNN具备强大的特征提取能力和学习能力,一些学者已经将CNN应用在特定辐射源个体识别上,文献[8]提出将接收到的I/Q信号输入到卷积神经网络当中,来识别不同的辐射源个体;文献[9]提出首先通过快速傅里叶变换将获得的信号从时域变换到频域,然后利用一维卷积网络完成辐射源个体识别。单独使用CNN进行辐射源个体识别忽略了雷达信号的时序特征。与CNN相比,循环神经网络(Recurrent neural network,RNN)更适合用于处理时间序列。但是RNN也存在着难以处理远距离信息上下文依赖、梯度消失或梯度爆炸等相关问题。1997年,Hochreiter等提 出 了 长 短 期 记 忆(Long short time memory,LSTM)网络,LSTM单元由输入门、输出门和遗忘门三个部分组成,通过这个机制,LSTM解决了RNN所存在的问题,并在语音识别、文本识别等方面有着广泛的应用。
结合以上分析,CNN在空间特征的提取方面具有明显的优势,能够很好地提取出辐射源信号的波形特征,LSTM可以有效地提取辐射源信号波形时序上的依赖关系,本文将CNN与LSTM的优势结合,提出了一种新型辐射源识别方法,该方法直接将收集到的I/Q数据先送入1D-CNN网络进行空间特征提取,再将卷积后的数据送入LSTM网络。该方法减少人工进行特征变换的时间,并且适应了时序处理问题,有效提高了辐射源个体识别的精度与效率。
随着一维CNN网络的提出,越来越多的CNN被用于序列数据的处理。相比于将雷达信号从一维序列数据转换成二维图像数据,直接使用一维CNN网络对I/Q数据进行处理的方法不仅减少了人工处理信息的操作,而且保留了原始雷达信号的时间序列信息。
一维卷积网络的特性和计算规则与二维卷积相同。与二维卷积的区别之处在于输入数据的维数,以及特征检测器(或过滤器)如何在数据之间滑动。它的工作原理如图1所示。
图1 用于自然语言处理的一维卷积工作示意图
与其他CNN网络结构类似,1D-CNN模型也主要由卷积、池化、全连接三个部分组成。卷积层的主要作用是通过滑窗卷积运算提取上一层的输入数据中的局部特征。池化层的引入是仿照人的视觉系统对视觉输入对象进行降维和抽象。它实际上是一种降采样,本文采用的是最大池化,即选取每个小区域的最大值作为输出。全连接层在整个卷积神经网络中起到“分类器”的作用。
作为RNN的一种变体,LSTM通过可控门结构解决了RNN在训练过程中出现的梯度消失和梯度爆炸问题。LSTM通过在隐藏层中加入记忆单元来控制时间序列数据的记忆信息。信息通过几个可控门(遗忘门、输入门、输出门)在隐藏层的不同单元之间传输,从而可以控制先前和当前信息的记忆和遗忘程度。LSTM神经元结构如图2所示。
图2 LSTM神经元结构图
LSTM的计算如公式(1)~(6)所示。
一维CNN网络逐层捕捉雷达信号中的空间信息,并将最终得到的空间特征向量传递给LSTM。作为RNN网络的特殊变体,LSTM具自动存储和删除时间状态信息的能力,可以提取长时间序列的复杂特征关系。本文提出的基于1D-CNN-LSTM的辐射源个体识别方法的网络结构如图3所示。
图3 辐射源个体识别网络结构图
该结构主要由1D-CNN部分、LSTM部分以及分类输出部分组成,输入信号为雷达个体的I/Q采样信号,模型首先通过一系列的一维卷积层来提取雷达信号的图像特征,为了尽可能保留输入数据的时序特征,本文在1D-CNN与LSTM部分使用了Maxpooling操作取代了传统的Flatten操作,Maxpooling操作同时也有效降低了输入LSTM部分的数据的复杂度,加快了LSTM部分处理数据的速度。为了防止发生过拟合现象,本文还引入了dropout机制,通过随机丢弃神经元的权重,从而降低网络对某一单一神经元的依赖,实验结果证明该方法行之有效。LSTM部分由4层LSTM网络构成,充分提取出1D-CNN部分所忽略的时序特征,从而提高辐射源识别模型的精度,最后通过全连接层分类输出分类结果。
本文所使用的数据集是由实际辐射源中频信号经过采样组成,数据集中包含了38种不同的辐射源个体,共计77288条信号数据样本,我们从中随机抽取80%的样本作为训练集来训练1DCLSTM模型,其余的20%作为测试集。
本文实验的系统环境为ubantu18.04系统,主要硬件设备为i7-9700KF和NVIDIA GTX 2080。本文所实现的1DCLSTM网络是基于PyTorch搭建、训练与测试的。训练时,输入的数据长度为156,I/Q两个通道同时输入,采用微调的方式完成模型训练,我们使用Adam优化器完成,损失函数选择交叉熵损失函数,实验一共训练了1000个epoch。
为了确定网络的总体结构,实验首先设定Dropout=0.1,通过改变1DCNN部分与LSTM部分的隐藏层数量,将分类精度进行对比验证,结果如表1所示。
表1 不同隐藏层网络结构的Top-1分类结果
为了观察CNN卷积层所提取到的特征,我们将每一层的卷积输出进行可视化输出,如图4所示。
图4 卷积特征可视化图
从可视化的特征图中我们可以看出,随着卷积网络的加深,我们提取到的特征会越来越多,尤其是对于脉冲的上升沿与下降沿特征,卷积网络可以进行充分的提取。我们将卷积层提取到的特征输入到LSTM网络中,进行时间特征的进一步提取,并最终得到分类结果。
从表1中的结果以及图4的特征图可以看出,当模型深度太浅时,模型无法充分提取信号的特征,分类效果也欠佳,当网络模型只由一层CNN与一层LSTM所构成时,在测试集上的Top-1分类效果仅为88.21%。随着模型深度的增大,我们发现CNN与LSTM的隐藏层数量均为4时,Top-1分类效果最好,精度达到了95.34%。此后,无论是增加CNN隐藏层数量还是增加LSTM隐藏层数量,分类效果均不增反降,所以本文所采用的模型总体结构由4层CNN网络加4层LSTM网络所组成。
Dropout机制的引入有效地抑制了模型的过拟合,为了验证Dropout机制在本模型中的有效性以及确定合适的Dropout系数,本文在确定了模型总体结构后使用不同的Dropout系数对模型进行调整,结果如表2所示。
表2 不同Dropout系数对Top-1分类效果的影响
通过表2我们可以看出,引入Dropout可以有效地提升模型的性能,当Dropout=0.2时,模型在数据集上的Top-1分类效果最好,Top-1分类精度达到95.98%,与不引入Dropout所训练出来的模型测试精度相比,引入Dropout机制后,测试精度提升了1.15%。此外,我们还发现随着Dropout系数的增大,测试精度反而会出现一定程度的下降,这是由于随机丢弃了太多的神经元权重导致后续隐藏层学习到的特征不足,所以本文确定的Dropout系数为0.2。
为了验证上述模型在辐射源个体识别中有效性,本文将数据集分别送入1DCNN网络、LSTM网络中进行训练。文献[12]中使用包络提取算法首先将信号包络提取出来,并绘制成I-Q幅值图送入DDFN网络中训练;文献[11]中提出LSTM-FCN网络,将原始数据同时送入卷积网络与LSTM网络结构,并将输出特征进行融合得到分类结果。由于辐射源个体识别领域涉及敏感数据,上述文献中的方法所使用的源代码与数据集均无法获得。本文复现了上述文献中的实验,并在本地数据集中得到测试结果对比,如表3所示。
表3 不同网络模型的测试结果
通过表3中的数据可以看出,直接使用I-Q数据的一维处理方法的各项指标都要优于文献[12]中介绍的二维处理方法。而文献[11]提出的LSTM-FCN方法在辐射源个体识别中表现不佳,精度仅为92.56%。本文介绍的1D-CNNLSTM方法在Top-1分类精度这一指标上明显优于1DCNN和LSTM方法,比1DCNN模型、LSTM模型的分类精度分别提升了2.17%、1.65%。同时,在与1DCNN、LSTM模型测试速度的比较中,1D-CNN-LSTM模型的速度也没有出现明显的下降。
由于在实际的应用场景中,采集的数据中会包含各种不同类型的噪声,为了检验模型的抗噪性,本文还进行了不同信噪比(Signal noise ratio,SNR)下的分类识别的实验。实验中,我们在数据集中加入从0~20 dB每隔5 dB生成不同的高斯噪声。最终,不同信噪比下分类识别的准确率如图5所示。
图5 SNR对分类精度的影响图
从图5中的曲线可以看出,1DCLSTM模型拥有良好的抗噪声性能,即使在=0 dB的情况下,其分类准确率仍然可以达到81.36%,随着信噪比的提升,其分类效果也得到提升,在大于25 dB的环境中,分类精度可以达到95%以上,说明1DCLSTM模型完全可以在复杂的电磁环境中发挥良好的性能。
本文提出了一种基于一维网络的1DCLSTM网络模型,并将该模型应用于辐射源个体识别中,该模型可以同时提取辐射源个体信号的空间与时间特征,并取得了良好的分类效果。与其他模型相比,在一定程度上有效提升了分类精度,并能够实现复杂电磁环境下辐射源个体的识别。