李 军,夏春秋
(1.解放军91977部队,北京 102249;2.深圳市唯特视科技有限公司,深圳 518057)
辐射源个体识别(SEI)技术是指对信号细微特征进行提取,然后识别出信号来源个体的方法。辐射源的个体识别研究主要应用于2类:一类是雷达辐射源信号的识别;另一类是通信辐射源信号的识别。
传统的辐射源个体识别方法为:接收辐射源的发射信号,对接收的信号进行预处理后,以人工或经验方式提取信号的细微特征,再基于这些细微特征,采用阈值分类或者机器学习分类的方法实现对辐射源的个体识别。然而,传统识别方法的识别过程比较繁琐,并且对于一些复杂的信号识别效果不太理想。
随着人工智能技术的日益成熟,将深度学习应用于辐射源个体识别成为可能。本文将探讨如何将深度学习应用于辐射源个体识别。
辐射源个体识别方法的工作流程如图1所示。
图1 辐射源个体识别方法的工作流程
辐射源个体识别方法的关键3个过程为:
(1) 信号预处理;
(2) 信号特征提取;
(3) 信号识别。
其中,步骤(2)和步骤(3)可以采用深度学习的方法进行。
如果将原始信号数据直接送入神经网络进行训练,会带来大量冗余数据,增大网络训练与识别计算量的同时也会影响神经网络对深层特征的挖掘。因此,需要对原始信号进行预处理,得到辐射源的初始信号特征。
辐射源的初始信号特征可以概括为3类:一是基于信号统计参数的特征;二是基于信号变换域的特征;三是基于辐射源非线性的特征。
基于信号统计参数的特征主要有:时域参数特征、频域参数特征以及高阶统计量参数特征。基于信号变换域特征的信号处理方法包括:小波分析、时频分析、希尔伯特-黄变换以及固有时间尺度分解变换等方法。基于辐射源非线性的特征可以归为以下2类:一是建立基于发射机内部器件非线性的模型,这里的器件可以是单个器件,也可以综合考虑多个器件的相互影响;二是基于辐射源系统的非线性行为,主要利用相空间、分形理论等分析。
以下列出几种常见种类的初始信号特征:
(1) 时域特征:根据时间变量描述信号的变化情况,时域特征图如图2所示。在时域内对信号进行滤波、放大、统计特征计算、相关性分析等处理,统称为信号的时域分析。
图2 时域特征图
(2) 频率特征:大部分信号都可以用傅里叶变换转换成在不同频率下对应的振幅及相位,此种考虑信号或系统频率相关部分的分析方式称为频域分析。把信号的幅度或相位关于频率的变化关系用图来表示,就形成如图3所示的频谱图。
图3 频谱图
(3) 多项式拟合特征:对样本信号采样处理后,进行多项式拟合,得到一条能反应信号基本趋势的拟合曲线。多项式拟合特征图如图4所示,多项式拟合的方法是:求一条曲线,使数据点均匀分布在此曲线的上方或下方不远处。
图4 多项式拟合特征图
(4) 功率谱特征:功率谱表示信号功率随频率的变化关系。如图5所示,功率谱特征图中,一般采用横坐标为频率,纵坐标为功率。
图5 功率谱特征图
(5) 倒频谱特征:倒频谱是指信号的对数功率谱的逆,它具有时间因次,为了与通常频率的频谱相区别,有时称它为时谱。倒频谱特征如图6所示,其横坐标为时间。
图6 倒频谱特征图
(6) 循环谱特征:对循环谱函数估计样本频域特征参数,绘制循环谱图,循环谱特征如图7所示。
图7 循环谱特征图
(7) 边际谱特征:对希尔伯特(Hilbert)变换做积分,显示边际谱图,边际谱特征图如图8所示。边际谱可以处理非平稳信号,如果信号中存在某一频率的能量出现,就表示一定有该频率的振动波出现,也就是说,边际谱能比较准确地反映信号的实际频率成分。相比傅里叶变换,边际谱可以处理非平稳信号。
图8 边际谱特征图
(8) 稀疏表示特征:稀疏意为通过最小数量的系数尽可能多地描述信号的能量。稀疏频谱图如图9所示。
图9 稀疏频谱图
(9) 高阶谱特征:信号的二阶统计量特征是信号的瞬时特征统计量。如果信号具有高斯特性,则二阶度量工作正常。但是生活中很多信号是非高斯的,高阶统计特征能更好地反映信号的特征。谱中高阶随机过程的高阶累积量属于高阶统计量。在一二阶统计量无法获得的信号特征,可以采用更高阶的统计量提取有用的信号信息。高阶谱特征图如图10所示。
图10 高阶谱特征图
(10) 小波熵特征:熵是一个能够反映系统混沌程度的非线性动力学参数。信息熵是由信息论的鼻祖Shannon提出的,用于度量信息量,因此信息熵也被称作Shannon熵。熵的概念最初源自热物理学,因此熵的计算常常和能量联系在一起。本文所计算的小波熵,就是反映小波包分解后各子频带信号能量分布情况的特征量,是能量熵。对样本信号进行小波变换,求信号不同尺度上的能量分布,显示小波熵特征图。小波熵特征图如图11所示。
图11 小波熵特征图
(11) 混沌特性:关联维数是非线性动力学中一种重要的非线性特征量,用于对非线性动力学系统高维空间的自相似结构的复杂度进行定量表征。关联维数越大表示自相似结构越复杂。换句话说,关联维数反映了信号时间序列在高维空间下自身的结构相似性。常用的计算关联维数的方法被称为G-P算法。
可以将上述特征中的一种信号特征作为初始信号特征,或者基于任一信号特征进行特征变换后作为初始信号特征。甚至,可以把基于2种或2种以上的信号特征,进行特征融合后作为初始信号特征。
将1.1中得到的初始信号特征直接或者降维后作为输入向量,输入到训练好的神经网络中,提取辐射源发射信号的“指纹”特征。以下对辐射源个体识别方法中常用的神经网络模型进行简单介绍。
(1) 卷积神经网络(CNN)
卷积神经网络的结构元件包括:卷积层、池化层、激活层和全连接层。
卷积层是卷积神经网络中的核心部件。卷积层通过2个重要的思想来改进传统的神经网络结构,即局部连接和参数共享。
池化层也称为下抽样层,通常在卷积神经网络结构中,在连续的卷积层之间会插入池化层。通过池化层可以逐步减小卷积特征图的空间大小,以减少网络中的参数量。
激活层将卷积层或者全连接层现行运算的输出做非线性映射,为神经网络提供非线性能力。激活层通过激活函数来实现,常见的激活函数包括Sigmoid、tanh、ReLu等。
全连接层是卷积神经网络中另外一个线性运算的层,通常连接在卷积神经网络的尾部,用于构建分类器。
典型的卷积神经网络模型有AlexNet、VGG、GoogleNet、ResNet、DenseNet。近年来部分卷积神经网络模型的识别性能对比数据如表1所示。
表1 卷积神经网络模型的识别性能对比
在辐射源个体识别领域,卷积神经网络模型是目前应用和研究最多的一种模型。在实际应用中,可根据需要搭建不同层数的卷积神经网络模型,并设置合适的每层卷积核的数量与尺寸、激活函数、代价函数与梯度优化算法、Droupout比率、初始化方法,以获得最佳性能的神经网络模型。
(2) 循环神经网络(RNN)
循环神经网络循环处理历史数据,以及对记忆进行建模,并随时间动态地调整自身的状态,通常适用于处理时间和空间序列上有强关联的信息。
针对循环神经网络模型基本结构对长序列数据的记忆能力不强,并且当序列信号在网络中多次传递后有可能引起梯度问题,人们提出了长短期记忆网络(LSTM)、门控循环单元(GRU)等更加复杂的循环神经网络和记忆单元,使得循环神经网络模型可有效处理长序列信号。
(3) 深度波尔兹曼机(ERDRBM)
深度玻尔兹曼机由多层受限玻尔兹曼机叠加而成。文献[2]提出了一种用于辐射源信号识别的深度波尔兹曼机模型。通过仿真实验,证明该模型的有效性,但同时文献[2]也提出该模型存在计算复杂度较高等问题。因此仍需对该模型进行进一步研究。
(4) 混合神经网络
李立欣等人提出由卷积层模块、胶囊层模块和门控循环单元层模块组成的混合神经网络,以提取无线电信号的特征。
在基于深度学习的辐射源个体识别方法中,1.3与1.2通常一起集成在设计好的神经网络中。神经网络的最后一层设计为分类器,如softmax分类器,直接输出辐射源的类别。
实际应用中,针对不同辐射源信号识别的差异,如实际测试样本与训练样本之间的信噪比不同,需要对传统的基于深度学习的辐射源个体识别方法进行改进,以提高识别的精度。
在训练样本缺乏或为零样本的情况下,需生成样本以满足训练要求,即采用零-小样本学习的弱监督学习方法。零-小样本学习的弱监督学习方法具有多种,这里仅介绍几种典型的方法。
(1) 对抗训练
不同辐射源的细微硬件差异导致其发射信号的幅度与相位偏差一般是不明显的,因此容易受到噪声干扰而导致误识别。因此,引入数据生成思维,构建生成网络模型来模拟输入数据的样本分布状态,达到扩大训练样本总量和提高识别精度的目的。生成对抗网络(GAN)模型是一种基于机器学习的全新生成式模型,从结构上看,生成对抗网络模型由深度神经网络的生成器G和判别器D组成。
对抗训练的关键在于对抗样本的生成。对于一个训练好的用于分类的卷积神经网络,当输入向量叠加一个细微扰动Δ后,网络损失值最大对应的Δ即为对抗样本。此时的细微扰动Δ最容易使得原神经网络出现误判,因此需要以输入向量+Δ和真实标签对神经网络进行训练,提升神经网络识别对抗样本的性能,增强鲁棒性。
基于现有的样本生成对抗样本后,既可以解决辐射源识别中辐射源信号样本集小而影响识别效果的问题,也可以在一定程度上提升神经网络的抗噪性能。只有在信噪比较高(大于 16 dB)时,因为信号质量较好,对抗训练与不进行对抗训练的识别效果才会相同。
(2) 迁移学习
迁移学习(Transfer Learning)是一种机器学习方法,是把一个领域(即源领域) 的知识迁移到另外一个领域(即目标领域),使得目标领域能够取得更好的学习效果。
文献[4]提出了一种基于领域自适应的原理,通过设计迁移学习模型,将有标签单一信噪比下训练的神经网络迁移到无标签的其他信噪比下,达到可以有效识别不同信噪比信号的目的。打破由于噪声干扰造成的隔离,减弱传统辐射源识别算法对训练数据和测试数据的信道噪声条件一致的要求。
(3) 数据增强
数据增强的方法有多种,如:图像翻转、图像滤波、灰度变换等,从而使训练样本的数量增加多个甚至多倍。
由于辐射源发射信号的复杂性日益增强,利用单一的信号特征无法起到好的识别效果;为此,人们提出采用多特征融合识别的方法进行辐射源个体识别。
文献[5]提出分别将多种信号特征输入到多个神经网络模型中,获取多个预分类结果数据,再将多个预分类结果数据拼接后输入到分类器中,获取最终的分类结果。
文献[6]提出了一种基于多特征融合双阶段分类识别方法,利用神经网络初级分类器分别对多类特征数据集进行学习,得到多个初始分类结果;然后将多个初始分类结果同时输入到次级分类器中,完成最终的分类识别。
随着人们对神经网络的持续改进,神经网络的性能越来越好,识别精度越来越高。但与此同时,神经网络的网络深度和规模越来越大,由此带来参数大、功耗较大,且计算效率低等问题。因此,有必要设计低功耗的神经网络加速器。
现场可编程门阵列(FPGA)具有可编程和高可靠性等优点,已不断被尝试用来加速神经网络的运算。利用FPGA 并行计算的优势,研制基于FPGA的深度学习模型加速系统,可在保证模型运行效能的前提下实现小型化、低功耗的目的。
将神经网络部署到FPGA平台之前,可采用压缩技术对神经网络进行压缩。神经网络模型的压缩方法主要包括如下几种:参数剪枝、低秩分解、参数量化、知识蒸馏。
也可以将以上任一方法进行混合,来进行神经网络的压缩。
出于安全性考虑,在移动设备上,目前主要采用CPU+FPGA异构平台实现卷积神经网络的推理加速。图12是一种卷积神经网络加速器的架构图,该加速器的架构设计包括CPU处理器部分(PS)和FPGA 逻辑资源部分(PL)。因为卷积神经网络的计算密集层主要为卷积层和全连接层,所以在进行软硬件划分的时候,在FPGA上实现的主要是网络的运算。而CPU处理器主要负责对输入数据和参数进行预加载和分配,并执行对FPGA初始阶段的控制。
图12 一种卷积神经网络加速器的架构设计
越来越多的云服务商,在数据中心部署FPGA云服务器,提供云端面向深度学习推理任务的解决方案。这样,使得辐射源个体识别方法能通过网络迅速获取云端计算的识别结果。
出于成本和部署的便利性考虑,神经网络的训练逐渐转向云端,各厂商都展开了采用FPGA云服务器对神经网络的训练加速研究。例如,浪潮电子提出了一种深度学习模型的FPGA加速执行方法,实现将模型中的卷积核拆分到多个FPGA板卡执行计算,从而实现神经网络的加速。
本文主要总结了深度学习应用在辐射源个体识别方法中的情形和发展趋势。随着深度学习技术的进步,辐射源个体识别方法也在不断演化,人们不断尝试用新的神经网络模型进行辐射源指纹特征的提取,识别精度和识别速率等性能也在逐渐提高。毫无疑问,基于深度学习的辐射源个体识别方法应用于移动端和各领域会日趋成熟。