陈一鸣,朱 磊,俞 璐,姚艳艳,张海波
(陆军工程大学,江苏 南京 210007)
随着无线通信的迅猛发展,辐射源的类别繁多且复杂,信号呈现出多样性,传统的辐射源识别方法可能已经无法满足社会的需求。为了得到通信实体的相关信息,研究人员们提出了不同的识别方法,效果也不尽相同。通信辐射源识别最关键的工作是提取有效特征。如果采用人工提取特征,由于信号数据量大,在提取过程中会遇到耗时、难度大、复杂度高等问题。如果能提取具有强区别力的信号本质特征,那么对后续分类器设计和识别性能的提升具有重要意义[1]。
近年来,深度学习方法在计算机视觉[2]、语音识别[3]和超谱数据分类[4]等领域都发挥着显著作用,成为众多分类方法的佼佼者。深度网络模型是通过不断训练提取数据样本特征,可以表达出复杂的非线性函数关系,得到数据丰富的本质信息[5]。利用深度学习方法不需要人工提取特征,计算能力强,设计者不需要太多的先验知识,容易入门。
为了提取强区别力的信号特征,深度学习的优势极为明显。深度学习不需要设计者储备太多的先验知识,也不需要定义提取的特征的实际含义,主要通过设计神经网络结构提取特征,实现后续的分类及其预测。人工神经网络借鉴生物神经网络的思想,通过设计大量的计算单元,以某种形式连接形成网络。通过对网络建立一定的数学模型和算法,训练出连接权值,使网络能够实现基于数据的模式识别、函数映射等带有“智能”的功能。基于深度学习的辐射源识别原理如图1所示。
图1 基于神经网络的辐射源识别过程
设X={x1,x2,…,xn}是数据库中的样本集合,Y={y1,y2,…,yq}是类别标签有限集,标签的数据往往远小于数据样本量。数据库中的历史训练数据是用已有的数据样本及其对应的标签投入神经网络,训练出较好的参数。在收到新数据后,将其也投入至设计好的神经网络,输出信息就是辐射源的类别信息。
神经网络中很多重要框架的建立和改进都完成于20世纪80年代中期和90年代初期。然而,要想获得较好结果,需要大量的时间和数据。由于当时计算机的计算和存储能力有限,神经网络的发展受到了一定阻碍,人们的关注度随之下降。直到21世纪初期,计算机的运算能力呈指数级增长,业界也见证了计算机技术发展的“寒武纪爆炸”。深度学习以一个竞争者的姿态出现,在计算能力爆炸式增长的10多年里脱颖而出,在许多重要的机器学习竞赛中拔得头筹。在通信辐射源识别研究中,深度学习是一种易入门、好理解的方法,对人工智能的发展进程影响不可小觑。下面将归纳辐射源个体识别和调制方式识别的研究现状。
深度学习在辐射源个体识别领域获得了成功应用。文献[1]将时域信号变换到二维时频域,并利用随机投影和主成分分析方法,分别从维持子空间和能量角度对时频图像降维;在预训练阶段,利用无标签的信号和类别信息训练网络参数;使用逻辑回归方法完成对辐射源的识别分类。文献[6]提出的是一种基于深度强化学习的辐射源个体识别方法,有效弥补了人工提取特征的不足。利用辐射源信号包络的不同瞬态信息,将包络前沿作为神经网络的输入,将辐射源类别作为输入状态的可选动作,通过卷积神经网络提取包络特征拟合Q值。对于深度强化学习的应用,提出了3种深度强化学习模型的实际应用,分别是深度Q网络模型、Dueling Network模型、深度双Q网络模型。文献[7]为提高通信辐射源个体识别任务中自编码器性能,提出了一种通信辐射源个体识别的自编码器构造方法。提取通信辐射源信号的高阶积累量,根据调制信息估计自编码器结构参数,最后由验证实验筛选性能满足阈值的结构参数存入参数信息库。文献[8]提出将深度学习的理论技术运用于实际,针对辐射源目标识别任务,将改进型AlexNet作为特征提取器,提取目标细微特征,生成效果较高的智能网络模型。文献[9]将原始通信辐射源信号通过高阶谱分析从时域转化到高维特征空间,利用大量的无标签高维样本训练出堆栈自编码器。在此基础上,通过少量有标签的通信辐射源样本对softmax回归模型进行精校训练,从而获得面向通信辐射源指纹特征提取的深度学习网络。文献[10]以深度自编码器为基础,训练过程分为无监督预训练、基于边际Fisher映射的有监督训练两部分。首先挖掘海量无标签样本中包含的电台个体类别信息,用于深度自编码器最优参数训练。其次,在有标签样本的辅助下,对训练参数进行基于边际Fisher映射的有监督精校,提高指纹特征对同类型电台个体的鉴别能力。文献[11]提出了一种多采样卷积神经网络(Multi-Sampling Convolutional Neural Network,MSCNN)来提取所选感兴趣区域的射频指纹,用于ZigBee器件的分类;提出了一种信噪比(Signal-Noise Ratio,SNR)自适应ROI选择算法,以改善ZigBee器件在睡眠模式切换下的半稳态性能。该神经网络采用多次下采样变换来实现多尺度特征的自动提取和分类。文献[12]使用深度学习检测物理层属性来识别认知无线电设备,并在IEEE 802.15.4设备上展示了方法性能。方法基于经验原则,即在符合相同标准的无线发射机之间制造可变性,在每个传输中创建独特的、可重复的签名,然后可以将其用作设备识别和验证的指纹。文献[13]提出了一种利用深度学习技术提高物联网安全性的无线设备识别平台。深度学习是一种很有前途的方法,可以通过学习不同射频设备的射频数据获得不同射频设备的特性。考虑3种不同的深度学习模型,即深度神经网络、卷积神经网络和递归神经网络来识别无线设备,用深度网络模型区分来自同一制造商的无线设备。文献[14]提出了一种新的基于深度神经网络的射频指纹识别方案,特别是基于长短期记忆的递归神经网络,用于硬件特征的自动识别和发射机的分类。使用相同射频发射机的实验研究表明,在存在强噪声(信噪比低至-12 dB)的情况下,具有很高的检测精度。
辐射源个体识别和调制方式识别,两者在深度学习方法上没有很大区别,但调制方式识别有公开数据集。大部分研究人员使用文献[15]提供的数据集,发展比较成熟,识别效果也较好。在研究辐射源识别的过程中,从解决调制方式识别问题上得到一些较成熟的方法和思想。
文献[16]综述了利用深度神经网络进行无线电调制识别的机器学习的进展。结果表明,无线调制识别不受网络深度的限制,进一步的工作应侧重于提高学习的同步和均衡能力。文献[17]提出了一种基于深度学习的噪声数字调制信号自动识别方法。通过在5~25 dB增加噪声水平,得到了6种不同调制的8位数据。该系统的一个显著优点是深度学习方法经过了原始数字调制信号的训练和测试,而不需要对信号进行任何特征提取。文献[18]研究了卷积神经网络对复杂时域无线电信号域的自适应问题,证明了利用深度卷积神经网络对大而密集编码的时间序列进行时间盲学习是可行的,特别是在低信噪比的情况下,是一种强有力的候选方法。文献[19]提出了一种基于深度学习的基于谱相关函数(Spectral Correlation Function,SCF)的自动调制分类方法,将深度置信网络(Deep Belief Network,DBN)应用于模式识别。利用具有抗噪能力的SCF信号和能够有效学习复杂模式的DBN,即使在存在环境噪声的情况下也能实现较高的调制检测和分类精度。文献[20]提出了一种基于低复杂度二值化深度置信网络(DBN)的深度学习方法,并结合噪声弹性谱相关函数作为自动调制分类(Automatic Modulation Classification,AMC)的特征表征机制,性能与常规DBN的性能相当。文献[21]利用卷积神经网络完成分类任务,将原始调制信号转换成具有网格状拓扑结构的图像,并将其提供给网络模型进行训练。文献[22]使用GNU radio生成一个数据集,该数据集模拟了真实无线信道中的缺陷,并使用了10种不同的调制类型,此外开发了卷积神经网络体系结构,并证明其性能优于基于专家的方法。
辐射源识别需借助各个通信辐射源发送的信号数据,通过物理差异进行识别,单纯采用软件模拟的数据集没有实际意义。针对辐射源识别这个课题,由于辐射源的多样性及研究问题的不同,好的公开可利用的标准数据集较少。辐射源识别仍需从几个方面进行改进完善。
要想神经网络模型的泛化能力得到提高,需要有较多的类别标签。然而,给数据打标签是一项繁琐的工作,工作量大、消耗时间多,效率大打折扣。由于各研究单位的情况不同,对数据的处理能力可能达不到较高的标准。因此,在实战化过程中,应该着眼于用尽可能少的标签表示数据,有效利用样本数据,最大限度地获得有用信息,增强实战化能力。
神经网络的训练需要足够的数据样本。首先,应定位自己对样本的需求,获取样本可以自己采集,也可求助于其他相关研究机构。如果没有足够的样本,将无法训练出较好的网络模型,分类和预测的准确率会变低。如何利用较少的已有样本训练出目标分类模型,提高辐射源识别能力,是进一步研究的重要方面。
神经网络有很好的非线性映射和学习能力,但存在陷入局部最优、过拟合、欠拟合等问题,没有较好的理论支撑,可以使用以下方法优化网络模型。
3.3.1 调整网络结构
调整网络结构是最直接有效的优化方式。虽然神经网络的输入输出信息可给出,但网络中的参数数量及权重有很大的调整空间。为了调整网络的复杂程度以达到最好的推广能力,可以采用加大网络训练层数、改变隐层神经元数量和权值、调整卷积核大小、改变过滤器数量等方法,同时要注意网络是否过拟合。恰当的参数配置可以在一定程度上提升识别效果。
3.3.2 借鉴集成学习思想
训练网络模型往往有侧重,得到的不可能是一个稳定的各方面都完美的模型。集成学习的中心思想是将数据投入到不同的分类器中,不局限于神经网络分类器,这些分类器的学习能力较弱。期望通过组合这些弱分类器模型得到一个强分类模型,提高分类效果。虽然集成学习能取得更好的学习效果,但需要满足两个前提条件:如在二分类问题中,每个弱分类器的分类准确率应略高于50%,否则会提高识别错误的几率;每个基分类器应该尽可能相互独立,否则分类结果相差过大,将无法有效体现集成的意义。这里提出两种集成方式:(1)决策级集成,即在每一个基分类器的输出阶段进行集成,投票决定识别结果;(2)特征级集成,即网络卷积阶段产生特征,将每一个基分类器的卷积层的输出集成,也就是把特征集成,集成后作为下一层的输入再进行后续训练。
3.3.3 借鉴多任务学习思想
多任务学习是机器学习的一个热门领域,不同任务可能会具有一定的相关性。利用这种相关信息,联合学习可能会得到更高的识别率。在调制方式识别问题中,多任务学习技术得到了很好体现。每一个任务的目标是区分两种调制方式。通过卷积层后,把几个任务联合学习,得到的识别效果更好。借鉴多任务学习思想再联合学习,可能提升会网络性能。
对于没有认证过的辐射源发送的信号,可将它视为非法设备,信号数据视为干扰信息。判断设备是否合法,门限值的选择至关重要,但人工很难设定较好的门限值。可以用分类器学习门限值,把信息熵作为分类的依据之一,提出以下思路:(1)设计单类分类器,即将训练数据的熵投入分类器训练,得到一个取值范围当作门限值,不在取值范围说明是未知信号;(2)设计二类分类器,即用软件生成随机信号,将随机信号的熵与训练数据的熵共同作为样本设计一个二类分类器,临界值可以作为上述问题的门限值。
将深度学习引入通信辐射源识别,推动了通信关系的智能化发展进程,通过深度学习算法识别所获取得的通信辐射源信号特征。比较分析不同的神经网络结构,尽可能地提高识别准确率,可以对无线电通信的管理和监测提供借鉴意义。与此同时,如今的电磁环境日益复杂,通信辐射源识别的难度也与日俱增,深度学习算法的优势得以体现。本文介绍了基于深度学习的通信辐射源识别基本原理,从辐射源个体识别和调制方式识别两个方面进行综述,指出了存在的主要问题和现有方法的不足,并讨论了解决方案和改进措施,为下一步的研究打下了基础。