桂 冠,陶梦圆,王 诚,付 雪,王 禹
(南京邮电大学 通信与信息工程学院,江苏 南京 210003)
随着通信技术的快速发展,电磁空间成为越来越重要的资源,电磁空间中的信息生成、传递、感知和使用吸引了越来越多专家学者的注意,特定辐射源识别成为电磁空间感知的重要研究方向[1-2]。特定辐射源识别(specific emitter identification,SEI)是现代信息战中获取信息控制的重要手段之一[3],通过对接收到的辐射源信号进行特征测量与提取,与数据库中已有的辐射源信号先验信息进行特征匹配,从而判定辐射源类别的过程[4]。传统的SEI 方法如参数匹配法等识别速度快且易于实现,但这些方法依赖先验知识且泛化能力差。面对日益复杂的电磁环境与层出不穷的新型辐射源系统,传统的SEI 方法已无法满足识别性能的要求。
深度学习[5]是机器学习领域的一个重要分支,该方法是在人工神经网络的基础上发展起来的,能够通过函数变换学习从数据的原始形式学习数据的深层特征表示,在解决图像识别[6-9]与信号分类[10-13]问题方面已表现出极大的优势。因此,将深度学习引入SEI 领域成为了近年来学术界与工业界的热门研究方向。面向特定辐射源的深度学习方法(deeplearning-based specific emitter identification,DL-SEI)是离线训练出自动、有效的信号特征提取器(即深度神经网络),对输入信号样本提取细致、稳定的深层特征,免去人工提取样本特征过程,并在线识别不同辐射源,实现工程上端到端的高性能部署方法。
DL-SEI 可采用的深度神经网络包括卷积神经网络、递归神经网络、生成对抗网络等。Merchant 等[14]首次将多层卷积神经网络引入7 个Zigbee 设备及其复基带信号样本的识别中,证明了卷积神经网络可以有效区分不同的发射机,即使是相同类型和模型的不同设备也能得到有效识别。此外,Yu 等[15]提出了一种多采样卷积神经网络,利用多次下采样变换进行联合多尺度特征提取和分类,并实验验证了该多尺度特征的有效性。Yang 等[16]为了解决噪声环境下异常辐射源识别问题,提出一种降噪度量神经网络,该方法为原始信号施加人为噪声,并迫使网络重构噪声信号所对应的原始信号,使得网络具备噪声鲁棒性,此外还采用中心损失函数作为目标函数的正则化项,使得网络具备挖掘判别性特征的能力,在广播式自动相关监视信号数据集(automatic dependent surveillance-broadcast,ADS-B)和WiFi 数据集上取得了较好的异常辐射源检测性能。Fu 等[17]提出了基于度量对抗训练的特定辐射源识别方法,该方法将伪标签引入度量学习,使得度量学习不仅可以挖掘有标签数据的潜在信息,也可以挖掘无标签数据的潜在信息以实现判别性特征挖掘。此外,该方法采用了对抗训练实现泛化性特征挖掘,在ADS-B 数据集和WiFi 数据集取得了较好的识别性能。上述方法均将复基带信号作为深度神经网络的输入,还有学者将变换域信号作为深度神经网络的输入。Ding 等[18]和Peng 等[19]选取接收信号的降维双谱和差分星座迹图作为卷积神经网络的输入,并且仿真实验证明了这些信号表示方法的有效性。Peng 等[20]提出了一种基于热力星座轨迹图与切片集成方法来实现特定辐射源识别,并通过实验验证了方法的有效性。另外,还有一些基于循环神经网络的SEI 方法。Merchant 等[21]利用多卷积神经网络块从信号分割中提取空间特征,然后将这些拼接后的特征送入长短时记忆网络中进行进一步的时间特征提取。Wang 等[22]为了解决辐射源识别性能随时间下降的问题,提出了带迁移学习的长短时记忆网络。Gong 等[23]利用接收信号双谱的灰度直方图作为深度神经网络的输入并利用无线信道的先验信息,提出了一种基于信息最大化生成对抗网络的无监督辐射源识别。Yang 等[24]也提出了一种基于生成对抗网路的辐射源识别方法,该方法将小波变换后的信号分量作为输入,取得了比基于卷积神经网络的方法更好的识别性能。陈浩等[25]针对通信辐射源信号提出一种基于深度残差适配网络的辐射源个体识别方法,对带标签的源域数据和无标签的目标域数据进行训练,实现从源域到目标域上的迁移识别。普运伟等[26]针对雷达辐射源信号提出了一种结合模糊函数主脊坐标变换的卷积双向长短时记忆网络的识别方法,该方法不仅能提取信号的隐藏抽象特征,还具备良好的时效性和抗噪性能。
上述DL-SEI 能取得优越性能的关键在于存在大量高质量的信号样本可用于深度神经网络学习信号样本潜在特征分布,如表1 所示。Merchant等[14]使用了7 个Zigbee 的7 000 次传输的样本,每一次传输样本被分为17 段,在训练阶段所使用的样本数量达107 100 个。当样本数据量不足时,上述方法可能会出现过拟合等问题,导致难以获得预期的结果。由于电磁空间的开放性,虽然信号数据集很容易获取,但是由于开放电磁空间中存在噪声、干扰等,获取高质量的信号数据集仍然是非常困难的,并且随着无线通信技术的快速发展,新型辐射源正在不断涌现。此外,信号的注释、存储和管理需要耗费大量的时间、金钱和人力。至此,SEI 领域的研究热潮开始由深度学习向小样本学习转变,如图1 所示,如何利用少量信号样本获得具备鲁棒性、泛化性的深度识别模型成为了当前SEI 领域的研究难点与热点。
图1 辐射源识别技术的发展历程Fig.1 Development history of SEI methods
表1 基于深度学习的特定辐射源识别方法及其适用场景与识别性能Tab.1 DL-SEI methods applicable scenarlos and recognition performance
综上,面向特定辐射源识别的小样本学习方法(few shot learning-based specific emitter identification,FS-SEI)具有重要的研究意义与价值[27]。本文首先介绍了SEI 的应用价值和研究意义,接着对SEI进行信号模型、系统模型介绍与问题描述,然后按照有无辅助样本对FS-SEI 进行分类与现状综述,并选取了一些算法进行识别性能对比分析,最后分析了存在的问题和未来的方向,本文的整体架构如图2 所示。
图2 面向特定辐射源识别的小样本学习方法的综述框架Fig.2 Framework survey of few-shot learning methods for SEI
在SEI 方法研究中,通常假设存在K 个辐射源,一个接收机用于接收辐射源的电磁信号,每个辐射源的电磁信号均可以被独立的接收,每个辐射源的电磁信号可以表示为
其中:m(k)为信号样本复数据符号;m(t)为复基带信号;g(t)=q(t)*h(t);* 表示卷积操作;q(t)为发射脉冲成形;h(t)为信道的脉冲响应函数;n(t)表示加性高斯白噪声。具体地,A 为辐射源信号的幅度,f为发射信号载频的估计值,T 为信号符号周期,0≤ε <1 表示定时偏差。具体模型见图3。
图3 信号模型Fig.3 Signal model
辐射源个体差异体现在设备本身存在的非线性差异,SEI 通过提取接收的辐射源信号的非线性指纹特征,进行物理层面上的识别。DL-SEI 系统模型如图4 所示,在训练阶段,构建深度学习模型并调整模型参数,利用辐射源训练样本或辅助样本集训练深度学习模型,学习得到相关参数权重并进行保存;在识别阶段,接收端对接收到的辐射源信号预处理后,加载深度学习模型以提取出待识别辐射源信号的射频指纹特征,进一步完成辐射源识别任务。
图4 基于深度学习的辐射源识别系统模型Fig.4 System model of DL-based SEI
DL-SEI 可以定义为一个基于最大后验准则的多分类模式识别问题,
其中L(·)用来衡量预测类别和真实类别之间的差异。然而,PX×Y通常是未知的,因此深度学习算法通常将经验误差εem作为εex的近似最小化,可以写为
其中D 为训练数据集。此外,εex和εem之间的泛化误差为。如果要搜索的超参数空间W 太大,εge就会很大,而且很可能出现过拟合。为了使εge最小化,将对W 施加许多约束,以缩小超参数空间W,因此,上述问题可以写为
显然,D 中更多的监督样本代表了施加在W 上的更多约束,超参数空间将更小,这可能带来更好的泛化性能。
正如引言中所述,目前DL-SEI 问题需要在充足监督样本的情况下,对深度神经网络进行充分的训练以实现辐射源识别任务。然而,实际电磁环境是十分复杂的,各种自然与人为电磁活动纵横交织、密集重叠、功率参差不齐,往往难以获取充足且高质量的目标辐射源信号样本,更难以通过经典的深度学习算法实现泛化的深度学习模型,这也就是基于小样本学习的辐射源识别需要解决的问题。
2.2.1 无辅助样本的FS-SEI 问题描述
在FS-SEI 问题中,所采集的少量高质量辐射源信号样本可以表示为
其中N 代表辐射源设备个数。同样地,此时仍需要构建从样本空间到类别空间的映射,即fSEI(W):X→Y,以将输入信号样本x 分类为k={yi,i=0,1,…,N-1}。当可用于深度模型训练的高质量辐射源信号样本较少、且无其他相似信号样本集作为辅助训练集时,深度模型容易陷入过拟合状态,此时如何高效学习少量高质量辐射源信号样本以提升深度模型的泛化性与鲁棒性成为了研究重点与难点。
数据增强与高效学习是当前解决上述难点的有效思路。数据增强采取如裁剪、旋转、翻转、加噪等操作对训练样本集进行样本量扩充或者特征扩充,并将增强后的训练数据集用于深度模型训练,即
高效学习即对深度模型的训练过程施加额外约束以提升其特征挖掘能力
进而提升其识别准确率,其中:R(W)为约束项;λ 为约束系数。
2.2.2 有辅助样本的FS-SEI 问题描述
所采集的少量高质量辐射源信号样本可称为目标域数据集,在采用目标域数据集对深度模型进行训练之前,若有相似的、大量高质量辐射源信号样本(可称之为源域)可用于深度模型训练,使之获取一组较优的初始模型参数,促进目标域训练过程,本文将其称之为有辅助样本的FS-SEI。
与无辅助样本的FS-SEI 的不同之处在于,有辅助样本的FS-SEI 首先可以利用源域数据集产生一个源域识别模型,即
其中:XA表示源域样本空间;YA表示源域类别空间。若用DA表示源域数据集,则
其中DA中不包含目标域数据集中的样本类别,即YT∩YA=[29]。接着,有辅助样本的FS-SEI 在目标域数据集上对所获得的源域识别模型进行微调,该过程与有辅助样本的FS-SEI 相似,此处不予赘述,最终得到目标域识别模型。
数据增强、特征增强可对少量高质量信号样本量及特征多样性进行扩充,是解决小样本辐射源识别问题的有效方法之一[30]。此外,高效学习如度量学习可以充分挖掘有限信号样本所包含的数据分布信息,也是解决小样本辐射源识别问题的有效方法之一。数据增强、特征增强、高效学习可用于实现无辅助样本的FS-SEI 方法。接下来分别综述了基于简单数据增强的FS-SEI 方法、基于对抗样本增强的FS-SEI 方法、基于特征增强的FS-SEI 方法和基于高效学习的FS-SEI 方法。
3.1.1 基于简单数据增强的FS-SEI 方法
简单数据增强是指将信号数据进行时域转换、频域转换、时频域转换、加噪、切片、压缩、插值以实现数据量扩充。比如,时频域变换可通过
实现,其中:F [·]表示傅里叶变换;x(t)代表时域信号;F(ω)代表频域信号。
文献[29]提出了一种基于混合数据增强和深度度量学习的小样本辐射源识别方法,该方法采用由旋转和CutMix 组成的混合数据增强方法来增加数据多样性,并且利用深度度量学习提高特征判别性,该方法在ADS-B 和WiFi 数据集上取得了较好的识别性能。文献[31]提出了一种用于小样本辐射源识别的时序信号数据增强方法。首先,该文献设计了一个复值神经网络以实现基于同相/正交时序序列的通信设备识别;其次,该文献基于信号数据特性,分析并运用了几种简单有效的、符合电磁信号特性的时序序列增强方法,包括噪声扰动、幅度和时延变换、频率偏移和相位偏移;最后,该文献在ADS-B 数据集上验证了所提出的数据增强方法在小样本辐射源识别任务上的有效性。
基于简单数据增强的FS-SEI 方法的优点在于实现通常较为简单、复杂度较低、不需要占用很多计算资源,但是该方法没有充分考虑信号样本的通信含义与深层特征。
3.1.2 基于对抗样本增强的FS-SEI 方法
对抗样本增强是指利用生成对抗网络G 对服从噪声分布P(z)的噪声样本z 生成对抗样本G(z),然后将对抗样本与服从P(x)分布的训练样本x 混合输入判别器D,生成器与判别器之间形成公式(12)的对抗过程,判别器目的是对输入样本进行真假判别,生成器目的是生成“以假乱真”的人工样本,在不断的学习中两者达到纳什平衡。最终将生成样本与训练样本合并用于深度神经网络训练,使得模型学习到更佳的决策边界,从而提高模型的识别准确率。
文献[32]改进了生成对抗网络并将其与卷积神经网络相结合用于小样本辐射源识别,其中生成对抗网络的生成器可生成特定类的对抗样本,以扩展模型的可用特征量,从而提高辐射源识别效率与准确率。此外,该文献在小样本雷达辐射源和小样本通信辐射源数据集上验证了算法的有效性。文献[28]提出了一种基于类重构与对抗训练的小样本辐射源识别技术,其中的对抗训练通过向输入样本附加会使模型误判的细微干扰,不仅实现了样本量扩充,提升了识别性能,而且在训练过程中使模型适应这种对抗干扰,从而有效提升模型的鲁棒性。文献[33]提出了一种改进的四重生成对抗网络,用于增强原始四重生成对抗网络的4 个子网络之间的协作训练,并修改了原始网络的整体损失函数,包括表示模型和分类模型之间的对抗训练项及生成器的修正损失函数。该文献在两个不同的数据集上验证了所提出模型的优点和性能改进。
基于生成对抗增强的小样本辐射源识别方法采用一种无监督的学习方式训练,可以产生更加真实、清晰的样本,但也存在梯度消失、模式崩溃、训练不稳定等问题。
3.1.3 基于特征增强的FS-SEI 方法
特征增强是对信号数据的变换域数据如星座图、时频图等进行增强,或者是对信号数据输入深度神经网络后所得的某一层输出特征图进行增强。比如,文献[34]首先对雷达脉冲信号进行短时傅里叶变换,并将所得时频图矩阵转换为灰度矩阵,然后将向量化的灰度矩阵输入稀疏自编码器,采用图像增强算法对稀疏自编码器提取的特征进行了特征增强,使得特征间的差异更加明显,接着利用增强后的特征对增强条件对抗生成网络进行训练并得到生成网络,最后将该生成网络的生成特征样本与增强特征样混合并输入卷积神神经网络进行训练,有效提高了小样本条件下雷达辐射源个体识别的准确率。其中,该文献所采用的图像增强算法包括直方图修正法、灰度变换法、图像滤波法。
基于特征增强的小样本辐射源识别方法通过对输出的特征向量采用机器学习的方法处理,可以有效提高识别准确率,但其增强后的特征向量不具备工程和物理层面上的可解释性,并且在处理一些容易进行数据增强的样本时,特征增强的优势不容易体现。
3.1.4 基于高效学习的FS-SEI 方法
上述3 种无辅助样本的小样本辐射源识别方法都是从输入数据这一角度出发来提升模型泛化能力与识别准确率,从损失函数正则化、深度挖掘辐射源信号特征这一角度也可以提升模型泛化能力与识别准确率,本文将这种小样本辐射源识别方法称为基于高效学习的FS-SEI 方法。度量学习是高效学习的代表方法之一,比如中心度量损失,它是一种有效的度量损失函数,它能够约束类内紧凑,并且可以通过
计算得出,其中:xi表示某一类别中的样本;cyi表示该类别的样本中心,它是一个不断更新的样本向量。
文献[35]提出了一种基于优化孪生网络模型的小样本辐射源识别方法,该文献通过孪生网络实现了不同类别样本对特征向量距离增大、相同类别样本对特征向量距离减小的弹簧模型,提升了小样本辐射源识别的准确率与稳定性。文献[36]提出了一种多层次稀疏表示的小样本辐射源识别方法,利用带有通道注意力机制的多尺度卷积神经网络(convolutional neural network,CNN)进行特征提取,根据网络深度分为浅层特征与深层特征,并将原始信号与特征相连接组成多级字典,增加特征的完备性,弥补样本信号的不足,进行稀疏表示识别,能够在减少训练时间的同时提高辐射源识别准确率。文献[37]提出基于掩码自动编码的无监督预训练网络模型,通过从现有样本中学习数据生成信息来提高小样本下的辐射源识别性能,具体为:首先,将掩码处理后的辐射源信号数据输入自动编码器中,开展预训练使得自动编码器具备辐射源信号掩码段预测的能力;然后,使用辐射源信号数据及其标签以监督学习的形式来微调编码器与分类器。结果显示,在0~20 dB 信噪比的条件下,对仿真辐射源信号样本与真实辐射源信号样本进行识别时,与基于普通自动编码器的射源识别方法相比,该方法提高了识别准确率。
基于高效学习的FS-SEI 方法的优点在于能够提取出更具辨别性的特征向量以进一步提高识别准确率,但是这种方法极其依赖正则化项的设计,不恰当的正则化项会引起收敛速度缓慢,优化效果差的问题。
对于可以找到辅助样本的、且辅助样本所在空间与训练样本所在空间有一定相似性的特定辐射源识别任务,除了利用数据增强与高效学习提高模型的泛化能力,更直接有效的方法是利用辅助样本数据集对网络模型进行预训练,使得网络模型获得一组较好的初始化参数,然后利用训练样本对网络模型进行微调,使其泛化至目标任务上。度量学习与元学习是提高模型学习和概括能力的有效工具,二者已经被用于实现有辅助样本的FS-SEI 方法。度量学习可高效学习辅助数据集以获得一组更优的模型初始化参数;元学习可使得模型获得学会学习的能力,学习如何适应未来的相关任务。下文将分别介绍基于度量学习的FS-SEI 方法与基于元学习的FS-SEI 方法。
3.2.1 基于度量学习的FS-SEI 方法
度量学习(metric learning,ML)早期由Eric 等[38]提出,通过学习度量数据间的距离,减小相似对象之间的距离,扩大不相似对象之间的距离,得到最能表征聚类特性的特征嵌入空间。其中,深度度量学习大多数通过损失函数如式(14)—(16)中的对比损失[39]、三元组损失[40]、中心损失[41],对比损失LContrastive中当样本x1与x2属于同一类时,Y 为0,否则为1,从而达到缩小同类距离,扩大类间距离的效果;三元组损失LTriplet是对比损失的优化,缩小xan与正样本x+之间的距离,扩大与负样本x-之间的距离;中心损失LCenter可以解决三元组数据增加导致的网络收敛慢的问题,为每一类提供一个类中心c 以达到缩小类内距离的目的。深度神经网络通过添加度量损失函数辅助网络模型训练,从而提高特征嵌入层的聚类特性。
文献[42]基于度量学习与集成学习,结合交叉熵损失、三元组损失、中心损失,提取出信号中具有优判别性的特征,再通过集成分类器进行识别,提高了识别准确率与模型泛化能力。文献[43]搭建孪生网络分辨雷达信号叠加脉冲与正常脉冲之间的差异,从而对信号脉冲字符进行分类,所提出的深度模型在训练时的分类损失收敛较快,最终收敛至0.029 7,同时达到了97%的识别准确率。文献[44]提出了基于度量学习与元学习的改进原型网络,实现了雷达信号的开集识别,减小了雷达辐射源识别模型的训练与测试时间,该方法将闭集识别准确率提高了1%~6%,将开集识别准确度提高了4%~10%。文献[45]考虑了翻转、旋转、移位和噪声4 种数据增强的方法,以ADS-B 信号为基础,采用交叉熵损失、三元组损失和中心损失的混合损失函数对复数卷积神经网络模型进行训练。实验结果表明,数据增强辅助的小样本学习方法可以有效提高辐射源识别在小样本场景下的识别精度和鲁棒性。
基于度量学习的小样本辐射源识别方法通过使用人为定义的度量如欧式距离、马氏距离进行度量,或是使用神经网络训练度量,把特征约束到具有度量属性的空间中,优化模型拉近同类样本、远离异类样本的能力。然而,基于元组的度量学习方法需要一定数量的样本以构建元组,遍历构建元组会导致计算量增大,且元组构建不准确也会影响辐射源识别效果。此外,基于代理/锚点的度量学习方法会面临代理/锚点崩溃的风险,即当代理/锚点参数不足以代表特定类别的信号样本时,模型将会无法学习到判别性特征进而影响识别性能。
3.2.2 基于元学习的FS-SEI 方法
元学习的基本思想是希望机器学会“学会学习”的能力,即一种自主调整模型参数的能力,使其可以在旧任务的基础上迅速适应新任务。传统的机器学习和深度学习是在人为调参的基础上对某一特定的任务进行直接训练,其模型往往只适合当前的任务,在不同任务之间的可迁移性较弱。元学习则是先通过辅助训练集来构建多组学习任务并学习以获得一组较好的超参数,然后再利用目标任务对这组超参数进行微调,最终快速且有效地获取符合目标任务需求的深度模型。
文献[46]提出了基于元学习的特定辐射源识别方法,该方法利用复基带信号形式的辅助数据集构建了多组小样本学习任务,并通过元学习来学习这些小样本学习任务以得到一组较优的深度模型参数作为目标域训练过程的初始化模型参数,最后利用复基带信号形式的目标域数据集上微调模型的参数使其能泛化至目标域任务上,实现了小样本场景下的ZigBee 设备识别与无人机识别。文献[47]也提出了基于元学习的特定辐射源识别方法。不同的是,该方法利用变分模态分解和希尔伯特分析对接收信号进行预处理,得到希尔伯特时频谱并作为深度模型的输入。文献[48]提出了一种自编码器与元学习的无监督辐射源识别方法。首先,该方法利用希尔伯特-黄变换对原始辐射源信号进行预处理,得到其希尔伯特时频谱;然后,该方法将得到的希尔伯特时频谱输入改进的自编码器网络,得到能够表示辐射源信号隐藏特征的潜在向量;接着,利用密度峰值快速搜索聚类算法对潜向量进行聚类和标记,再通过改进的自编码器网络重构当前输入样本的潜向量与当前输入样本;最后,利用元学习算法训练辐射源识别网络,实现了小样本场景下的发射机识别。文献[49]考虑到了小样本场景下的开集识别问题,提出了一个基于元学习的特定辐射源开集识别方法。该方法对接收到的信号进行双谱分析和Radon 变换预处理,得到信号表示向量并将其作为深度模型的输入。该深度模型由一个深度特征提取器和一个内在特性存储器组成,可检测未知类别的信号,并对不同已知类别的信号进行分类。考虑到小样本场景下的辐射源识别,该文献进一步实现了基于元学习的深度模型训练与优化。实验结果表明,该方法在开放式场景下的性能优于其他先进的辐射源识别方法,且在低信噪比环境下仍具备有效性。
尽管基于元学习的FS-SEI 方法能够获得较高的识别准确率,但是其训练过程往往较为复杂,并且也存在着梯度不稳定的问题。
对于上文涉及的基于小样本深度学习的特定辐射源识别方法,下文从输入数据格式、神经网络、有无辅助数据集、是否进行数据增强、所识别的辐射源类型与类别数、训练样本数量与识别性能这几方面进行了对比与分析,结果如表2 所示。
表2 基于小样本深度学习的特定辐射源识别方法Tab.2 FS-SEI methods
本章节对小样本辐射源识别算法进行分析,选取了6 种算法进行实验验证。在无辅助样本的情况下,第1 种直接利用如表3 所示的复值卷积神经结构网络进行训练的方法“CVCNN”;第2 种在神经网络的基础上加上数据增强(旋转)的方法“Augmentation”。在有辅助训练样本的情况下,第1 种在复数卷积神经网络的基础上,利用辅助样本集Dau进行训练,并在训练集Dt上微调的方法“Finetune”;第2 种在损失函数中加入对比损失的度量学习方法“Contrastive”;第3 种在损失函数中加入三元组损失的度量学习方法“Triplet”;第4 种基于元学习的小样本辐射源识别算法“MAML”。
表3 复值卷积神经网络的结构及参数Tab.3 Structure and parameters of complex convolutional neural network
本文利用ADS-B[50]数据集进行实验验证仿真,该数据集的参数及各方法的辅助样本集、训练样本集与测试样本集如表4 所示,实验结果如图5 所示。由图5 可以看出,在无辅助样本集的情况下,数据增强方法对于性能有较大的提升,在有辅助样本集的情况下,度量学习与元学习在提高小样本辐射源识别性能上都是较为有效的手段。
图5 不同FS-SEI 方法的识别性能对比Fig.5 Performance comparison of different FS-SEI method
表4 ADS-B 数据集参数Tab.4 Parameters of ADS-B dataset
5.1.1 辐射源指纹产生机理无法精确解释
辐射源指纹特征的选取是特定辐射源识别的关键环节,辐射源指纹产生机理可以为指纹特征的选择提供重要依据。然而,目前的特定辐射源识别研究领域主要从辐射源射频信号的频谱特性、噪声特性、星座图特性等提取射频指纹特征,即只利用了指纹机理的表象,而非指纹机理的本质。缺乏对辐射源指纹产生机理的数学建模与数学解释,仅利用大量模拟或实测数据开展的基于深度学习的辐射源识别方法研究及其实验结果不具备一般性和普遍性。
5.1.2 射频指纹特征难以量化分析
深度神经网络虽然具有挖掘高维数据潜在特征的强大能力,但是经一系列卷积、池化、批标准化等操作所得到的射频指纹特征具有网络特异性,且此时的射频指纹特征实际上是一组数学矢量,不具备任何物理含义,更难以对其进行量化分析并形成通用标准,这成为了基于深度学习的辐射源识别方法的原理解释与应用推广的难点与痛点。
5.1.3 训练数据集与测试数据集的分布差异过大致使深度模型失效
目前在研究基于深度学习的特定辐射源识别方法的过程中,用于深度模型训练的电磁信号样本与深度模型测试的未知电磁信号样本往往采集于同一时间段与空间位置,二者分布相近,深度模型可以很好地由训练数据集泛化至测试数据集。然而,在真实的电磁环境中,二者是在不同时间和空间所采集的,因此二者的分布可能存在较大差异,此时基于深度学习的特定辐射源识别方法的识别性能会显著下降甚至可能完全失效。
5.2.1 数据增强方法的不可解释性
现有的辐射源电磁信号数据增强方法大多沿用计算机视觉里的图像增强方法,如旋转、翻转、平移、加噪等简单数据增强及基于生成对抗网络或对抗训练的数据生成方法。虽然已有相关实验证明了这些增强数据方法对小样本场景下的特定辐射源识别性能提升的有效性,但这些方法所生成的数据不具备通信含义,不具备辐射源射频信号特性。
5.2.2 对辅助数据集的依赖性
为了提升深度模型的泛化性,目前大多数面向特定辐射源识别的小样本学习方法大多采用了辅助数据集以获得一组较好的初始化参数,优化深度模型在目标特定辐射源识别任务上的学习效果。其中,辅助数据集与目标特定辐射源识别任务具备较高的相似性。然而,这样的学习过程使得小样本辐射源识别在一定程度上成为了一个伪命题。从根本上解决小样本辐射源识别问题,应当摆脱对辅助数据集的依赖。
5.2.3 开放世界中小样本训练集所含信息的差异性
基于深度学习的特定辐射源识别方法所提取的射频指纹特征有效性与模型识别效率由电磁信号训练样本量与样本质量、网络模型与参数优化方法等决定。在开放世界中,电磁信号样本训练集所含信息具有差异性,当样本量比较充足时,信息的差异性可以被有效地平衡,此时信息的差异性对深度模型的影响较小;但是,当样本量较少时,即在小样本辐射源识别问题中,开放世界中小样本训练所含信息的差异性会显著影响深度模型的优化过程,从而使得所提取的射频指纹特征有效性与模型识别效率下降。
当前的小样本辐射源识别研究大多是有监督学习范式的,没有充分考虑无监督场景。然而,在现实世界中,由于历史信号的未知性,难以通过数据预处理及样本打标签的形式进行有监督式的特征学习与分离。为了充分利用存在更加广泛的无监督数据样本,提高小样本辐射源识别模型的实用性,可以开展基于无监督、弱监督小样本学习的辐射源识别研究,将无监督对比学习、自编码器、生成对抗网络与小样本辐射源识别相结合,实现无标签注释的小样本辐射源特征提取与分类识别。
当前基于深度学习的小样本辐射源识别大多是使用批量学习技术,通过对整个训练数据集的学习一次性产生最佳预测器,但是在完成模型的训练后更新的周期较长,不会与之后的数据变化状况有任何互动,模型缺乏时效性。为了提高小样本辐射源识别模型对实时数据变化的敏感性,使模型能够根据实时反馈数据快速进行调优,利用实时预测的结果动态调整模型,提升小样本辐射源识别的准确性与时效性,可以开展基于在线小样本学习的辐射源识别研究。
深度学习模型训练方法通常假设数据分布是固定或平稳的,且训练样本是独立同分布的,因此当遭遇连续数据流时有着灾难性遗忘的普遍缺陷。为了克服灾难性遗忘,要求小样本辐射源识别模型既必须具有从新数据中整合新知识和旧知识的可塑性能力,也需要具有防止新输入对旧知识显著干扰的稳定性能力。为了在计算和存储资源有限的条件下,寻找稳定性-可塑性困境中效用最大的平衡点,可以开展基于增量学习的小样本辐射源识别研究。
目前,利用深度学习与深度神经网络可从辐射源电磁信号中学习数据特征分布与特征表示,这是面向特定辐射源识别的深度学习方法取得诸多进展的关键原因。然而,深度学习与深度神经网络的高度复杂性常导致人们难以理解模型的决策结果,即深度学习与深度神经网络的不可解释性,从而限制了模型的实际部署。为了提高小样本辐射源识别模型的可信度和可部署性,确保其公平性、隐私保护性、鲁棒性,说明输入到输出之间状态的因果关系,使模型透明化,完善深度学习在小样本辐射源识别领域的应用,亟需建立深度模型可解释性与辐射源可区分性机理之间的联系,推动基于深度学习的小样本辐射源识别的可解释性研究。
在日益复杂且开放时变的电磁环境中,大量的、高质量的辐射源电磁信号样本获取是十分困难的,FS-SEI 成为了当前辐射源识别领域的研究热点和难点。本文首先对DL-SEI 进行了简要介绍,阐述了辐射源识别的实际意义,说明了当前深度学习方法所面临的瓶颈问题,引出FS-SEI 的研究价值;然后,按照有无辅助数据集对FS-SEI 进行分类,并从数学角度对DL-SEI、无辅助数据集的FS-SEI、有辅助数据集的FS-SEI 给出了明确的问题描述;接着,综述了近几年国内外的FS-SEI 方法,同时对这些方法的数据集规模、识别性能等方面进行了比较;此外,在ADS-B 数据集上实验仿真了几种FS-SEI方法,验证并对比了各方法的有效性;最后,分析了FS-SEI 所存在的问题和未来的研究方向。本文旨在呈现FS-SEI 的研究思路与研究现状,期望该文能为该领域研究者提供一定的帮助,进而推动特定辐射源识别领域的发展。