基于特征降维和深度学习的电磁信号识别方法*

2023-06-05 00:49温雪芳姚金杰白建胜郭钰荣
舰船电子工程 2023年1期
关键词:码元降维子集

温雪芳 姚金杰 白建胜 郭钰荣

(中北大学信息探测与处理山西省重点实验室 太原 030051)

1 引言

随着无线通信技术的发展,电磁环境变得愈发恶劣并对电磁安全造成了一定的威胁。电磁信号识别对于作战环境、复杂电磁环境中对电磁目标设备(系统)异常行为的判断和预警具有重要作用,同时在空间频谱监测、恶意电磁攻击和电磁干扰识别等领域极具意义。不同的电磁信号数据具有不同的特征,为避免造成关键信息泄露和电磁信号入侵,需要及时对电磁信号进行识别。

目前国内外关于电磁信号识别的方法主要有两种,基于似然比检验[1~2]和基于特征提取[3]。前者需先验知识多,普适性差,计算量大[4];基于特征提取的识别方法的核心分类依据是提取的特征参数[5],具体是从接收信号中提取预定义的特征,根据特征值之间的差异性进行信号识别。用于进行特征分析的参数较多,除了常见的幅度、相位和频率[6]等特征,还有更复杂的参数如高阶累积量[7]、循环谱[8]、时频域特征[9]、IQ波形特征[10]等。常用的识别网络有人工神经网络[11],支持向量机(SVM)[12],聚类[13],生成对抗网络[14],径向基函数(Radial Basis Function,RBF)神经网络[15],二值化神经网络(Binary Neural Network,BNN)[16]等网络都被应用于信号识别中,且取得了不错的效果。另还有侯进等人提出一种基于复合神经网络的调制识别算法,利用CNN 网络和时频图进行识别[17]。袁莉芬等使用堆叠自编码器网络和高阶累积量实现了信号识别[18]。

基于原始信号直接进行深度学习计算量大,且特征物理意义不凸显,可解释性差;且电磁信号特征如何表征、如何选择也是影响深度学习效能的重要因素。本文基于特征降维和深度学习的电磁信号识别方法。先构建静态物理特征库,在具体识别的过程中先对这些特征进行降维处理,剔除对识别贡献小的特征,选择更加稳定和更具判别性的特征;然后利用深度学习强大的学习能力,构建电磁信号识别系统。

2 总体设计思路

因直接利用原始信号直接进行深度学习计算量大,且用于电磁信号识别的特征众多,如何选择合适的特征对电磁信号识别十分重要,所以引入特征降维来选取合适的表征特征。图像在深度学习中存在先进且强大的优势,将降维后的特征利用图像显示就很有必要。热力图,是一种通过对色块着色来显示数据的统计图表,所以热力图作为神经网络的输入。本文提出了基于特征降维和深度学习的电磁信号识别算法将特征降维、热力图与改进残差神经网络(ResNet50-A)相结合,达到准确识别电磁信号的目的。整体方案结构如图1所示。具体步骤表述为:1)特征提取。对每个数据进行40个静态物理特征表征,构建特征集。2)特征降维。使用ReliefF 算法获得优选特征子集。3)利用热力图构建数据集。通过热力图将上一步得到的特征子集转换为二维图像,作为ResNet50-A 的输入。4)模型训练。通过ResNet50-A 网络模型对第三步得到的数据集进行训练和测试,得到电磁调制信号的识别结果。

图1 整体方案结构图

2.1 静态物理特征提取

对电磁信号进行静态物理特征提取并构建特征集,包括13 个统计特征和27 个信号特征,编号1~40。其中统计特征包括:均值、方差、偏度、峭度、均方根、方根幅值、整流平均值、峰峰值、波形因子、峰值因子、裕度因子和脉冲因子[19]。信号特征即瞬时特征,是从信号波形中提取一系列信息,下面列出部分信号特征计算公式。

1)零中心归一化瞬时幅度之谱密度γmax[20]:

式中,Ns为取样点数,acn(i)为零中心归一化瞬时幅度,由下式计算:为瞬时幅度,而为瞬时幅度an(i)的平均值。

2)零中心非弱信号段瞬时相位非线性分量绝对值的标准偏差σap:

式中,at是判断弱信号的一个幅度判决门限值,c是在全部取样数据Ns中属于非弱信号值的个数,ϕNL(i)是经过零中心化处理后瞬时相位的非线性分量,在载波安全同步时,有:ϕNL(i)=φ(i)-φ0其中,φ(i)为瞬时相位。

3)零中心非弱信号段瞬时相位非线性分量的标准差σdp:

4)零中心归一化非弱信号段瞬时频率绝对值的标准差σaf:

5)零中心归一化瞬时幅度绝对值的标准偏差σaa:

6)瞬时幅度中心化并归一化后的峰度μa42:

7)瞬时频率中心化并归一化后的峰值:

式中fn(i)=f(i)/max{f(i)}。

8)P阶混合高阶矩特征:

式中,“*”表示信号的共轭。

9)高阶累积量特征[21]:

其中,k为分割的子集数,Uj表示k个子集中第j个子集元素的下标集。

10)根据各阶累积量还可以构造不同的特征参数如:

2.2 ReliefF特征集降维

ReliefF 算法利用信号特征与分类标签的相关性给特征向量赋予权值,权值越大代表贡献越大,并根据权值大小删除对贡献度较小的特征,达到特征集降维的目的[22]。特征降维不仅可以减少数据运算的内存消耗,还可以减少过拟合,提升模型的泛化能力。式(12)为样本总量为m的样本集中第i个样本权重系数的计算公式:

式中:W(fl)为权值集合,fl为第l个特征的权值;Hj为R与同类样本的间距;Mj(C)为R与不同类样本的间距;P(C) 为C在样本集中所占比例;D(fl,R1,R2)为R1,R2两类样本在特征fl上的距离。当fl连续时,有

2.3 特征矩阵二维化处理

热力图,是一种通过对色块着色来显示数据的统计图表。绘图时,需指定颜色映射的规则。例如,较大的值由较深的颜色表示,较小的值由较浅的颜色表示;较大的值由偏暖的颜色表示,较小的值由较冷的颜色表示。本文对降维后的数据特征采用特征矩阵二维化,转换为热力图,组成6×6,12×12,18×18,24×24,36×36,40×40 的电磁信号特征矩阵。为增加图像样本数量,采用滑动窗口的方法来遍历数据集,每类数据样本形成的热力图像个数=样本数/特征数量×3。热力图尺寸为224×224,分辨率为300dpi,符合ResNet50-A 的输入格式。

2.4 ResNet50-A残差神经网络

残差神经网络(ResNet)[23]通过跳跃连接构建了恒等映射H(x)=F(x)+x,其中H(x) 为输出,F(x)为输入,使得深层和浅层特征可以交互,解决了传统网络结构因堆叠卷积层深度,导致网络发生退化的问题[24]。ResNet 网络在图片识别中有着很好的应用。同样深度学习中提取特征时只需提取重要特征忽略不重要特征。而SENet[25]注意力机制可以增强重要特征抑制一般特征;其重点是获得输入进来的特征层每一个通道的权值。这样我们可以让网络关注它最需要关注的通道。所以考虑将SENet注意力机制和ResNet网络结合起来,构建本文的电磁信号识别的网络。

ResNet50模型在图片识别中效果很好,既可以通过预训练模型减少训练时间,降低过拟合,又可以使用较少的样本来训练,所以选择ResNet50 网络进行信号识别分类。ResNet50 划分为5 个阶段stage0-stage4[26]。网络结构如图2(a)所示。Stage0相当于输入的预处理部分:首先,将输入的图片进行卷积(Convolution,Conv)、批量归一化(Batch Normalisation,BN)[27]和激活函数ReLU 处理;然后进行最大池化层(Max Pooling)。将图像的大小缩小为输入尺寸的1/4。Stage1-stage4 均是由Bottleneck组成,结构相似,只是所含Bottleneck 个数不同。Bottleneck 由两个基本模块构成:Conv Block 和Identity Block,前者用于改变结构,后者用于加深网络。

图2 ResNet50-A的网络结构图

为解决减少训练时间和提高识别准确率的问题,引入SENet模块,减少参数,关注重要通道的特征,且Identity Block 模块的作用是加深网络,所以将ResNet50 中stage4 模块的第二个Identity Block模块由SENet 所代替。在保证热力图信息的有效提取下,本文提出基于深度学习搭建网络模型ResNet50-A 来完成信号识别。具体网络结构示意图如图2(b)所示。

3 实验验证

3.1 数据和实验环境

电磁信号产生采用可编程信号源(载波、码元信息可调),通过改变载波频率和码元信息输出多类型电磁信号。载波频率选取5 种:50MHz、80MHz、160MHz、300MHz、500MHz,通过发射天线向空间中辐射的不同类型的电磁信号,然后通过接收天线连接数据采集设备采集电磁空间中的信号,采样频率为50MHz,采样时间2ms。单类型载波电磁信号采集的数据点为50MHz×2ms=100000。

为了构建足够的数据样本,采用滑动窗口的方式对原始数据进行裁剪。采用滑动窗口裁剪信号具有避免数据冗余、减小计算复杂度的优点。对原始数据以50000 个点为一个滑动窗口周期进行保存,成为一个新的数据样本,2ms 单次采集的数据每次滑动642 个数据点间隔,共滑动保存80 次,保存数据并构建数据集。构建的数据集中的信号类型包括码元1、码元2、码元1 与码元2 混合和其他类,其中码元1、码元2、码元1、2 混合信号共有5 种载波类型,其他类信号包括5 个频段的通信信号,每一类样本数为5200,其中80%是训练样本,20%为测试样本。表1为本文中电磁信号的具体参数。

表1 各类型电磁信号参数

实验环境是Windows10,处理器为Intel(R)Gold 5188CPU 和NVIDIA Quadro P4000 GPU,基于python3.7,Tensorflow2.1构建分类模型。

3.2 特征集降维结果

采用ReliefF 算法分别计算特征集中编号1~40特征的权重系数,判断每类特征对分类的贡献度,结果如图3所示。本文共设置5个阈值并对应划分特征子集,5 个特征子集分别含有6 个、12 个、18个、24个、36个特征个数。

图3 特征权重图

3.3 特征矩阵二维化结果

40×40 电磁信号特征矩阵生成的热力图效果如图4所示。从图中可以看出对于不同类型的信号,二维化处理后的热力图存在明显差异,这有利于ResNet50-A网络进行深度特征提取。

图4 四类信号热力图

3.4 分类模型结果和分析

将5 个电磁信号特征子集和特征集构建的热力图作为输入送入神经网络中,采用SGD优化器进行训练,学习率采用自适应调整学习率,解决了学习率固定的弊端,范围设置为0.001~0.00001,一共进行500 次迭代训练,以损失函数值和准确率作为模型收敛性度量指标,选取最优的参数进行保存。

不同电磁信号特征子集的损失函数曲线如图5所示。图中epoch-train-loss6 表示6 个特征个数训练损失曲线,epoch-val-loss6 表示6 个特征个数验证损失曲线。由图5知:在网络训练迭代前50次损失值都较高,迭代次数超过50 之后损失函数值开始骤减,之后随着训练次数的增加模型逐渐收敛。

图5 不同电磁信号特征集的损失函数曲线图

不同电磁信号特征集的识别率随迭代次数变化的曲线如图6所示。由图6知,特征个数24、36、40 个电磁信号特征集的识别率曲线较为接近,最高识别率分别为96.67%、96.1%,95.75%,比特征个数为18的电磁信号特征子集最高识别率98.61%低2%、2.5%、2.86%,说明提取的特征中存在冗余信息,对识别效果没起作用或者在起负作用,所以特征降维后,不仅降低了计算复杂度,节省时间,而且可以提高识别率。但一味地降低特征维度不能很好地保证电磁信号的识别率,取特征个数为6和12的识别率较低,识别效果明显不好。选择合适的电磁信号特征子集很有必要,这里我们选择18 个左右的特征子集。

图6 电磁信号识别率对比图

基于信号识别准确率,选择以特征个数为18的特征子集,使用ResNet50和ResNet50-A网络,从训练时间和识别率方面进行对比,验证本文所提出的ResNet50-A网络的性能更好。

每一次迭代的训练时间使用两种神经网络的影响如图7,ResNet50-A 的训练时间为27s/epoch,ResNet50 训练时间为32s/epoch,明显ResNet50-A的训练时间比ResNet50 训练时间减少了4s,表明本文提出的ResNet50-A 网络在模型训练时间方面确实有效。表2为两种网络在不同迭代次数的信号识别率,由表可以看出迭代次数在100 轮之前改进网络的识别率不如ResNet50,但是100 次迭代之后识别率提升1.39%以上。由此可见,本文提出的改进的ResNet50-A 网络更适合于本文的电磁信号识别。

表2 不同神经网络对识别率的影响

图7 各模型训练耗时

4 结语

鉴于将原始数据直接利用深度学习进行特征提取时间长,可解释性弱的问题,本文基于提取静态物理特征和特征降维的方法选择具有解释性的最优特征子集,并利用改进的残差网络(ResNet50-A)通过挖掘特征子集的深度特征实现对电磁信号的识别。实验结果表明进行特征降维后节省了训练时间,而且提高了电磁信号识别率。并且对使用的网络和ResNet50进行对比,验证了网络的优越性。

猜你喜欢
码元降维子集
混动成为降维打击的实力 东风风神皓极
拓扑空间中紧致子集的性质研究
LFM-BPSK复合调制参数快速估计及码元恢复
连通子集性质的推广与等价刻画
关于奇数阶二元子集的分离序列
降维打击
基于极大似然准则的短猝发信号盲解调
每一次爱情都只是爱情的子集
抛物化Navier-Stokes方程的降维仿真模型
基于特征联合和偏最小二乘降维的手势识别