基于奇异谱分析和改进ResNet的射频指纹识别方法

2024-09-12 00:00:00凌浩然朱丰超姚敏立
现代电子技术 2024年5期
关键词:注意力机制

摘" 要: 针对当前真实场景下远距离射频指纹识别难以准确提取特征且实时性较差的问题,提出一种基于奇异谱分析重构信号和改进残差神经网络的射频指纹识别的方法。首先,将采集到的信号进行奇异谱分析,根据贡献率大小对原始信号进行重构,随后通过STFT获得时频谱图作为神经网络的输入:其次,构建轻量级残差神经网络,加快模型收敛速度;然后,在轻量级网络的下采样过程中引入混合维度注意力机制,对网络中间的特征图进行重构,强调重要特征,抑制一般特征;最后,使用激活函数Leaky ReLU替换原有的ReLU,避免在负值区域的梯度永远为0,进而导致模型训练无法反向传播。使用公开数据集POWDER⁃4BS⁃Iqsample验证实验后的结果表明,所提方法仅需要训练10个epoch识别精度就能达到87%,在保证识别精度的前提下缩减了时间损耗。与多种经典模型和算法相比,所提方法更加兼具识别精度与实时性。

关键词: 射频指纹识别; 奇异谱分析; 信号重构; 残差神经网络; 注意力机制; 激活函数

中图分类号: TN911.7⁃34" " " " " " " " " " " " "文献标识码: A" " " " " " " " " " " " 文章编号: 1004⁃373X(2024)05⁃0102⁃06

RF fingerprint identification method based on singular spectrum

analysis and improved ResNet

LING Haoran, ZHU Fengchao, YAO Minli

(Rocket Force University of Engineering, Xi’an 710025, China)

Abstract: In view of the difficulty in accurately extracting features and poor real⁃time performance in remote RF fingerprint identification in current real scenarios, a method for RF fingerprint identification based on singular spectrum analysis (SSA) and improved deep residual network (ResNet) is proposed. The collected signal is subjected to SSA, and the original signal is reconstructed based on its contribution rate. Then, the time⁃frequency spectrum is obtained with STFT and is taken as the input of the neural network. A lightweight ResNet is constructed to accelerate the convergence speed of the model. Then, in the downsampling process of lightweight networks, a mixed dimension attention mechanism is introduced to reconstruct the feature map in the middle of the network, which emphasizes important features and suppresses general features. The activation function Leaky ReLU is used to replace the ReLU, so as to avoid the constant zero gradient in the negative value region, which will further result in impossible backpropagation of model training. The results of the validation experiment on the public dataset POWDER⁃4BS⁃Iqsample show that the proposed method only requires training 10 epochs to achieve recognition accuracy of 87%, which reduces time loss while ensuring recognition accuracy. In comparison with various classic models and algorithms, the proposed method has both recognition accuracy and real⁃time performance.

Keywords: RF fingerprint identification; SSA; signal reconstruction; ResNet; attention mechanism; activation function

0" 引" 言

射频指纹是每个设备中由于各种电子元器件参数差异使得辐射的电磁信号带有的特有硬件特征,其如人的指纹一般是独一无二的,因此,可以通过提取射频指纹特征来识别高度相似的无线通信设备个体。近年来,随着各种用途的无线终端增长迅速,无线网络极易遭受非法接入,造成人们的财产和精神损失甚至危害公共安全,射频指纹识别也成为重要的研究热点之一。

传统的射频指纹识别方法主要通过接收瞬态射频信号或稳态射频信号,在时域或变换域提取信号的物理参数特征及统计特征,再利用分类器实现辐射源个体的识别。文献[1]提取信号的围线积分双谱值并使用支持向量机(Support Vector Machine, SVM)分类器进行识别。文献[2]提出使用功率谱密度指纹特征与智能分类器的识别方法。文献[3]通过优化后的星座图提取射频(Radio Frequency, RF)指纹,再通过二维识别算法进行识别。文献[4]利用时域射频独特的原生属性提取功率放大器的射频指纹。文献[5]提出一种利用瞬态信号特征并使用加权邻近算法(K⁃Nearest Neighbor, KNN)优化算法进行识别。文献[6]利用短时傅里叶变换并采用KNN算法进行分类识别。文献[7]提出用循环奇异谱进行信号重构并使用SVM实现射频指纹识别。但非常遗憾的是,在提取射频指纹特征时,这些基于传统特征工程的识别方法严重依赖基于经验设计的射频指纹特征以及信号的先验知识,结果缺乏普适性,且实时性较差,无法满足目前的现实需要。

受益于近年来计算机深度学习取得的巨大突破。作为深度学习领域最为经典的网络模型之一的卷积神经网络(Convolutional Neural Network, CNN),其主要优点是能够共享卷积核,对多维数据计算速度快,具有良好的特征抽取和分类识别效果,使得其最早被应用于射频指纹识别领域[8]。由于CNN在处理图像数据中优势明显,人们主要针对数据输入进行不断创新,包括对基带信号进行差分处理后映射为差分星座图[9],双谱估计后压缩双谱[10],Welch功率谱[11],融合功率谱、基于短时傅里叶变换的时频谱、互功率谱三种信号特征[12],文献[13]利用星座图和CNN实现了动态信噪比下的射频指纹识别。文献[14]将原始信号转换成频谱瀑布图输入到图像识别模型中进行识别。

此外,残差神经网络(Deep Residual Network, ResNet)由于其参数数量与计算量较小、训练速度较快,一直是进行此任务的最优网络之一。对抗神经网络[15]、元学习[16]、联邦学习[17]、孪生神经网络[18]等方法也逐渐被应用在射频指纹识别中。但远距离真实场景下的射频信号带有大量噪声致使特征提取困难的问题始终制约着分类识别的精度,且现有成熟的深度学习模型计算量大、训练收敛较慢,很难满足射频指纹识别的实时性要求。

对此,本文提出一种基于奇异谱分析重构信号和改进ResNet的方法。首先,将原始射频信号进行奇异谱分析,根据贡献率大小对信号进行重构,一定程度上消除噪声对于特征信号的干扰,随后通过短时傅里叶变换转为时频谱图制成数据集,同时对ResNet18模型进行轻量化处理,加快了网络的收敛速度;然后引入了混合维度注意力机制,对网络中的特征图进行重构;最后,使用激活函数Leaky ReLU(Leaky Rectified Linear Unit, Leaky ReLU)取代原网络中的激活函数ReLU(Rectified Linear Unit, ReLU),避免了对于小于0的值梯度永远为0,造成较多神经元“死”掉的问题。实验结果表明,通过上述改进措施可以在保证识别精度的前提下加快模型训练速度,兼具识别精度与实时性,验证了本文方法的优越性。

1" ResNet概述

理论认为加大网络模型的深度可以提高数据拟合能力,但实践证明网络随着深度的增加,精度达到饱和后出现下降。这使得传统的卷积神经网络在达到一定深度后无法通过增加网络层数来优化性能。本文采用残差神经网络作为射频指纹特征提取网络,其增加网络层数的具体操作方法是将恒等映射层叠加在浅层网络上构建出残差学习单元。残差单元(Residual block)结构如图1所示,通过学习残差将部分原始输入的特征信息经过映射后直接输入下一层,一定程度上减少了卷积层在信息传递时造成的特征丢失。实践证明,该网络不仅可以通过增加相当的深度来提高准确率,而且内部残差块的跳跃连接很大程度缓解了仅通过简单增加层数造成的梯度消失问题。

设输入为[x]时学习的特征为[H(x)],[F(x)=H(x)-x]为网络学习残差,则残差单元可以表示为:

[yi=xi+F(xi,Wi)] (1)

[xi+1=f(yi)] (2)

式中:[xi]与[yi]分别表示第[l]层的输入和输出;[Wi]为权重矩阵;[f(·)]表示ReLU激活函数。对于[L]层残差单元,从浅层到深层的学习特征公式为:

[xL=xl+i=lL-1Fxi,Wi] (3)

ResNet18的网络结构如表1所示。不算初始的7[×]7卷积层和3[×]3 max pooling层,整个网络模型主要由4个Layer组成,每个Layer又由2个残差块(Residual block)叠加而成。在最后的网络输出层并未连接全连接层而是通过Average Pool与Linear层相结合得到最终特征并映射到具体类别。

2" 基于SSA和LscSE⁃ResNet的射频指纹识别方法

2.1" 基于奇异谱分析的信号重构

SSA(Singular Spectrum Analysis)方法最早在海洋学研究中被提出并使用,由于它在信号降噪与重构方面具有巨大优势,自问世以来广泛应用于非线性时间序列的预测与信号降噪中。其本质是采用奇异值分解对序列进行处理分析,将原始序列中的大量信息分解到各子序列中,从而有效地对信号进行重构。由于真实场景下采集的射频信号中带有大量随机噪声,因此本文首先通过SSA算法对信号进行重构,方便后续的特征提取。其具体流程如下:

真实场景下采集到的射频信号一维序列可表示为:

[Xi=X1,X2,…,Xn] (4)

将之转化为[K×N]阶的轨迹矩阵:

[XMK=[X1,X2,…,XK]=X1X2…XN-M+1X2X3…XN-M+2⋮⋮⋱⋮XMXM+1…XN] (5)

式中[K=N-M+1],根据轨迹矩阵构造矩阵[S=XMKXTMK],对它进行特征值分析,获得[S]的特征值[λ1],[λ2],…,[λM]以及对应的特征向量[U1],[U2],…,[UM]。通过SVD的方法将轨迹矩阵[XMK]进行变换:

[XMK=X1+…+Xi+…+Xd] (6)

式中:[d=maxi(λigt;0)]为[X]的秩;[Xi=λiUiVTi]表示初等矩阵,[Ui]和[Vi]表示[S]的左特征向量和右特征向量,[λi]表示轨迹矩阵的奇异谱。

初等矩阵的维度和轨迹矩阵的维度一样,因此可以重构出[d]个一维矩阵,表示原始一维序列的趋势项、周期项、噪声等信号,较大的特征值对应的特征向量代表信号的趋势,较小的特征值对应的特征向量通常认为是噪声,从而实现对有用信号的分离。重构原理公式如下:

[yi=1iM=1KXM,i-M+1," " 1≤ilt;M1MM=1LXM,i-M+1," " M≤ilt;K1N-i+1M=i-K+1N-K+1XM,i-M+1," " K≤ilt;N] (7)

将重构后的一维信号通过短时傅里叶变换转化成尺寸为64[×]64的时频谱图制成最终的数据集,这样可以减少输入网络的数据量,减少训练的时间损耗。

2.2" 轻量化残差神经网络

本文提出了适用于输入64[×]64的时频谱图分类识别的14个权重层网络模型。模型使用了6个包含两层卷积层的残差模块,通道数随着特征图尺寸的减小而提升。修改后的模型复杂度明显降低,其能保持较高识别性能的同时又拥有较少的参数量。第一个卷积层使用大小为7×7的卷积核,滑动步长为2,然后配合窗口大小为3×3的最大池化,将特征图尺寸下采样到16×16。后面连接6个卷积核统一为3×3的残差模块,不同残差模块的特征图改变是通过步长为2的卷积层实现的。残差连接在与模块输出相加时需要维度匹配,要进行下采样操作,即在中途使用步长为2的1×1大小的卷积核组成的卷积层做下采样。其他的卷积层中,卷积核的步长均为1。

整个网络的具体参数如表2所示。

2.3" 融合混合维度注意力机制

神经网络中的注意力机制模块(Squeeze⁃and⁃Excitation, SE)已经广泛应用于多种场景,尤其是在计算机视觉领域,它的有效性和实用性已经得到广泛认可。

由此衍化出了混合维度注意力机制(Concurrent Spatial and Channel Squeeze amp; Excitation, scSE)[19],此模块由通道注意力模块(Spatial Squeeze and Channel Excitation Block, cSE)和空间注意力(Channel Squeeze and Spatial Excitation Block, sSE)模块组成。这两个子模块分别关注了通道信息和空间信息,分别在空间与通道两个维度先提取权重信息,再将权重信息同原始特征图相乘得到注意力增强效果,最后将两个维度进行信息整合增强,将两者的特征结果沿着通道维度进行相加,具体过程如图2所示。

在改进的网络中增加注意力机制模块可以抽取特征图中的重要信息,取得更好的识别效果。

对于ResNet,提取特征的最关键位置是在各个Residual block,在这里网络会进行下采样舍弃部分特征。因此,将scSE模块加入各个Layer之间进行注意力重构,可以承上启下发挥此模块的最大作用,融入了scSE模块的改进模型如图3所示。

2.4" 激活函数改进

激活函数在神经网络学习与理解复杂的非线性业务逻辑过程中发挥着非常重要的作用,它们将非线性特性引入到特定的网络模型中,使得神经网络具有拟合非线性情形的能力。

残差神经网络ResNet的隐藏层激活函数默认采用线性修正单元函数ReLU,其数学表达式如公式(8)所示:

[ReLU(x)=0," x≤0x," xgt;0] (8)

ReLU激活函数曲线见图4。从图中可以看出,ReLU函数比较简单有效、计算效率高且收敛速度快,但它存在神经元坏死的问题,即当输入小于0时,函数的梯度也变为0,模型无法进行反向传播,进而导致权重无法更新,即这部分神经元失去作用。

为了解决“Dead ReLU”问题且保持较快的收敛速度,文献[20]采用Leaky ReLU激活函数替代原有的ReLU激活函数,如公式(9)所示,它可以给所有负值赋予一个非零斜率来调整负值的零梯度问题,其对应的函数曲线如图5所示。

[Leaky ReLU(x)=0.01x," x≤0x," xgt;0] (9)

从图5中可以看出,Leaky ReLU通过把非常小的线性分量给予负输入(0.01[x]),这样既保留了在原有正值区间内ReLU函数的优点,强化了模型的表达能力,同时又在一定程度上避免了“Dead ReLU”问题。

3" 实验结果与分析

3.1" 实验环境

实验环境的硬件方面,CPU为Intel Xeon Sliver 4210R,内存为32 GB,硬盘为512 GB SSD,GPU为GeForce RTX 3090。软件方面,操作系统为Windows 11,开发环境为PyCharm 2022.2,基于Python 3.10与深度学习框架Pytorch 1.12.1设计、开发、训练和测试。另外,模型与数据均加载到GPU并通过CUDA技术完成运算加速。

3.2" 数据集

本文选用POWDER⁃4BS⁃IQsample数据集(https://repository.library.northeastern.edu),该数据集是由4台相同型号的USRPX310无线电在真实场景下距离接收机300~1 000 m处发出不同的波形,包括WiFi(IEEE 802.11ac)、3GPP 4G LTE和5G NR标准兼容帧,分别通过Matlab WLAN、LTE或5G工具箱生成。中央控制器采用B210SDR,可以从周围的4个发射机捕获传输的帧。对于WiFi,输入信号以5 MS/s的速度采样,中心频率为2.685 GHz;对于LTE和5G NR,采样速率为7.68 MS/s,中心频率为2.685 GHz。实验控制4台发射机在不同的两天内周期性地发送信号,接收设备记录设备标签及日期并以二进制形式存储数据,发送周期为512个IQ数据点。

本文主要利用4个发射机发射WiFi信号的数据来验证模型的有效性,将原始信号重构后通过STFT生成时频谱图,每台设备取1 000张图像作为样本,并将所有图片随机排序,训练集、测试集随机拆分,拆分比例为8∶2。

3.3" 整体流程与训练策略

整体算法流程如图6所示。

本文选用在工程实践中运用比较出色的算法Adam来优化网络模型,它是一种可以替代随机梯度下降算法的优化算法,能够基于训练数据不断进行迭代并更新神经网络的模型参数。

通过多次实验,当Batch_size取32时,仅需要对改进网络进行10轮迭代,精度就可以达到87%以上,学习曲线如图7所示。模型训练的超参数配置如表3所示。

3.4" 对比实验

为了验证本文方法的有效性与优异性,下面与一些经典网络模型和算法在同一数据集上进行比较,结果见表4。

经过对比实验,验证了本文方法在保证一定精度的前提下,较为明显地缩短了模型训练时间,证明了所提方法更具有针对性,强化了重要特征,取得了更好的实验结果。

3.5" 消融实验

按照Batch_size大小,按批依次读入数据,经过10个epoch迭代后,损失函数接近于0,为了检验对网络模型改进的有效性,设置消融实验,各方法结果见表5。

把ResNet18作为基础网络,依次单独融入scSE、Leaky ReLU时,相比基础网络,识别率都有所提升,融入scSE提升较为明显。通过测试,发现几种网络的训练时间损耗相差不大,而将措施同时作用于基础网络后,识别率提升较大,改善效果比较明显,验证了改进网络的有效性。

接下来,利用混淆矩阵评估文中模型对真实场景下远距离射频指纹识别各设备在识别过程中的混淆程度,混淆矩阵的详细结果数据如表6所示,数字0、1、2、3代表4台同型号发射机。

从统计结果可以看出,改进网络对于编号2、3两台设备的识别精度较低,分析原因发现这两台设备距离接收机较远且障碍物较多,影响了信号的采集。从整体来讲,改进模型对于真实场景下远距离射频指纹识别分类具有较低的混淆效果。

4" 结" 语

本文基于奇异谱分析和改进残差网络,提出一种真实场景下远距离射频指纹识别的方法,在保证一定识别精度的前提下有效解决了当前对于远距离射频指纹识别耗时较长的问题。实验结果表明,只需要将改进模型训练10次,对于真实场景下4台同型号设备远距离射频指纹识别精度能达到87%,在同等实验条件下比经典网络模型CNN、ResNet18具有更高的识别精度。相较于已有的经典方法,改进算法更加高效,具有更强的实用性。但目前对于较远距离的射频指纹识别精度仍不够高,后续将进一步研究更远距离、更多设备背景下的射频指纹识别,使算法性能更加高效。

注:本文通讯作者为朱丰超。

参考文献

[1] 贾济铖,齐琳.基于双谱的射频指纹提取方法[J].太赫兹科学与电子信息学报,2021,19(1):107⁃111.

[2] 李靖超,应雨龙.基于功率谱密度的通信辐射源个体识别方法[J].太赫兹科学与电子信息学报,2021,19(4):596⁃602.

[3] 袁建国,赵富强,覃陆祯玥,等.基于星座图对射频指纹识别方法的研究[J].半导体光电,2020,41(4):592⁃597.

[4] 陈翔,郝晓军,许雄,等.基于时域RF⁃DNA的功率放大器射频指纹识别[J].太赫兹科学与电子信息学报,2020,18(1):129⁃135.

[5] 田园,文红,何先定,等.基于瞬态信号特征的无人机数传电台识别研究[J].现代电子技术,2022,45(12):105⁃109.

[6] 李超群,王金明.基于短时傅里叶变换的无人机射频指纹分类识别[J].通信技术,2022,55(9):1202⁃1207.

[7] BALDINI G. Radio frequency fingerprinting based on circulant singular spectrum analysis [C]// 2022 International Symposium ELMAR. New York: IEEE, 2022: 85⁃90.

[8] RIYAZ S, SANKHE K, IOANNIDIS S, et al. Deep learning convolutional neural networks for radio identification [J]. IEEE communications magazine, 2018, 56(9): 146⁃152.

[9] WANG S, PENG L N, FU H, et al. A convolutional neural network⁃based RF fingerprinting identification scheme for mobile phones [C]// IEEE INFOCOM 2020: IEEE Conference on Computer Communications Workshops (INFOCOM WKSHPS). New York: IEEE, 2020: 115⁃120.

[10] DING L D, WANG S L, WANG F G, et al. Specific emitter identification via convolutional neural networks [J]. IEEE communications letters, 2018, 22(12): 2591⁃2594.

[11] 王检,张邦宁,魏国峰,等.基于Welch功率谱和卷积神经网络的通信辐射源个体识别[J].电讯技术,2021,61(10):1197⁃1204.

[12] 熊松磊,宋甜鑫,苏昱玮,等.基于多特征融合多任务的射频指纹识别方法[J].武汉大学学报(理学版),2023,69(5):545⁃552.

[13] 刘鑫尧,秋勇涛,皇甫雅帆,等.基于星座图和卷积神经网络的射频指纹识别[J].太赫兹科学与电子信息学报,2022,20(5):458⁃463.

[14] LIU D, WANG M J, WANG H. RF fingerprint recognition based on spectrum waterfall diagram [C]// 2021 18th International Computer Conference on Wavelet Active Media Technology and Information Processing. [S.l.: s.n.], 2021: 613⁃616.

[15] LIU X Y, WANG X D. Real⁃time indoor localization for smartphones using Tensor⁃Generative adversarial nets [J]. IEEE transactions on neural networks and learning systems, 2021, 32(8): 3433⁃3443.

[16] YANG N, ZHANG B N, DING G R, et al. Specific emitter identification with limited samples: A model agnostic meta⁃learning approach [J]. IEEE communications letters, 2022, 26(2): 345⁃349.

[17] REUS⁃MUNS G, CHOWDHURY K R. Classifying UAVs with proprietary waveforms via preamble feature extraction and fe⁃derated learning [J]. IEEE transactions on vehicular technology, 2021, 70(7): 6279⁃6290.

[18] MORGE⁃ROLLET L, LE ROY F, LE JEUNE D, et al. Siamese network on I/Q signal for RF fingerprinting [C]// Conference on Artificial Intelligence for Defense (CAID) 2020. [S.l.: s.n.], 2020: 152⁃158.

[19] ROY A G, NAVAB N, WACHINGER C, et al. Concurrent spatial and channel ′squeeze amp; excitation′ in fully convolutional networks [C]// International Conference on Medical Image Computing and Computer Assisted Intervention. Heidelberg, Germany: Springer, 2018: 421⁃429.

[20] 田娟,李英祥,李彤岩.激活函数在卷积神经网络中的对比研究[J].计算机系统应用,2018,27(7):43⁃49.

猜你喜欢
注意力机制
基于注意力机制的行人轨迹预测生成模型
计算机应用(2019年3期)2019-07-31 12:14:01
基于注意力机制和BGRU网络的文本情感分析方法研究
多特征融合的中文实体关系抽取研究
基于序列到序列模型的文本到信息框生成的研究
基于深度学习的手分割算法研究
从餐馆评论中提取方面术语
面向短文本的网络舆情话题
基于自注意力与动态路由的文本建模方法
软件导刊(2019年1期)2019-06-07 15:08:13
基于深度学习的问题回答技术研究
基于LSTM?Attention神经网络的文本特征提取方法