魏 迪,曾海彬,洪 锋,马 松,4,袁 田
(1.中国西南电子技术研究所,成都 610036;2.北京跟踪与通信技术研究所,北京 100094;3.中国人民解放军63750部队,西安 710043;4.电子科技大学 通信抗干扰技术国家级重点实验室,成都611731)
随着电磁环境日益复杂的变化,各种有意或者无意干扰信号使得通信系统面临着严峻的挑战。为了保证通信系统在干扰环境下能够保持可靠工作,需要采取干扰防护措施[1-2]。在复杂的电磁环境中,一种干扰防护手段往往只能针对一种干扰类型,很难有干扰防护手段能够对抗所有干扰类型,不同干扰防护手段在对抗干扰的同时需要付出不同程度的代价[3]。为了保证通信系统保持稳定可靠的工作,以较小的代价实现有效的干扰防护,首先需要进行干扰类型识别。对干扰信号类型的识别,可以为系统决策最佳干扰防护手段提供重要的依据,是通信干扰防护系统的关键技术之一[4],具有非常重要的研究价值。
传统的干扰识别方法是基于特征提取的方法。文献[5]提出了一种基于支持向量机(Support Vector Machine,SVM)的干扰自动分类识别方法,首先从多个维度提取干扰信号的特征参数,然后构建决策树SVM进行分类,实现了干扰信号的自动分类。文献[3]提出了一种联合多维特征的干扰识别方法,首先从多个域提取多维特征,然后分别基于SVM和决策树作为分类器进行干扰识别。基于特征提取的干扰识别方法需要人工设计特征提取器,干扰识别的性能受限于提取的特征,导致干扰识别性能较差。
近年来,深度学习算法突飞猛进,其中卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Network,RNN)是两种经典的深度学习算法,在分类识别领域中具有较为广泛的应用[6-19]。文献[12]提出了一种基于卷积神经网络的干扰信号识别方法,主要利用Inception结构[8]构建卷积神经网络进行干扰识别。文献[16]提出一种基于深度卷积神经网络的干扰识别算法,该算法利用频谱瀑布图作为卷积神经网络的输入进行识别,可以实现对干扰信号的分类。上述基于卷积神经网络的干扰识别方法只利用了信号的频域信息,且对信号时序变化特征的提取能力不足,干扰识别性能不高。文献[18]提出了一种基于长短时记忆(Long Short-Term Memory,LSTM)网络的雷达干扰信号识别方法,将时频域序列作为网络的输入进行干扰识别,通过LSTM网络预测信号的类别。该方法仅利用了单个域的数据,仅从一个角度提取信号特征,特征提取不够全面,性能有待提升。
综上,本文提出一种基于LSTM网络和特征融合的通信干扰识别方法。所提方法基于LSTM网络优异的时序特征提取能力,提取输入信号的特征,克服了现有技术存在的特征提取性能不足的问题,提升了干扰信号特征提取的性能;所提方法提取信号的时域和频域特征后进行特征融合,使用全连接分类器进行分类识别,相比仅利用信号单域数据的方法,对数据的利用更加充分,提升了特征提取的完整性和干扰识别的性能。基于仿真实验的结果说明,在正确率为98%时,所提方法的性能相比于现有基于卷积神经网络的干扰识别方法[12]提升了6 dB。
常见的通信干扰信号分为单音干扰、多音干扰、部分频带干扰、线性扫频干扰、噪声调频干扰和脉冲干扰[3,12]。
采样后的接收信号是通信信号、干扰信号和噪声的叠加,记为
r(n)=s(n)+j(n)+w(n)。
(1)
式中:s(n)表示通信信号,j(n)表示干扰信号,w(n)表示高斯白噪声信号。
当接收信号中不存在干扰信号时,采样信号中只含有通信信号和噪声信号。本文将针对分别包含上述干扰信号和无干扰的共7种类型接收信号进行干扰识别研究。
本文提出一种基于LSTM网络和特征融合的通信干扰识别方法,其总体架构如图1所示。
图1 干扰识别方法总体架构
(1)预处理模块
将接收机接收的信号输入预处理模块,通过时域加窗、功率归一化和傅里叶变换等获得时域数据和频域数据。
(2)特征提取模块
特征提取模块含有两个分支,分别是时域特征提取支路和频域特征提取支路。将时域数据和频域数据输入特征提取模块,通过两个支路分别提取信号的时域特征和频域特征。
(3)融合模块
将时域特征和频域特征输入融合模块,通过特征拼接的融合方式得到信号的融合特征。
(4)分类模块
将融合后的特征输入分类模块,通过全连接分类器得到干扰信号的识别结果。
其中,特征提取模块、融合模块和分类模块共同构成一个完整的深度神经网络,预处理模块得到的时域数据和频域数据是深度神经网络的输入。
预处理部分主要包括时域加窗、功率归一化和傅里叶变换。首先对接收到的信道采样复基带数据进行时域加窗,然后进行功率归一化,将功率归一化之后得到的I、Q两路数据及其模值组成的三通道数据作为时域数据;最后进行长度为N的傅里叶变换,将得到的I、Q两路数据及其模值组成的三通道数据作为频域数据。时域数据和频域数据用矩阵分别表示为
(2)
(3)
式中:N表示时域加窗的长度,i=1,2,…,N表示信号向量元素序号的索引;T表示时域,F表示频域;I表示实部,Q表示虚部;A表示幅度值;XT表示时域数据,XF表示频域数据,XT和XF共同构成识别网络部分的输入数据。
特征提取模块由时域特征提取支路和频域特征提取支路组成,两个支路都通过基于LSTM的特征提取网络来提取信号的特征。
LSTM是一种特殊的循环神经网络,传统循环神经网络的隐藏层只有一个状态,对短期的输入非常敏感,LSTM在隐藏层中增加了一个状态ct,用来保存长期状态。相比于传统循环神经网络,LSTM增加的状态ct可以保留长期的记忆信息,对时序信息的学习更加完整,具有更好的性能表现。LSTM单元的内部结构如图2所示,其输入和输出的关系为
图2 LSTM单元结构
ft=σ(Wf[ht-1,xt]+bf),
(4)
it=σ(Wi[ht-1,xt]+bi),
(5)
(6)
(7)
ot=σ(Wo[ht-1,xt]+bo),
(8)
ht=ot⊗tanh(ct)。
(9)
如图3所示,所提基于LSTM的特征提取网络由1个数据分割层和3个LSTM层组成。特征提取网络的输入是预处理部分得到的时域数据或者频域数据,输入数据的尺寸为2 048×3。首先,数据分割层将输入数据按顺序滑窗分割成多个子矩阵,滑窗窗口尺寸为8×3,滑窗步长为4×1,滑窗分割可以得到511个子矩阵,然后将每个子矩阵都拉成向量,得到511个向量,记为input_i,i取1~N,N表示滑窗得到的向量总数。特征提取支路含有3个LSTM层,每层由511个LSTM单元组成,LSTM单元中隐藏层节点长度为64。然后,将数据分割层得到的511个向量分别输入到第一个LSTM层的511个LSTM单元中,第二个和第三个LSTM层的输入分别是前一个LSTM层的输出。最后,将第三层最后一个时间节点的特征作为该特征提取支路的输出,该特征包含输入数据中蕴含的复杂特征。
图3 基于LSTM的特征提取网络结构图
在特征提取模块中,时域特征提取支路和频域特征提取支路都通过基于LSTM的特征提取网络提取特征,分别得到时域特征和频域特征。
融合模块将时域特征提取支路提取的时域特征和频域特征提取支路提取的频域特征进行融合。由于信号的全部特征存在于信号的时域和频域中,仅从时域或者频域提取特征会出现部分信号信息的缺失,特征提取不够全面,因此有必要充分挖掘数据中蕴含的信息,通过同时提取时域频域特征并进行融合的方式来获取干扰信号的特征。所提方法采用特征拼接的方式进行特征融合,公式表示如下:
Ffusion=[Ft,Ff]。
(10)
式中:Ft表示时域特征;Ff表示频域特征;Ffusion表示融合特征,融合特征的向量长度是时域特征长度与频域特征长度之和。将时域特征和频域特征进行特征融合,可以提升信号特征提取的性能,提升干扰信号识别的性能。
分类模块将融合特征输入全连接分类器对干扰信号进行分类识别。首先,将融合特征输入第一个全连接层和激活函数层,该全连接层隐藏节点个数为64,输出特征为feature1;然后,将feature1输入第二个全连接层,该全连接层隐藏节点个数为7,与干扰信号的类别个数相等,输出特征为feature2;最后,将feature2输入到Softmax激活函数中进行归一化,得到分类置信度向量,向量长度为7,归一化后向量中各元素之和为1,每个元素值代表对应类别的预测概率。
本文通过仿真分析所提方法的干扰识别性能,采用加性高斯白噪声(Additive White Gaussian Noise,AWGN)信道,使用BPSK调制信号,扩频增益为1 023,根据表1所示的干扰信号参数构建干扰信号数据集。训练数据集信号的干信比(Jamming-to-Signal Ratio,JSR)为20~50 dB,间隔10 dB,干噪比(Jamming-to-Noise Ratio,JNR)为-10~20 dB,间隔2 dB,每类干扰信号在每种JSR和JNR下的样本数量为100。验证数据集和测试数据集信号的JSR为20~50 dB,间隔10 dB,JNR为-20~20 dB,间隔2 dB,每类干扰信号在每种JSR和JNR下的样本数量为50。
表1 信号类型和参数
模型的训练和测试过程采用Keras深度学习平台,使用Adam优化算法,学习率设置为0.000 1,数据集训练次数epoch设置为100,在训练过程中保存对验证集测试精度最高的模型。
本文通过各类别识别正确率和总体识别正确率对干扰识别算法进行评估。各类别识别正确率是该类干扰信号识别正确的样本个数与测试样本总数的比值,总体识别正确率是各类别识别正确率的平均值。此外,通过比较两种算法达到相同总体识别正确率时的最小JNR差值,可以量化算法性能提升的程度。
为了评估所提方法的识别性能与训练数据集样本数量之间的关系,本文通过构建多个样本量不同的训练数据集对所提方法进行训练,并根据训练结果确认最佳的训练样本数量。将N0定义为训练数据集中每类干扰信号在每种JSR和JNR下的样本数量。首先,按照表1的信号参数,分别取N0为10,20,30,…,150,构建15个数据集。根据3.1节的叙述,各数据集样本总数量等于448与N0的乘积。然后,使用这15个数据集分别对所提的干扰识别网络进行训练。最后,分析验证集总体识别正确率与训练样本数量之间的关系,结果如图4所示。通过图4可以看出,当N0小于100时,正确率先快速上升,然后在波动中缓慢上升;当N0大于100时,正确率基本不再提升,此时模型已经收敛。因此为了减少不必要的时间代价和存储代价,后续实验均将N0设置为100。
图4 识别性能与训练数据集大小的关系
在训练过程中,所提方法的误差函数值和总体识别正确率的关系如图5所示,其中,图5(a)表示训练集误差函数值与验证集误差函数值曲线图,图5(b)表示训练集正确率与验证集正确率曲线图。通过图5可以看出,当epoch<20时,训练数据和测试数据的误差函数值快速降低,正确率快速增加;当20≤epoch<85时,训练数据和测试数据的误差函数值和正确率都有小幅度的波动;当epoch≥85时,训练数据和测试数据的误差函数值和正确率都趋于平稳,此时模型已经收敛。
(a)误差函数值曲线图
为了评估所提方法的特征提取模块和特征融合模块对识别性能的影响,本文构建了6种不同的模型,分别对其训练后通过测试识别正确率评估模型的性能。6种模型使用的结构参数如表2所示。VGG网络是一种经典的卷积神经网络,本文将基于VGG网络的提取特征方法与所提基于LSTM网络的提取特征方法进行对比,分析LSTM网络对识别性能的影响;将仅提取时域或者频域特征的方法与提取时域频域特征后融合的方法进行对比,分析特征融合对识别性能的影响。通过仿真分析,计算各个模型的总体识别正确率与信号JNR的关系,如图6所示。
表2 各个模型的结构参数
通过图6可以得出,T-LSTM的识别正确率比T-VGG高,F-LSTM的识别正确率比F-VGG高,TF-LSTM的识别正确率比TF-VGG高,说明基于LSTM特征提取方法比基于VGG方法的识别性能高,因此基于LSTM方法的干扰信号特征提取能力优于VGG;F-VGG的识别正确率比T-VGG高,TF-VGG的识别正确率比F-VGG高,F-LSTM的识别正确率比T-LSTM高,TF-LSTM的识别正确率比F-LSTM高,说明基于频域特征融合方法的识别性能优于单个域的识别性能。综上可知,基于LSTM的特征提取方法和时域频域特征融合方法都可以提升干扰识别的性能,因此本文最终采用基于LSTM的特征提取网络和时域频域特征融合的方法进行干扰识别。
为了评估所提方法的识别性能,将所提方法的干扰识别正确率与干噪比的关系进行分析,并与SVM、BP神经网络和CNN方法[12]对比。
所提方法的各类型识别正确率如图7所示。通过图7可以得出,在JNR≥-12 dB时,无干扰和单音干扰的识别正确率约为100%;在JNR≥-10 dB时,多音干扰和噪声调频干扰的识别正确率为100%;在JNR≥-8 dB时,所有干扰类别的识别正确率均为100%。
将所提方法各类型识别正确率取平均值,即可得到总体识别正确率。其他方法采取相同的方式计算得到总体识别正确率,各种方法的总体识别正确率结果如图8所示。通过图8可以得出,传统的SVM方法和BP神经网络方法的识别正确率较低,CNN的识别正确率较高,所提方法的识别正确率最高;SVM方法在JNR≥0 dB时正确率大于等于98%,BP神经网络方法在JNR≥2 dB时正确率大于等于98%,CNN方法在JNR≥-2 dB时正确率大于等于98%,所提方法在JNR≥-8 dB时正确率就已经大于等于98%。综上,所提方法的识别正确率优于其他方法,在正确率为98%时,相比现有最优的基于CNN的干扰方法性能提升了6 dB。
图8 所提方法与其他方法的总体识别正确率对比
本文针对复杂电磁环境下的干扰识别问题,提出了一种基于LSTM网络和特征融合的干扰识别方法。所提方法利用LSTM网络构建特征提取支路提取信号的特征,克服了现有技术特征提取性能不足的问题,提升了干扰信号特征提取的性能。采用时域特征提取支路和频域特征提取支路分别提取时域特征和频域特征,并将时域特征和频域特征融合后进行分类识别,克服了现有技术仅利用信号单个域作为神经网络的输入造成的信息利用不充分的问题,提高了干扰识别的性能。仿真表明,在正确率为98%时,所提方法的性能相比于现有的基于卷积神经网络的干扰识别方法提升了6 dB,是复杂电磁环境下一种有效的干扰识别方法。
后续将研究基于深度神经网络的混合干扰信号分类方法。