黎仁刚,侯坤元,冷鹏飞,姚 群
(中国船舶重工第723研究所,江苏扬州225000)
雷达信号识别是电子对抗及电子侦察中的重要环节,在电子战中具有十分重要的地位和作用。只有充分掌握敌方雷达的信息,才能赢得现代战争的主动权,从而占据电子战领域的制高点,这就使得雷达和通信信号调制识别成为现代电子侦察系统中重要的研究方向。国内外的信号调制识别方法分为:基于准优化对数似然比的调制方式识别算法[1]、基于信号瞬时特征量识别、基于循环谱分析的识别算法[2]、基于高阶累积量识别[3]等。随着近年来人工智能技术的快速发展,深度神经网络在各个领域大放光彩,包括自然语言处理、图像分类等。深度学习擅长发现高维数据的潜在结构和模式,而且需要较少的领域知识,省去了大量提取特征的时间。其中卷积神经网络(CNN)被证明在数据的深层次特征提取、表示构建方面有很好的效果。
最早在神经网络信号调制识别分类器中,特别是在CNN分类器中,一般根据CNN对图片识别的原理,对接收到的信号进行预处理,生成循环谱图或者星座图[4]等,并将生成的图形作为CNN网络的输入,通过卷积层和子采样层交替进行对循环谱图或星座图的特征提取并完成自动识别。2016年,Oshea提出了利用CNNs的框架对通信信号中的11种调制信号进行自动调制识别[5],并且是对接收信号的原始采集数据进行自动学习分类,相比于传统的机器学习算法,识别率有了很大的提升。利用信号的循环谱特征识别方法是早前比较受欢迎的识别方法,因为每一个调制信号的循环谱都是不一样的,所以可以根据信号的循环谱中峰值个数排列方式等特点来对不同的调制信号进行识别[6-7]。
本文基于一维卷积神经网络1DCNN(1 Dimension CNN)对电子侦察系统接收到的中频数据进行信号调制样式识别。
本文采用的电子对抗软件无线电结构如图1所示,天线接收到的射频信号经过接放大和与本振混频后下变频为中频信号,中频信号经过A/D采样,采样后的数据进行预处理送入卷积神经网络进行调制样式的分类识别。
图1 电子对抗系统结构框图
本文采取9种调制类型分别为:雷达脉内调制BPSK和QPSK、线性调频信号、非线性调频信号、通信BPSK和QPSK、FSK、ASK、16QAM。雷达信号辐射功率变化范围大,信号带宽范围很大。通信信号发射功率较小,信号带宽较窄。
设定射频信号载波频率变化范围为2~3 GHz,码元速率为10 kbps~1 Mbps。噪声环境是10 dB高斯白噪声。对于通信信号用升余弦滤波器做基带脉冲成型,升余弦滚降系数α=0.5,根据奈奎斯特准则可知,基带传输中码元速率最高是信道带宽的2倍,所以设定滤波器带宽为2.5MHz。
本文仅对通信BFSK信号的预处理方法进行阐述,其他调制信号的预处理方式类似,不予赘述。BFSK是二进制频移键控(binary frequency shift keying)的简称,这种调制方式通过键控正弦载波的频率传输二元符号。
BFSK信号是利用2个频率f1和f2的正弦载波传送符号 1、0,表述如下[8]:
式中,T b表示传送一个比特数据的时间,容易看出,BFSK信号是2个频率的正弦波交错组合,可以表示为:
式中,A是载波振幅,m(t)是符号序列{an}的单极性NRZ基带信号是幅度取反信号,这表明BFSK可看作2路互补的OOK信号叠加。
对于通信信号数字调制而言,在频带调制前需要经进行脉冲成形,为抑制码间串扰采用升余弦滤波器作脉冲成形处理,基带脉冲成形如图2所示。
图2 基带成形滤波
对基带成形后的信号进行载波调制,选取载波频率为2.5 GHz,调制结果如图3所示。
图3 载波调制
接收机处理后的中频信号含有大量噪声,应采取有效办法降低噪声对分类识别结果的影响。同时中频信号含有多种载频参数,这些参数并不是调制识别的有效信息,所以应进行预处理将其消除,提高识别结果的准确度同时避免训练样本数过大的问题。本文采取小波去噪方法进行软降噪处理,并对中频数据做共轭差分自相关和快速傅里叶变换(FFT),将得到的幅频响应和相频响应的数据做简单处理后送入神经网络模型进行训练。
1.2.1 信号去噪
本文采取小波变换的方法对信号进行硬阈值小波去噪[9],小波去噪的流程图如图4所示。
图4 小波去噪流程图
对含有加性高斯白噪声的BFSK信号去噪,结果如图5所示。
图5 小波去噪后中频信号
1.2.2 延迟自相关处理
由于接收机接收的中频信号含有载频分量,对于调制识别而言,载频分量是无用信息,若送入神经网络中训练会增加网络训练的复杂度且需要大量样本,因此预处理过程中要消去载频参数。如图6所示,考虑将复信号与其共轭信号差分相乘,对复信号进行A/D采样后做共轭差分自相关,见式(3):
式中,N表示延迟自相关的点数,与信号采样率有关。采样率越高,延迟点数越对应时域信息越多。A、f、θ表示在2ASK、2FSK、BPSK调制中幅度、相位、频率 ,A∈(A1,A2),f∈ (f1,f2),θ∈ (θ1,θ2)。
共轭相乘即消去载频参数,延迟差分运算将后一个码元信号和前一个码元信号部分相乘,前后码元相同时自相关函数为常复数Ae-j(fN+θ),当前后码元不同时延迟相关函数表现调制信息。对于幅度和相位信号,共轭差分自相关处理后将不携带载频信息,对于频率调制信号共轭差分自相关处理后表现信号有不同频率即FSK信号。
图6 码元序列延迟
对于雷达LFM和NLFM信号,它们的频率一直在变化。延迟自相关信号如式(7)~(8)所示,其中f0表示初始频率,k表示调频斜率。
以BFSK信号为例,首先对BFSK信号进行希尔伯特变换得到复信号,即:
式中Hirbert(·)表示希尔伯特变换。
不同调制方式本质的区别体现在载波的幅度、相位、频率信息上。本文采用3 GHz采样率,自相关延迟128点后结果如图7所示,只在不同码元变换处产生形状畸变,体现不同码元间频率、幅度、相位的不同,所以差分自相关后的复信号包含调制的相位、幅度、频率参数,且自相关数据携带的调制信息表现为局部特征。
图7 复信号共轭差分自相关
1.2.3 快速傅里叶变换
由于传送信息序列是不确定随机信号,共轭差分自相关后时域波形形状太多,若直接把时域数据送入CNN网络会增加计算量且需要大量样本,泛化效果并不好。为消除时域信息随机性带来的泛化性能差的影响,本文将对共轭差分自相关后得到的复信号作快速傅里叶变换(FFT)得到频域信息,从而消除了时域上的较大差异性,图8、图9是BFSK信号的不同码元序列自相关时域和频域图。可以看到频域上变化很小,但是时域波形差异较大。
图8 不同码元序列自相关频域图
图9 码元序列自相关时域图
图10 ~14为2ASK、2FSK和BPSK信号和雷达NLFM信号的幅频和相频特性。可知,它们的幅频和相频特性差异明显,频谱图可知数据集中在中间区域,考虑卷积神经网络运用卷积核进行局部特征提取,因而对中间部分数据进行卷积处理就可以得到最主要特征。
图10 2ASK延迟自相关函数频域图
图11 BFSK延迟自相关函数频域图
图12 BPSK延迟自相关函数频域图
图13 雷达NLFM延迟自相关函数频域图
图14 雷达BPSK延迟自相关函数频域图
CNN是一种带有前向反馈的多层神经网络,属于深度学习框架的一种,能够通过多层非线性变换,从数据中自动学习提取特征,具有很强的学习能力和表达能力,并降低了数据预处理的要求,非常适合用于模式识别领域[4,10]。卷积神经网络一般由卷积层、下采样层、全连接层等组成。卷积层使用卷积核对输入数据进行滤波后输出特征图,特征图的每个神经元与前一层的局部感受野相连,获得前一层的局部连接特征。卷积核是一个权值矩阵,多个卷积核可以提取多个不同的特征[11]。卷积神经网络具有局部连接、权值共享的特点,可以极大地减少网络的训练参数,简化神经网络。下采样层也称为池化层,对输入的采样,可缩减数据规模,避免过拟合,对平移、缩放、倾斜或其他形式的变形具有高度不变性[12],最后一个下采样层或卷积层连到一个或多个全连接层,全连接层在整个卷积神经网络中起到分类器的作用,将学到的特征映射到样本标记空间。
CNN的功能是从特定模型中提取特征,然后根据特征进行分类识别、预测或做出决策。最重要的一步是特征提取,即如何提取能够最好地区分事物的特征。网络模型中卷积层层数越多,越容易把握输入信号的细微特征。然而在深度神经网络的设计中,应该考虑卷积层数和核大小,尝试以最少的计算量获得最佳结果,网络设计需要平衡网络结构的宽度和深度[13]。对于相同的CNN网络结构,迭代的次数、训练数据量的大小和学习率等参数都会影响模型的分类结果和泛化性。这些参数的设置都需要经过多次实验寻优得到。一般来说,网络层数越深提取的特征参数越多。根据幅频和相频图可以看到特征参数并不算很多,因此网络层数不需要很深。在本实验中,设计的CNN模型使用6层网络层。
本文将CNN用于一维数据分析,根据预处理得到的幅频和相频数据作为输入网络的两通道。由频谱图可知数据集中在中间区域,在此对幅频和相频数据进行裁剪,截取FFT变换后各中间200点数据,即两通道各200点一维数据作为输入。CNN网络模型如图15所示。
图15 本文CNN网络结构图
将2组长度为200的一维数据作为两通道输入CNN。卷积层提取特征的过程类似于做滤波,滤波器参数合适即卷积核大小和步长适合才能提取出足够多的相关信息。经过多次实验选定卷积核如图所示,卷积核大小的设定比传统图像处理中略大。设定训练10000次,mini-batch大小为256。
卷积层1(Conv1):由长度为15的一维卷积核生成的8个特征图并做最大池化。卷积层2(Conv2):由长度为15的一维卷积核生成的16个特征图并做最大池化。卷积层3(Conv3):由长度为10的一维卷积核生成的16个特征图。卷积层4(Conv4):由长度为10的一维卷积核生成的32个特征图并做最大池化。卷积层5(Conv5):由长度为5的一维卷积核生成的64个特征图并做最大池化。Dense1:256,Dense2(softmax输出)9个结点,输出9个节点,代表9种不同的调制方法。
实验选择了0 d B、5 d B、10 d B高斯白噪声下雷达和通信常用的9种调制方式,通信信号载波频率变化范围为 2~3 GHz,码元速率为 10 kbps~1 Mbps,码元序列随机生成。雷达信号脉冲宽度为10~100μs,频带调斜频率系数为1010~1013。在每种信噪比下每类调制方式样本4000组,共36000组样本,每组样本数据长度为400。
对通信信号而言取载波频率变化范围2~2.6 GHz、码元速率10~700 kbps的28800组样本作为训练集,载波频率变化范围2.7~3 GHz、700 kbps~1 Mbps的7200组样本作为测试集。
对雷达信号而言取载波频率变化范围2~2.6 GHz、码元速率 10~700 kbps、脉冲宽度 30~80 μs、频带调斜频率系数1011~1013的28800组样本作为训练集,2.7~3 GHz,码元速率 700 kbps~1 Mbps,脉冲宽度 10 μs、20 μs、90 μs、100μs,频带调斜频率系数为1010~1011的7200组样本作为测试集。
选取大小如3×1的卷积核,10d B信噪比下的训练精度如图16所示。
图16 不同卷积核大小的训练精度对比
如图16所示,可知卷积核较小时,训练精度不高。对于图像处理而言,图片的局部特征感受野范围较小而对于本文的一维数据如图8~11所示,局部特征感受野范围较大所以选取的卷积核应该大一些,经过多次实验选取图15所示的卷积核大小。
在0 dB、5 dB、10 dB的信噪比下分别取28800组样本进行训练,结果如图17所示,损失如图18所示。10 dB信噪比下数据训练精度可达94%以上,0 d B信噪比下数据训练精度可达85%。不同信噪比测试集的测试数据识别精度为0.9118、0.8674、0.8128。
图17 不同信噪比下训练精度对比
图18 不同信噪比下损失对比
由实验结果可以知道,在信噪比为0 dB、5 dB、10 d B情况下对9种调制信号进行10000次训练,经过不断试验调整参数并加入BN(batch normalize)算法等,信噪比为10 dB条件下训练精确度达到90%以上,测试集精确度也达90%左右。在0 dB情况下训练精确度和测试精度最差在85%左右。可以证明此方法在信噪比10 d B左右可以达到较好的识别效果,同时避免传统调制识别中繁琐的人工提取特征过程。但在较低信噪比条件下识别效果不理想,因而还需要继续研究低信噪比条件下调制识别方法。
对比采取预处理与不采取预处理对CNN网络训练结果的影响,直接将10 dB信噪比下经过小波去噪后的时域数据输入CNN网络,得到10000次训练后的精度为0.8125,测试精度0.6642。采取预处理后精度明显提升,说明预处理过程的重要性,在减少数据信息维度的同时最大限度保留了调制信息。
本文针对通信和雷达中频信号调识别问题,提出一种差分自相关预处理结合卷积神经网络的方法。不进行传统的相位频率等参数估计,而是直接对接收机处理后的中频信号作小波去噪和共轭差分自相关处理后得到时域上的相关函数,然后进行快速傅里叶变换将幅频和相频数据送入CNN网络训练。通过仿真实验,得到10 dB信噪比条件下对9种类型信号识别效果较好,训练准确度达到94%,测试精度达到90%以上,由此验证了此方案的可行性。后续应进一步研究提高在低信噪比下的识别率和深度学习调制识别混合架构。