郑 渝,沈永健,周云生
(北京遥测技术研究所 北京 100094)
脉内调制特征是雷达信号细微特征的重要体现,是雷达个体识别的重要特征之一。正确识别脉内调制特征可以提高信号分选的正确率,为雷达干扰提供引导,还有助于分析敌方雷达的技战性能和部署运用规律等[1,2]。
国内外学者针对雷达信号调制方式识别和特征提取做了大量研究,主要方法有瞬时自相关法、谱相关分析、时频变换法、小波变换法等。然而这些方法在工程应用中缺乏普适性,所提取的单一特征难以识别不同调制类型的雷达辐射源信号[3,4]。例如,时频特征对单载频信号、线性调频信号、非线性调频信号有很好的识别效果,但对频率编码和频率分集信号识别性能较差;模糊函数特征对频率编码信号和频率分集信号有很好的识别效果,但对非线性调频和线性调频信号的识别率并不高。此外,时频变换、循环谱图等方法计算量较大,实时性不高。上述大部分算法还存在抗噪性能低的问题,当SNR在0dB以下时,识别效果并不理想。
本文考虑用深度学习方法进行信号调制识别。深度学习模型是一种拥有多个非线性映射层的深度神经网络模型,能够对输入信号进行逐层抽象并提取特征,挖掘出更深层次的潜在规律。目前也有基于神经网络的雷达信号识别方法,常用的有BP神经网络、RBF神经网络、Kolnen神经网络和支持向量机等[5]。文献[6,7]采用深度学习方法识别雷达信号调制类型,但它依旧是在对信号进行某种特征提取变换后,将得到的特征作为信号识别依据,而后用神经网络进行分类识别,因而识别能力仍有局限性。
本文提出一种基于多层双向长短时记忆模型LSTM(Long Short-term Memory)的雷达信号脉内调制识别方法。在众多深度学习模型中,循环神经网络RNN(Recurrent Neural Network)将时序的概念引入到网络结构设计中,使其在时序数据分析中表现出更强的适应性。而在众多RNN的变体中,LSTM模型弥补了RNN的梯度消失和梯度爆炸、长期记忆能力不足等问题。本文考虑的LSTM循环神经网络,输入的不是信号的特征,而是截获的原始信号,让深度神经网络根据分类目标自动学习良好的特征,进而实现不同调制方式的正确识别。
雷达信号的脉内调制主要包括脉内相位调制、频率调制以及相位、频率的混合调制。本文的识别对象是雷达信号常用的相位和频率调制类型。
①线性调频(LFM)信号:又称Chirp信号,是一种较为成熟、广泛使用的脉冲压缩信号,其表示式为
其中,A为信号幅度,f0为信号起始频率,μ为信号调频率,0φ为初始相位。
②频率编码(FSK)信号:是一种大时宽带宽信号,具有良好的距离分辨性;有较窄的瞬时带宽,降低了对发射机、接收机的带宽要求。
式中复包络为
式中,fi为频率码组,常用COSTAS序列使信号具有较好的模糊函数;Nc为码长,ΔL为子码宽。
③非线性调频信号:即瞬时频率随时间非线性变化的频率调制信号,如V型调频、sin调频、抛物线调频等。其中V型调频表达式如下:
相位编码信号是一种常用的低截获概率(LPI)信号,具有较强的抗干扰性能。
①二相编码(BPSK)信号
式中,φ(t)为相位调制函数。对二相编码来说,φ(t)只有0和π两种取值,用二相位序列{φ(k)=0,π}表示,常用的序列为不同长度的bark码序列。
②四相编码(QPSK)信号
上述信号的时域波形如图1所示。
图1 雷达脉内调制信号时域波形Fig.1 Radar pulse modulation signal waveform
本文构建的深度学习网络由特征提取层和特征分类器两部分组成。其中特征提取层由双向多层LSTM构建,提取到的特征由softmax分类器进行分类。
对于给定的序列x=(x1,x2,…,xn),应用一个标准的RNN模型[6],可以通过迭代式(9)和式(10)计算出一个隐藏层序列h=(h1,h2,…,hn)和一个输出序列y=(y1,y2,…,yn)。
式中,Wxh、Whh和Why分别表示输入层到隐藏层、不同隐藏层间以及隐藏层到输出层的权重系数矩阵;bh、by分别表示隐藏层和输出层的偏置向量;fa为激活函数(如tanh函数);下标t表示时刻。
尽管RNN能够有效处理非线性时间序列,但是仍然存在以下两个问题[7]:①由于梯度消失和梯度爆炸问题,RNN不能处理延迟过长的时间序列;②训练RNN模型需要预先确定延时窗口长度,然而实际应用中很难自动获取这一参数的最优值。由此,LSTM应运而生。LSTM模型是将隐藏层的RNN细胞替换为LSTM细胞,使其具有长期记忆能力。经过不断的演化,目前应用最为广泛的LSTM模型细胞结构如图3(a)所示,z为输入模块,前向计算方法可以表示为
式中,i、f、c、o分别表征输入门、遗忘门、细胞状态、输出门;其中b为对应的偏置项;Wxf、Wxc和Wxo分别为输入层与遗忘门、细胞状态及输出门之间的权值矩阵;Wci、Wcf和Wco分别为细胞状态与输入门、遗忘门及输出门之间的权值矩阵;Whi、Whf、Whc和Who分别为隐藏层与输入门、遗忘门、细胞状态及输出门之间的权值矩阵;σ和tanh分别为sigmoid和双曲正切激活函数。
单向的递归神经网络只是从序列的一端向另一端逐个读取输入数据,所以在任意时刻,递归神经网络里存储的数据只有当前和过去的信息。针对单向递归神经网络的不足,有人提出了双向长短时记忆网络Bi-LSTM(Bidirectional Long Sort Term Memory)的理论[8]。双向递归神经网络使用两个递归神经网络,一个从前往后计算隐向量,另一个从后往前计算隐向量[9],本文把两个隐向量按式(16)进行结合。图2(b)描述了一个展开的双向LSTM。Bi-LSTM是本文设计模型的核心部分。
图2 LSTM记忆单元基本结构Fig.2 Basic structure of LSTM memory unit
LSTM模型训练过程采用与经典的反向传播(Back Propagation)算法类似的BPTT算法,大致可以分为4个步骤:①按照前向计算方法(式(10)~式(15))计算LSTM细胞的输出值;②反向计算每个LSTM细胞的误差项,包括层级间和时间上的误差反向传播;③根据相应的误差项计算每个权重梯度;④应用基于梯度的优化算法更新权重。
基于梯度的优化算法种类众多,比如随机梯度下降SGD(Stochastic Gradient Descent)、AdaGrad、RMSProp等算法。本文选用文献[15]提出的适应性动量估计Adam(Adaptive moment estimate)算法。Adam优化算法是一种有效的基于梯度的随机优化方法,它融合了AdaGrad和RMSProp算法的优势,能够对不同的参数计算出适应性学习率并占用少量存储资源。相比于其他随机优化算法,Adam在实际应用中表现更优。
深度神经网络主要进行信号的特征提取,得到特征向量Pi,而后由分类器对样本的特征向量进行分类。本文应用的分类器是softmax分类器,其损失函数为式(17)所示的交叉熵损失函数(cross-entropy loss):
其中,
被称作softmax函数,其输入为一个向量,向量中的元素为任意实数的评分值,输出向量的每个元素值在0到1之间,且所有元素之和为1。其目的是将输出的得分值转化为概率值,如式(19)所示,其中W为连接输出层的权值矩阵。
P(Y=j|X=xi)表示输入样本为xi时输出类别为j的概率,以此概率值决定最终的分类。
本文将针对单频信号、线性调频信号(LFM)、V型调频信号、频率编码信号(FSK)、二相编码信号(BPSK)、四相编码信号(QPSK)六种信号进行分类识别。模型训练和应用系统如图3所示。
图3 识别系统模型Fig.3 Identification system model
模型的算法结构按时间展开如图4所示,包括输入层、隐藏层、输出层。模型应用了3层双向LSTM网络作为隐藏层进行特征提取。其中为正向LSTM单元,为反向LSTM单元,两者构成一个Bi-LSTM细胞。和表示l层k时刻细胞单元的状态和输出,将被传递给下一时刻的细胞。在前向传播过程中具体计算主要由3部分组成:
① 输入信号预处理:对信号作幅度归一化操作,而后进行分段。设一个批次的信号为X=(s1;s2;…;sm),批次大小为m,每一个信号为si,对信号进行分段,因而网络有k个时序。其中的长度为网络输入层的神经元个数。则输入数据形式为Sbatch=。
图4 三层双向LSTM深度网络模型Fig.4 Three-layer bidirectional LSTM deep network model
② 特征提取:用3层的Bi-LSTM结构提取信号特征,并得到特征向量。第一层LSTM单元输入为,经过k个时序,一个完整的信号样本s通i过LSTM单元层得到特征向量pi。一个批次的样本信号经过LSTM网络的特征提取得到特征集Pbatch=(p1,p2,…,pm)。
③ 用softmax分类器对特征集Pbatch进行分类。
深度神经网络的实用性依赖于大数据的支持,同时训练数据库的设计一定程度上决定了模型在训练过程中能否收敛以及是否有好的泛化能力。训练样本可以通过实际场景采集获得,也可以自己设计生成,本文通过matlab生成训练数据集。下面分析生成的数据与实际采样构建的数据集对网络分类效果的影响。
网络模型可以看作一个概率模型,模型的输出可表示为[10]
将输入表示为随机变量X,输出为随机变量Y,P(Y=ck|X=x)表示输入为x、输出为ck的概率,其中ck为各种类别的标签。因此网络具体的输出值为可以使P(Y|X)最大的ck值,P(Y|X)是类别判断的标准,训练就是从数据中学习到P(Y|X)分布。由贝叶斯公式有
在分类问题中,P(Y)表示出现类别y的概率,是在训练数据中学习到的先验信息,一定程度上影响着分类。输入输出的联合分布P(X,Y)表示特征与类别之间的关系,是学习的本质和决定分类的根本。当训练数据由自己设计生成时,默认各种类别出现的概率相同,即不把信号出现的概率作为分类的依据,分类完全由特征和类别之间的关系决定,这对模型的识别能力没有本质的影响。换个角度来说,实际中接收到的信号类别分布情况没有一定的统计规律,因此数据集中信号设为均匀分布是可行的。
由于我们期望网络模型可以提取各种信号的特有属性,因而在样本集中大部分的信号数据是无噪声信号,理想的信号可以避免网络误将噪声部分作为信号特征的学习对象。但同时为了使网络能提取出具有抗噪性能的特征,数据集中另一部分信号加入了随机强度的噪声。由于训练好的模型是要应用在真实环境下的,因此测试数据集为带有不同强度噪声的信号。信号标签采用one-hot类型标签。
表1 信号参数设置Table 1 Parameters setting
本次实验的信号为:单频信号、LFM信号、V型调频信号、FSK信号(载频个数在7~13之间随机选取)、BPSK信号(相位编码随机采用7、11、13位bark码)、QPSK信号(相位编码为16Frank码和15位泰勒码),采样率为fs,信号长度为960个采样点,参数设置如表1所示。初始相位随机选取,噪声为高斯白噪声,对信号幅度进行归一化处理。加噪声部分的信号的信噪比在–5dB~5dB随机选取。训练样本集中各个信号的个数分配情况如表2所示。
根据奈奎斯特采样定理,采样频率应大于信号频率的2倍,为尽可能多地获取到信号信息,本次实验设置的采样率为信号频率的40倍~500倍。
为了训练一个较优的模型,模型参数的设置非常关键。网络结构参数设置为:输入层节点数为40,即信号分为24个子序列,隐层节点为128,Bi-LSTM单元数为3,输出节点数为6。训练参数设置为:学习率初始值为0.01,并随着迭代次数呈指数下降;批次大小设置为500,epoch数设为300,总的迭代次数为40000。
模型训练迭代40000次,模型收敛,网络的训练误差曲线如图5所示。
图5 模型训练误差曲线Fig.5 Model training error curve
为验证模型的有效性,设置测试数据集对上述训练好的模型的识别效果进行评估。测试数据为SNR在–5dB~5dB之间的上述6种信号,测试信号的长度任意。每次实验以信号个数为10000来统计识别正确率。识别效果如表3所示。
表3 不同信噪比下各信号的识别正确率Table 3 Correct identification rate of each signal under different SNR
由表3可知,算法抗噪性较好,信噪比在–3dB时对六种信号的识别正确率均能达到90%以上,信噪比为–1dB时六种信号的识别正确率均在95%以上。模型对编码类信号(BPSK、QPSK、FSK)的识别效果较另外三种稍差,但在–3dB信噪比时识别正确率依旧可以保证90%以上。
文献[14]提供了一种新的特征提取方法,较传统方法识别效果有所提升,与本文方法识别效果对比的结果如图6所示,可见本文算法性能优越。在信噪比为0dB的情况下,将本文方法与传统特征提取识别方法[11-13]作对比,识别效果如表4所示。
由图6和表4可知,本文提出的识别系统识别效果优于文献[14]和传统的基于特征提取的识别方法,尤其在低信噪比下性能优势更加明显。这是因为人工设计的特征提取方法,某种程度上不能充分利用信号的所有特征信息,难以保证设计方法可以提取到区分信号的本质信息。本文采用深度学习方法,输入为原始的信号采样数据,由网络自动学习良好的信号特征,免去了人工选取的过程;多隐层的LSTM结构具有优异的特征学习能力,学习到的特征对数据有更本质的刻画,因而即使在低信噪比的情况下依然有较好的分类效果。
图6 不同信噪比下信号识别正确率Fig.6 Correct identification rate under different SNR
表4 几种识别算法的识别正确率(SNR=0dB)Table 4 Correct identification rate of several recognition algorithms(SNR=0dB)
本文方法还具有良好的普适性。人工特征提取方法不能兼顾对频率调制信号和相位编码信号特征的有效提取,如时频分析方法对LFM、NLFM、单频信号有较好的识别效果,但对BPSK和QPSK提取的特征难以区分,故传统的基于特征提取的方法不能同时满足对各种调制信号有较高的识别正确率。深度学习算法根据设定的分类目标,自主寻找利于区分数据的特征,因此提取的特征有较强的分辨能力。
本文提出一种基于多层双向LSTM的雷达信号脉内调制识别方法,将特征提取与分类器结合到一个框架中,用数据去学习特征,减少了人工提取特征的巨大工作量,提高了特征提取的效率。由于训练深度网络的数据是采样得到的原始信号,可以保留更多的信号信息,而深度网络有较强的学习能力,因此本文方法在保证对信号本质特征提取的同时也简化了识别系统。经过测试,本文的识别系统在低信噪比的情况下具有良好的识别性能,为低信噪比下原始雷达信号脉内调制特征识别提供了一种新的可行方案。