叶文强,俞志富,张 奎,王虎帮
(国防科技大学电子对抗学院, 合肥 230037)
雷达辐射源信号识别在现代化作战中起到无可替代的作用,直接影响到电子侦察设备的发挥并对后续的作战决策起到非常重要的影响。它不仅能够侦察系统信号,而且又能够判断敌方武器是否构成威胁,对战场走向有重要意义。随着战争的演变和科技的发展,战场对雷达辐射源信号识别有了更高的要求。传统人工识别已经不能够满足现代化战争的要求,需要引入人工智能,提出智能信息处理的方式[1]。雷达辐射源信号特征提取是信号分选和识别的重要基础,并且能够决定信号识别的准确性和高效性,最终影响电子情报侦察能力,对后续的战争决策有着至关重要的影响[2]。文献[3]利用时频图像局部二值模式纹理特征,运算效率高,分类器结构简单,具有较强的适应能力,但是在低信噪比情况下效果有待提高。文献[4]利用稀疏自编码器对信号时频图像进行分类识别,运行速度快,鲁棒性较强,但是通过降维会导致数据特征缺失,导致识别效果下降。文献[5]利用DBN结合快速傅里叶累加算法,对信号循环谱进行特征提取分类识别,复杂度低,相位编码和频率编码区分效果明显,但是对QPSK信号适应性差。文中针对低信噪比情况下识别效果较差,鲁棒性不强的问题,提出了利用短时傅里叶变换结合DBN深度信念网络框架结构,对信号时频图像进行识别的算法。
从图1[6]中可以得知,雷达辐射源信号识别主要包括预处理、特征提取和分类识别3个过程。
图1 信号识别流程图
DBN网络是由无监督的受限玻尔兹曼机(restrited Boltzmann machine,RBM)和有监督的反向传播网络(back-propagation,BP)构成的深层神经网络[7],在机器学习模型中,占有很重要的地位。
DBN网络主要通过两步来训练模型:第一步,首先对每一层RBM网络进行无监督训练,以保证在能够让特征向量映射到不一样的特征空间之中,同时能够保留更多的特征信息,形成的特征更加具有概念化。具体解释,首先用没有进行标签的数据训练第一层RBM网络,这层网络结构包括输入层V0和第一个隐含层H0,输入数据作为最原始的特征向量输入到输入层。首先训练第一层RBM网络参数,即输入层和第一层隐含层之间的参数W0。在训练完第一层RBM网络之后,开始训练第二层RBM网络参数W1,将上一层的输出,也就是第一层隐含层的输出H0作为第二层网络的输入V1进行训练,即V1=H0。同理,重复这样的训练方式,将第(n-1)层的输出作为第n层的输入,得到第n层RBM网络参数Wn-1。这样DBN网络每一个隐含层之间的参数都得到初始化。RBM网络只能够保证每一层的参数使该层的特征向量达到最优,不能够保证整个DBN网络达到最优,RBM学习到的是普遍的概念化特征,不能够学习具体任务的特征。因此就要第二步训练过程来完成这个任务。第二步是利用BP网络有监督训练Softmax,将RBM学习的特征进行组合分类,将错误信息反向传播到所有的RBM网络,微调RBM之间的网络参数。微调之后的参数就是整个DBN网络的最优参数[8]。
1986年,Smolensky提出一种生成式随机网络RBM,属于无监督的机器学习模型中的一种,是对玻尔兹曼机改进得到的[9]。
假设存在一个二部图[10],一层是可视层(v),为输入层,另一层是隐藏层(h),每一层之间的网络节点不会存在连接,是相互独立的。节点都是随机二值变量节点,并且全概率分布p(v,h)满足Boltzmann分布,就可以称这种模型为RBM模型。RBM模型中,在已知可视层(v)的情况下,由于节点之间不存在连接,则所有的隐藏节点之间是条件孤立的,表达为p(h|v)=p(h1|v)…p(hn|v)。同样的道理,如果已知隐藏层(h),所有可视点都是条件孤立的。由于所有的可视层和隐藏层都满足Boltzmann分布。所以,当输入v时,通过p(h|v)就可以得到可视层。
一个RBM模型,拥有n个可见单元v=(v1,v2,…,vn)和m个隐藏单元h=(h1,h2,…,hm),定义其能量函数为:
(1)
式中:v表示可视层的状态;h表示为隐藏层的状态;vi表示为第i个可视单元的状态;hj表示为第j个隐藏单元的状态;ai是可视单元的偏置;bj是隐藏单元的偏置;wij表示为可见单元i与隐藏单元j之间的连接权重。RBM处于状态v,h的概率为:
(2)
(3)
同理可得第i个可见单元的激活概率为:
(4)
式(3)和式(4)中,σ(·)为sigmod激活函数。运用极大似然法法则[12],作用于最大化式(4),可以得到对数似然函数:
(5)
式中:θ={wij,aj,bj}。该模型利用梯度下降法[13]可以推导出权值的更新公式;
(6)
式中:ε表示学习率,〈〉data表示数据上的平均值,〈〉model表示模型上的期望值。
常见的分类器主要有Softmax分类器、SVM分类器、贝叶斯分类器等。文中选用softmax分类器[14]。Softmax分类器可以用来解决多分类问题,即样本类标签y的可取值个数k满足k>2。现在有训练集{(x(1),y(1)),…,(x(m),y(m))},其中的y(i)∈{1,2,…,k}。本模型是一种有监督的学习算法,输入的样本间类别要十分明确,同一个样本不能同时属于多个类别。假设输入为x,那么它是类别j的概率表示为p(y=j/k)。具体来说,该分类器所对应的神经网络的假设函数为:
(7)
对雷达辐射源信号进行短时傅里叶变换,得到时频图像,但是时频图像不能直接作为DBN网络的输入,因此需要对时频图像进行预处理。
以LFM信号s(t)为例说明,首先通过短时傅里叶变化得到LFM的时频图像S(t,f),如图2所示。
图2 LFM信号时频图像
对时频图像每个点做归一化处理
(8)
对图像进行灰度变换,灰度图像如图3所示。
图3 时频图像灰度图
为了将一部分噪声去除,减少噪声的影响,对灰度图像进行阈值二值化操作:
(9)
(10)
提出的算法框架流程如下:
1)数据预处理。将辐射源信号进行短时傅里叶变换,然后对得到的时频图像进行图像处理,归一化、灰度、二值化操作、裁剪,最后将处理后的时频图像进行向量化操作,得到特征向量V。
图4 文中算法识别框图
2)特征提取。将V输入到DBN网络中,调节网络参数。主要分为两个步骤:第一,通过无监督学习调节每一节隐藏层权值W;第二步,通过BP算法有监督训练,对整个网络的参数进行微调。
3)分类识别。结合文中搭建的深度神经网络模型和目标信号识别任务,采用Softmax实现目标识别,输出识别结果。
为了验证算法有效性和对准确性,利用常见雷达辐射源信号进行仿真实验,分别是常规信号(CW)、二相编码压缩信号(BPSK)、二频率编码信号(BFSK)和四频率编码信号(QFSK)、线性调频信号(LFM)、非线性调频信号(NLFM)。信号参数设置载频为200 MHz,采样率为2 GHz,BPSK和BFSK采用11位Barker码,QFSK采用16位Frank码,信号在信噪比-12 dB到4 dB的范围内,每种信号每隔2 dB产生200个辐射源信号,作为测试集,在SNR∈[0 dB,10 dB]范围内每种信号随机产生500个样本,6种信号总共3 000个样本作为训练集。试验硬件平台为:CPUi5-7300,内存为8 GB,MATLAB版本为R2014a。
定义雷达辐射源信号的总体识别正确率为:
(11)
定义单个种类雷达辐射源信号识别正确率:
(12)
在深度学习中包含很多重要网络参数,首先使用控制变量法,探究参数对识别率影响程度如何,采用SNR=-10 dB 6种辐射源信号进行对比实验,网络结构为[100],即隐藏层为一层,神经元个数为100,取6种总识别率进行分析。
控制批训练样本数batchsize控制为10,动量momentum控制为0.01,改变学习率,观察识别效果变化,如表1所示。
表1 不同学习率信号总识别率
从表1分析得到,识别率会因为学习率改变发生很大变化,如果学习率太小会容易造成局部最优,学习率太大,会造成超过极值,损失会停止下降,在某一位置反复震荡。确定合适的学习率对识别效果有至关重要的作用。
批训练样本数batchsize控制为10,学习率控制为0.1,改变动量momentum,观察识别效果变化,如表2所示。
表2 不同动量信号总识别率
从表2分析得到,识别率会因为动量的改变发生很大变换。主要是因为网络权值更新的时候不能保证每一次初始化操作都能使得网络初始值处于一个合适的位置,如果初始权值不正确,很有可能会造成网络的损失函数在训练过程中陷入局部最小值,无法达到全局最优的理想状态。合适的动量momentum能够在一定程度上解决这个问题。
控制学习率为0.1,动量momentum为0.01,批训练样本数为10,改变信噪比,观察6种信号单个信号种类具体识别结果,如图5所示。
图5 6种典型信号在不同信噪比下识别率
图5为不同信噪比下DBN模型对不同类型辐射源信号识别效果对比曲线图。表3为SNR=-10 dB时各类信号识别结果混淆矩阵。从图5可以分析到在SNR≥-4 dB时,每一种信号识别率都能达到100%的效果,在SNR=-12 dB的时候,BPSK和BFSK信号识别率很低,识别率在55%~60%之间,CW与QFSK信号识别率较高,能保持在75%~80%之间,在SNR=-8 dB的时候,各类信号都能达到90%以上。单个信号识别率随着信噪比的提高,识别效果逐步增强。从表3可以得到各类信号之间存在误识。主要是因为信噪比低的时候,信号受到噪声的严重影响,信号特征不明显,时频图像主要信息微弱,有用信息被噪声掩盖,导致识别率很低。随着信噪比的提高,时频图像中有用信息逐渐增强,噪声减弱,特征更加显著,识别效果更好。
表3 SNR=-10 dB时测试集下的混淆矩阵
为验证文中算法有效性,将算法与文献[3](LBPV)、文献[16](TFAF)、文献[4](SAE)针对信号总识别率进行对比,文献[16]是基于时频原子特征的识别方法。通过这4种算法的对比,在SNR<0 dB时,另外3种算法识别效果随着信噪比降低下降明显,文中算法识别效果比较稳定,说明算法具有更强的鲁棒性,并且在低信噪比情况下识别效果明显优于其它3种算法。特别是与SAE对比,SAE也是利用对时频图像处理之后进行分类识别,在SNR≥0 dB,两种方法识别效果接近,但是在SNR<0 dB,DBN比SAE明显识别效果更好。在利用不同方法提取信号时频图像特征时,说明DBN能够挖掘信号更深层次特征,SAE还是停留在浅层特征。在低信噪比的情况下,文中算法能够取得很好的识别效果。
图6 不同模型下辐射源信号识别模型对比
针对传统方法在雷达辐射源信号低信噪比情况下识别效果差的问题,提出了基于DBN的辐射源信号识别算法,首先通过对信号时频变换,然后对时频图像进行图像预处理,利用DBN网络和Softmax分类器对处理后的信号进行分类识别。通过仿真验证了算法的可行性,相对于传统的识别算法,文中算法具有更好的识别精度和鲁棒性,实现在低信噪比-10 dB的情况下也能实现较高的识别率。但是在更低的信噪比的情况下,识别效果明显下滑,因此改进更有用的特征提取算法需要进一步研究。