基于LGBM和深度神经网络的HRRP目标识别方法

2022-05-13 04:59张红莉李月琴齐英杰
探测与控制学报 2022年2期
关键词:特征选择神经网络样本

张红莉,李月琴,韩 磊,齐英杰,张 维

(1.北京联合大学智慧城市学院,北京 100101;2.北京理工大学机电学院,北京 100081)

0 引言

高分辨距离像(high resolution range profile, HRRP)是雷达各距离单元目标散射回波的矢量和,反映了目标散射点沿雷达径向距离方向上的分布情况,包含丰富的目标结构、尺寸和形状信息[1]。相对于SAR/ISAR图像,HRRP具有易于获取和计算简单等优势[2],因此,基于HRRP的目标识别成为雷达自动目标识别领域的研究热点。目前基于HRRP的识别主要有:字典学习[3]、模板匹配、统计识别、K近邻法、支持向量机(SVM)[4]、决策树等方法[5],但由于这些方法主要是基于雷达数据的浅层特征进行识别,难免会造成有效信息的损失,从而使得目标泛化能力低,识别准确率有待进一步提升[6]。而与传统识别方法相比,深度神经网络模型能自主学习更高层次的结构信息[7-8],完成不同目标的分类与识别,获得比传统识别方法更好的识别性能,在各个领域得到了广泛应用。

本文针对传统的HRRP目标识别方法识别率低、模型泛化能力不足等问题,提出基于LGBM和深度神经网络的HRRP目标识别方法。该方法使用LGBM特征选择算法对提取的HRRP特征进行二次选择,减少样本维度以提升速度;利用基于Dropout约束的深度神经网络对选择的最优目标特征进行分类。

1 算法模型的基本结构

基于HRRP的数据特点,搭建了适用于HRRP目标识别的LGBM及深度神经网络算法模型,如图1所示。LGBM是一种改进的梯度提升树(GBDT)算法,其主要思想是利用决策树迭代训练以提升学习器性能,支持高效的并行训练,具有准确率高、内存消耗低、训练速度快等优点。本文利用LGBM进行二次特征选择,将获得的HRRP目标最优特征样本数据送入深度神经网络模型进行训练学习,达到优化分类器识别效果的目的。

图1 基于LGBM及深度神经网络的HRRP目标识别基本框架图Fig.1 Basic frame diagram of HRRP target recognition based on LGBM and deep neural network

目标识别过程分为训练阶段和识别阶段。在训练阶段,通过雷达对目标的探测,得到不同目标的雷达HRRP原始信号;经预处理降低HRRP信号的幅度敏感性后,再基于HRRP的物理和统计等特性提取可以反映目标本质的诸多特征;然后采用LGBM对提取的特征进行选择,计算每个特征的重要程度并筛选出有利于分类的最优特征,生成目标模板库;最后将最优特征样本数据送入Dropout约束的深度神经网络进行训练。在识别阶段,对待识别的HRRP信号进行同样的预处理、特征提取操作后,通过LGBM进行特征选择得到待识别模板,送入训练好的网络模型,实现对未知目标的自动识别。

2 基于LGBM与深度神经网络的HRRP 目标识别方法

2.1 HRRP目标特征提取

作为一种高分辨率雷达信号,HRRP信号的维数通常在数百维以上,如果直接使用目标原始HRRP信号进行识别,不仅会消耗大量的计算机内存资源,而且会因为使用了大量的冗余信息而降低雷达目标识别的速度[9]。因此,如何从HRRP中提取出能够反映目标本质特性的特征,对雷达HRRP目标识别效果有着决定性的影响,是模型成败的关键[10]。

由于不同的特征侧重表达距离像不同维度的统计特性,多个特征之间互有补充,因此相较于利用单一特征识别目标,提取多个特征能更有效地提高目标的识别精度。HRRP信号中包含了丰富的目标几何结构、峰值数量、组成材料等信息,因此,雷达HRRP目标识别技术中最经典的特征提取方法是直接从原始HRRP信号中提取出具有明确物理意义的可以反映目标几何结构等信息的特征,如目标的长度、目标强散射点的数目、强散射点之间的距离、HRRP径向能量[11]、散射中心分布熵等;一维距离像的平均值、均方差、对称性与分散性程度等其他特征,可以从数学分析的角度反映出目标的统计特性;为了有效对抗一维距离像的平移敏感性,可以提取频谱及功率谱等平移不变特征。

经过上述分析,本文从HRRP信号中提取了13个具有代表性,能较好反映目标本质特性的特征,分别是功率谱特征、目标径向长度、强散射中心数目[12]、二阶中心矩、三阶中心矩、散射中心分布熵、平均值与方差[13]、目标平均起伏特性、对称性与分散性、去尺度结构特征以及目标径向能量。

2.2 LGBM算法二次特征选择

由于各特征之间并非是完全不相关的,而且不同特征对目标分类的贡献度也有优劣之分,所以随着提取特征的数目增加,重复的冗余量会增大,噪声和误差也随之增大,不但导致算法的计算量增大,也会降低目标的识别率,因此,需要选出有利于目标分类的特征。这里使用LGBM算法对特征进行选择,将训练样本放入LGBM中进行训练,计算每个特征的重要程度,根据特征重要性筛选关键特征来减少分类所需的特征数量,从而达到保证分类性能的同时降低识别时间。

LGBM根据特征在所有决策树中被分割后所带来的总信息增益来度量特征属性的重要性,数值越高代表该特征对模型的重要性越大,更有利于模型的分类识别。按重要性对特征元素进行降序排列,依次删除重要性最低的特征,根据测试集在新特征子集下的准确率判断是否剔除当前重要性程度最低的特征,如此循环,从而实现特征选择。具体流程如下:

输入数据集D,特征集F={Tj|j=1,2,…,d},假设训练集I含有n个样本{X1,X2,…,Xn},每个样本含有d维特征,即Xi=[T1,T2,…,Td,]。

输出最优特征子集Fbest

1) 对包含所有特征的训练集进行LGBM建模,分别计算样本特征元素Tj的重要性程度Vj。假设训练集I每次迭代损失函数的负梯度为{g,g2,…,gn},将样本按梯度的绝对值降序排序;取前a×100%个样本,构成大梯度样本子集A;从剩余样本集合随机选取b×100%个样本,构成小梯度样本子集B;在样本子集(A∪B)学习一棵新的决策树,并引入常量系数,抵消采样对数据分布的影响,则分裂特征j的分割点k的增益表示为:

(1)

式(1)中,

2) 根据第一步得到的Vj对特征元素Tj进行降序排列。

3) 使用LGBM算法进行评估,根据混淆矩阵计算测试集在全部特征下的准确率aj=t/n,其中t是所有被正确分类的样本数量,n是样本总数。

4) 对于步骤2)中排序后的特征全集进行搜索,每次在特征集合F中删除具有最小重要度的特征元素Tj,并使用LGBM计算测试集在新特征子集下的准确率abest。

5) 根据准确率判断是否删除当前重要性最低的特征:如果aj

6) 如此循环计算,当所有特征元素Tj被遍历完,最终得到一个分类准确率较高且特征数目较少的最优特征子集Fbest。

可见,LGBM算法根据特征的重要度进行特征选择,而且对模型的结果进行了初步评估,大大降低了特征的波动性;同时由于重要性比较小的特征被删除,使得特征的冗余量下降。因此,不但降低了目标识别的时间,而且有利于后期目标分类精度的提高。

2.3 深度神经网络分类器的设计

在提取目标HRRP特征之后,目标识别的效果主要取决于分类器的性能。针对HRRP数据特点,在复杂情况下如果使用传统的目标识别方法会导致识别精度低、模型泛化能力不足等问题。而深度神经网络模型能自主学习更高层次的结构信息,完成不同目标的分类与识别,获得比传统识别方法更好的识别性能,且在各个领域得到了广泛应用。基于以上考虑,本文设计并应用含有多个隐含层的多层感知器——深度神经网络(DNN)作为HRRP目标识别的分类器。考虑在不影响分类性能的前提下,算法运算量应尽可能小[14],因此设计了包含三个隐含层的DNN模型,为提升识别率和训练速度,采用ReLU函数进行非线性变换和Adam算法进行参数优化;为了增强模型泛化能力,在DNN的训练过程引入Dropout方法,防止过拟合。通过利用LGBM特征选择算法获得的最优特征样本数据训练DNN,得到网络的连接权值,建立HRRP目标识别的网络模型;对待识别目标进行同样的特征提取、LGBM特征选择后,输入训练好的DNN,最终输出预测结果,实现对目标的分类。

2.3.1深度神经网络模型的基本结构

根据HRRP特征数据大小和目标识别要求,本文采用的深度神经网络模型由一个5层的全连接神经网络构成,包含一个输入层、三个隐藏层和一个输出层,如图2所示。图中W1∈Rn1×n0,W2∈Rn2×n1,W3∈Rn3×n2和W4∈Rn4×n3为权重矩阵;b1,b2,b3和b4代表偏置向量;其中n0为输入层维数,n1,n2,n3分别对应三个隐藏层神经元个数,输出层结点数为4。

图2 基于HRRP目标识别的深度神经网络结构示意图Fig.2 Deep neural network structure diagram based on HRRP target recognition

同层的神经元是相互独立的,而相邻层的神经元之间相互连接。输入层的数据是经过LGBM选择出来的最优特征子集。神经网络输出结果经Softmax函数处理转变为概率分布,根据最大概率准则输出最终的识别结果。另外,由于在训练样本较少的情况下DNN容易发生过拟合问题,为此将Dropout方法引入网络模型,在训练网络时以一定概率随机丢弃部分神经元,以提升模型的泛化能力。

2.3.2分类器实现的关键技术

利用该深度神经网络模型进行HRRP目标识别时,由于在训练过程中,数据是前向传播的,误差是反向传播的,需要依次调节各隐藏层和输出层的权重参数和偏置向量。因此,在具体的实现过程中需要应用以下关键技术。

1) 前向传播中数据的非线性变换

模型的输入数据从输入层开始,经过网络参数和激活函数的作用,逐层计算并顺序向后传播。整个模型中,前一层网络的输出作为下一层网络的输入,直到模型的输出层。在HRRP目标识别中,由于样本数据不全是线性可分的,在传播过程中会出现数据发散和网络梯度消失等问题,因此在双方的具体实现过程中需要在隐含层引入激活函数对数据进行非线性变换。这里应用修正线性单元(rectified linear unit, ReLU)函数来完成数据的非线性变换。

如图2所示,模型中输入层数据X=[x1,x2,…,xM]T为经过LGBM特征选择后的HRRP目标特征数据,其数据维数为M;将三个隐藏层的激活函数选择为ReLU,记为f(x)=max(0,x),三个隐藏层的输出矢量分别记为H1,H2和H3,数据维度分别为n1,n2,n3,则

(2)

由于ReLU函数求导简单,在非负区间的一阶导数恒为1,可以使网络梯度保持在一个稳定的状态,能够避免梯度消失问题,加快收敛速度,从而更好地训练网络参数;而且相比其他的激活函数,ReLU函数计算高效,因此在HRRP目标识别中具有更好的表现。

2) 反向传播损失函数的优化

将前向传播计算得到的模型输出预测值与目标真实类别进行比较,即可得到模型的输出误差。在训练模型时,我们采用交叉熵(cross entropy loss)作为损失函数,用于描述模型预测值与已知真实值之间的这种误差,记为:

(3)

式(3)中,N为训练样本数;C为类别个数;yi=[yi1,yi2,yi3,yi4]T代表第i个样本的期望输出矢量,即样本的真实标签。

在进行HRRP目标识别时,通过不断减小损失函数而使得训练时达到更高的识别率。但是利用传统随机梯度下降法(stochastic gradient decent, SGD)进行损失函数的减小,使得优化后的DNN收敛速度慢,容易陷入局部最优解。为此采用自适应时刻估计方法(adaptive moment estimation, Adam)算法替代传统SGD方法来更新模型参数。将所得到的模型训练误差,利用反向传播算法计算权重和偏置向量的更新值,根据所得结果重新调整网络模型的权重参数和偏置向量。假设第t轮训练中,参数θ的小批量随机梯度为gt,mt是梯度的一阶矩估计,υt是梯度的二阶矩估计,β1,β2对应mt,υt的指数衰减率,则

mt=β1mt-1+(1-β1)gt,

(4)

(5)

然后对mt,υt作偏差校正,记为:

(6)

(7)

Adam算法能基于HRRP训练样本数据迭代更新神经网络权重,学习效果更为有效,且在训练过程中可以纠正学习率消失、损失函数波动较大等问题[15]。从而实现了在最大程度地最小化损失函数的同时,加速收敛并正确学习,达到了更高的识别率。

3) 利用Dropout防止过拟合

对于深度神经网络模型而言,随着网络深度的增加,网络的训练难度也逐渐增加,且在HRRP目标特征训练样本较少的情况下,容易发生过拟合问题[16]。因此,本文在所提出的基于HRRP目标识别的深度神经网络训练过程中引入了Dropout方法,在缓解模型过拟合问题的同时提高了模型的泛化能力。

图3所示分别为含有两个隐含层的标准神经网络和应用Dropout产生的神经网络。可见引入Dropout方法后,在神经网络训练过程中,通过设置不同的舍弃概率,部分神经元将以一定的概率被丢弃,如图3(b)所示。通过这一操作,使得神经网络经过足够多次的迭代之后,模型的泛化性能得到了有效的提升,而且有效减少了模型在训练过程中陷入过拟合的状态的风险[17]。在测试阶段,Dropout恢复所有神经元之间的连接,保证模型测试时获得最好的识别性能。

图3 Dropout约束的神经网络Fig.3 Dropout constrained neural networks

4) 网络节点数设置

如何确定隐含层神经元数目是网络模型设计中的重要环节。如果隐含层神经元数目过少,则网络的学习能力较弱,无法实现较高的识别率;而神经元个数过多,网络的学习能力变慢,且在反向传播时容易陷入局部极小值,还可能出现过拟合问题[18]。

隐含层个数及其对应神经元个数没有一定的选取准则,一般先设计一个隐含层,增加节点数进行测试,当增加节点数无法提升网络识别性能时再考虑增加隐含层。然而太多的隐含层会使得网络难以有效训练,并带来更多的参数需要学习。根据HRRP数据大小和识别任务要求,采用满足识别需求的三个隐含层网络。通过实验分别对各个隐含层在节点数取不同值时的识别率进行测试,选择识别率最好时对应的节点数作为该隐含层的节点数,从而确定各隐含层节点数,使得整个神经网络模型所对应的识别率最高。

3 实验验证与分析

3.1 实验数据

为了验证本文所提算法的有效性,基于目标散射中心模型对HRRP数据进行了仿真,用于仿真的目标有4种,分别是立方体、长方体、四棱锥和六棱柱。选用调频连续波雷达作为探测器,其仿真参数的设置如表1所示。

表1 探测器的基本参数Tab.1 Basic parameters of the detector

利用调频连续波探测器对目标进行探测,将发射信号与回波信号进行混频得到差拍信号,差拍信号包含目标距离、目标形状等丰富的信息,然后将差拍信号进行FFT处理就得到了目标的HRRP信号,它是目标散射点的子回波在探测距离方向上的矢量和。为了减小姿态敏感的影响,探测角度0°~360°被平均分为72个角域,角域大小为5°,依次采集每个角域内四类目标的10个雷达HRRP信号,并对每一个HRRP依次提取其13个特征分量,该13个数字特征作为训练数据集的一个样本,故训练样本个数为72×10×4,数据维度为13。同样的方法,再对每类目标另取72×100个识别样本,用于检验目标识别效果。

3.2 二次特征选择结果对比实验

根据2.2节的算法流程,使用LGBM算法计算各特征对模型的重要程度,并进行降序排列,其计算结果如图4所示,图中横坐标数值越高代表该特征对模型的重要性越大,更有利于模型的分类识别。因此,根据特征重要度,得到冗余少且不损失分类精度的包含6个特征值的最优特征子集Fbest:目标径向长度、目标强散射中心数目、三阶中心矩、散射中心分布熵、目标平均起伏特性和目标径向能量。

为了验证LGBM二次特征选择算法所选特征值的代表性,本文分别基于传统的识别方法(SVM、GBDT、KNN和贝叶斯),对利用LGBM二次特征选择前和选择后的数据进行了目标识别测试,识别结果如图5所示。由图可见,在应用LGBM特征选择后,SVM、GBDT、KNN和朴素贝叶斯算法的目标识别率都有提升,说明LGBM特征选择算法能选出最利于目标识别的特征值。

图4 各个特征对模型的重要程度Fig.4 Importance of each feature to the model

图5 LGBM特征选择前后各算法识别效果Fig.5 Recognition effects of different algorithms before and after LGBM feature selection

表2是经LGBM二次特征选择前后不同识别方法的测试时间对比结果,与特征选择前相比,应用LGBM特征选择算法后,SVM和KNN的测试时间分别缩短了约0.14 s和0.18 s,GBDT和朴素贝叶斯的识别速度也有明显提升。综上,运用LGBM算法进行二次特征选择在提高识别率的同时,也有效提升了识别速度。

表2 LGBM特征选择前后各算法测试时间Tab.2 Testing time of different algorithms before and after LGBM feature selection

3.3 所提算法目标识别效果对比结果

为了验证所提出的基于LGBM和深度神经网络的HRRP目标识别的性能优势,使用HRRP数据进行了两个对比实验:一是在相同训练样本量的条件下,对比不同识别方法的识别准确率和时间;二是对比不同识别方法随着训练样本量变化的识别率。

1) 相同训练样本量下各识别方法对比结果

为了证明所提出的HRRP目标识别算法的优越性,使用经过LGBM二次选择后的HRRP目标特征数据进行目标识别实验,由图4可知,传统模式识别方法SVM、GBDT具有较好的分类性能和识别速度,因此分别采用SVM、GBDT与不同结构网络模型进行比较实验。根据前面所提的网络节点数设置原则,利用实验数据对不同网络隐含层的最佳网络节点数进行了计算和选择,其中Dropout参数设置为0.25,单隐层网络隐含层节点数设置为48,深度神经网络模型三个隐含层节点数分别设置为48、24和36。在每角域提取10个训练样本的条件下,各方法的识别结果如表3所示。

表3 各方法识别效果对比Tab.3 Comparison of recognition effect of each method

从表3可见,提出的深度神经网络分类识别率明显高于单隐层神经网络和传统识别方法SVM、GBDT。深度神经网络虽然训练耗时长,但在实际使用时是利用训练好的模型进行目标识别时,所用时间大大缩减。因为深度神经网络模型能学习更高层次的结构信息,另外将Dropout引入网络模型的训练过程,也有效增强了模型的泛化能力。

2) 不同训练样本量下各识别方法对比结果

为了进一步说明所提HRRP目标识别算法的稳定性,在相同的条件下,对于每类目标,每隔5°划分为一个角域,每个角域用于训练的样本数目从1~10逐渐递增,对所有识别样本进行深度神经网络、单隐层网络、SVM和GBDT目标识别,并统计其识别精度,结果如图6所示。可以看出,无论样本量多少,深度神经网络型的识别性能始终优于其他方法,且在训练数据集较少的情况下也能保持相当稳定的识别性能。说明本文所提的HRRP目标识别算法,在处理目标分类问题时具备高精度识别的能力。

图6 不同训练样本量下各识别方法的识别效果Fig.6 Identification effect of each recognition method under different training samples

4 结论

本文提出基于LGBM和深度神经网络的HRRP目标识别方法。该方法采用LGBM特征选择算法对提取的HRRP的具有明确物理意义、统计特性和平移不变性的特征分量进行二次特征选择,得到最优特征子集,以减少特征冗余和样本维度;搭建深度神经网络时,为了有效解决过拟合问题,引入了Dropout约束,把获得的HRRP目标最优特征样本数据送入深度神经网络分类器进行训练学习和测试,有效提高了模型的泛化能力。仿真实验验证结果表明,在4类雷达目标的分类实验中,所提出的基于LGBM和深度神经网络的HRRP雷达目标识别方法在降低训练时间的同时有效提高了识别精度,为雷达目标识别方法提供了新的思路,具有一定的应用前景和具有较好的应用价值。

猜你喜欢
特征选择神经网络样本
基于神经网络的船舶电力系统故障诊断方法
基于人工智能LSTM循环神经网络的学习成绩预测
MIV-PSO-BP神经网络用户热负荷预测
规划·样本
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
随机微分方程的样本Lyapunov二次型估计
基于智能优化算法选择特征的网络入侵检测
故障诊断中的数据建模与特征选择
reliefF算法在数据发布隐私保护中的应用研究
一种多特征融合的中文微博评价对象提取方法