霍超颖, 闫 华, 冯雪健, 殷红成, 邢笑宇, 陆金文
(北京环境特性研究所电磁散射重点实验室, 北京 100854)
雷达一维高分辨距离像(high resolution range profile,HRRP)揭示了目标沿视线方向散射中心的分布,含有非常丰富的目标距离向结构信息,从中可以提取出散射中心的数目、位置、强度、径向长度等参量,是雷达目标识别重要的特征来源。此外,HRRP还具有易于获取和处理的优势,因此基于HRRP的目标特征提取是雷达目标识别领域的一个重要研究方向。针对HRRP的特征提取与识别问题,已经有很多学者进行了广泛的研究,主要包括传统的特征识别方法和近些年发展起来的深度学习识别方法。
传统基于HRRP的特征提取方法主要是提取平移、尺度不变性等特征,包括强散射中心特征、熵值特征、中心矩特征、功率谱特征等[1],然后对特征进行有效性评价,再将优选后的特征组合成特征矢量,通过设计适当的分类器来完成目标识别。识别过程中使用较多的分类器包括模板匹配法[2]、支持向量机[3-4]等。这些方法均需要提取稳定的特征,因此很容易受到噪声的影响。后期又出现了基于主成分分析方法[5-6]获得样本子空间投影特征,通过构建最小化重构误差来实现HRRP目标识别方法。上述算法均是基于数学或物理模型由人工设计得到的,虽然物理含义比较明确,但是主观性较强,对数据的描述能力不足,并且缺乏通用性,导致识别率难以提高,泛化能力较低。
随着深度学习的快速发展,深层网络已经在雷达数据处理中得到广泛的应用[7],通过层次化的非线性网络结构可以从数据中学习到抽象特征,从而挖掘出数据的内在结构,提升分类识别效果。目前,已经有一些学者将深度学习应用到HRRP的特征识别中。文献[8-11]均使用卷积神经网络(convolutional neural networks,CNN)从HRRP序列图像中学习到稳定特征,进而实现目标的分类识别,该方法能够在信噪比较低情况下保持较高的识别准确率,具有较强的鲁棒性。文献[12-16]使用自编码器网络实现了HRRP的特征学习,可以获得稳健有效的识别特征,从而提高识别准确率,并具有很好的降维和泛化能力。虽然上述研究均表明利用深度学习网络获得了稳定特征,但是,并没有说明稳定特征的含义,更没有对深度学习网络的隐层参数进行物理解释,因此无法实现对雷达数据本质特性的深度学习,以及后续指导网络的优化改进,从而限制了深度学习在雷达数据处理中作用效能的真正发挥。
针对上述问题,本文主要针对HRRP稀疏自编码器深层网络与散射中心特征的关联性开展研究,挖掘网络隐层特征参数的物理意义。首先给出了针对HRRP的多层稀疏自编码器网络结构,然后通过定义的一种综合权重系数和降维特征与散射中心特征进行对比分析,找到网络参数与散射中心特征的关联关系,以及深度学习网络实现了哪些具体的数据挖掘或特征提取工作。最后,通过分析网络参数对学习训练和特征提取结果的影响,指导后续目标特征提取与识别中网络参数的选择。
自编码器是一种无监督学习方式,其无监督性在于将输入数据进行编码和解码后,通过使重构误差最小化来完成网络参数的训练。自编码器在学习过程中能够保留样本的主要信息和特征,单层自编码结构如图1所示,共有3层结构分别用以表示样本输入{x}、编码输出{h}以及解码输出{xr},通常编码输出层l2也称为隐含层。其中l1与l2中“+1”项表示编码和解码过程中的偏置项系数,取值都为1。
图1 单层自编码器结构
编码和解码过程写成函数形式如下所示:
h=f(W1x+b1)
(1)
xr=f(W2h+b2)
(2)
自编码器无监督学习的目的是不断更新编码参数{W1}、{b1}和解码参数{W2}、{b2}使得样本输入重构误差最小化,重构误差用式(3)表示的损失函数Fcost来衡量:
(3)
式中:n为输入样本个数。
为了提高自编码器的自动学习样本特征能力,引入稀疏表达的思想在传统自编码的基础上加入稀疏性约束形成稀疏自编码器。这里稀疏约束指的是对隐含层l2的神经元进行约束,通过对其大部分输出进行抑制从而达到学习网络的稀疏效果。
与自编码器不同,稀疏自编码器学习过程中不但要更新编码参数{W1}、{b1}与解码参数{W2}、{b2},还要求解l2层内神经元的平均活跃度,求解公式如下所示:
(4)
再加入稀疏限制条件:
(5)
(6)
此时总的损失函数Fsparse(W,b)可以写成:
(7)
式中:β为一个常数,作为惩罚因子的权重参数。在网络参数迭代寻优过程中,本文采用L-BFGS(limited BFGS)算法[17]进行优化,L-BFGS算法是对传统BFGS算法的一种优化,大大降低了系统的内存消耗与计算复杂度,增强了算法的多维数据处理能力,加快了算法的收敛速度。
宽带雷达信号经过脉冲压缩后可获得目标散射点在径向距离上的高分辨率,从而形成目标的高分辨HRRP。假设雷达发射信号为线性调频信号,经过解线性调频后得到的目标频率响应可以表示为各个散射点的频率响应之和,实际中只能得到有限个采样值,设频率采样宽度为Δf,得到相应的离散频率形式为
(8)
雷达回波数据中的散射中心参数{K,rk,σk}(k=1,2,…,K)表征散射点的个数、散射点位置和回波强度,反映了特定姿态下目标散射点沿雷达视线的一维分布情况,提供了目标的径向结构信息。对N点序列X(n)(n=0,1,…,N-1)直接做快速傅立叶逆变换(inverse fast Fourier transform, IFFT),可得时域序列x(n),即为HRRP,x(n)表示为
(9)
式中:n=0,1,…,N-1。
IFFT后得到是目标的复距离像,由于复距离像的相位对目标的姿态和距离变化非常敏感,具有较大的不确定性,在识别中难以利用,故雷达高分辨距离像识别中采用复距离像取模后的实数距离像
x=[|x(1)|,|x(2)|,…,|x(N)|]T
(10)
随离散角度变化的多个HRRP数据称为HRRP历程数据,可以由下面的数据矩阵来给出:
X=[x1,x2,…,xM]
(11)
式中:M为角度变化的数量,根据基于散射中心的HRRP模型式(9),可以得到X的表达式为
(12)
式中:
(13)
构成的矩阵A称为导向矩阵(或称字典),而其每个列向量称为导向矢量(或称原子),每个原子对应着在rk位置存在的单个散射中心所形成的HRRP。
由于目标的雷达HRRP具有姿态敏感性,会随着姿态角的变化而不断变化,而单层稀疏自编码器对数据的特征学习能力有限,因此需要设计多层的稀疏自编码器网络来对HRRP进行特征学习。HRRP的多层稀疏自编码器网络结构如图2所示,是通过多层稀疏自编码器连接而成的,层与层之间通过上一层隐含层作为下一层输入层的形式相连,输出特征为最后一层的隐含层值,从而可将多个自编码器堆叠构成深度结构,能够逐层压缩或提取数据特征供分析和后续应用。
图2 多层稀疏自编码器网络
本文中采用逐层编码的三层稀疏自编码器,经过三层稀疏自编码器网络之后,可将HRRP数据进行特征降维:
X=f(W1·f(W2·f(W3·Y+b3)+b2)+b1)
(14)
式中:X为HRRP;Y为三层降维后的特征;W1,W2,W3为每一层的权重系数,将三层网络的权重系数相乘,定义整个网络的综合权重系数W为
W=W1W2W3
(15)
不难看出,当激活函数f(·)取恒等函数时,综合权重系数W与前面定义的字典A完全相同,此时综合权重系数W即为网络学习到的字典。那么,对于非线性激活函数f(·),综合权重系数W与散射中心在距离域的字典A是否相关呢?本文后续内容将通过一系列仿真实验对该问题进行深入研究。
本文选取三类典型标准体目标进行试验,分别为三面角、二面角、立方体,然后采用高频法获得X波段下的宽带扫频数据。三类标准体模型如图3所示。
图3 典型标准体模型
三类标准体宽带数据仿真条件为:中心频率10 GHz;带宽2 GHz;频率间隔10 MHz;HH极化。入射方位角φ都是0°~90°,角度间隔为0.15°;三面角入射俯仰角θ为45°,二面角和立方体俯仰角为90°。其中,方位角定义为入射方向在X-Y面投影与X轴夹角,俯仰角定义为入射方向与Z轴夹角,如图3(d)所示。建模方法采用的是物理光学(physical optics, PO)[18]、等效边缘电磁流(equivalent edge currents, EEC)[19]和弹跳射线(shooting and bouncing ray, SBR)[20]技术相结合对目标进行多次反射计算。尺寸以及其他仿真条件如表1所示。
表1 典型标准体仿真条件
经过HRRP成像处理,可以获得三类标准体目标的HRRP历程图如图4所示。每类目标的数据集由600组HRRP构成,每组HRRP共1 024个采样点。
图4 典型标准体HRRP历程图
散射中心是与电磁散射机理相关联的,几何绕射理论模型是一种常用的散射中心参数化模型,因此可以基于该模型并利用基于旋转不变技术的信号参数估计(estimating signal paratheter via rotational invarionce techniques, ESPRIT)算法[21]从宽带数据中提取出散射中心的位置和强度。ESPRIT算法的基本思想是利用信号子空间的旋转不变特性,构造两个完全相同的信号子阵模型,通过特征分解、最小二乘等方法,估计出两个子阵之间的旋转算符,进而得到对散射中心参数的估计,具有较好的估计精度和稳定性,且分辨率高,不必进行谱峰搜索,因此常用于散射中心的位置和幅度参数的估计。
三类标准体高分辨散射中心位置特征提取结果如图5~图7所示。可以看出,三面角有一个主要的散射中心,主要由三次镜面反射机理形成;二面角由一个散射中心逐渐变为两个散射中心,当垂直共边入射时,主要为镜面反射机理形成单个“延展型”散射中心,在其他角度下为由边缘绕射形成的两个散射中心;立方体在从0°到45°和从45°到90°散射中心的变化过程对称,先由两个散射中心变为3个散射中心,再变回两个散射中心,主要是由立方体不同边缘的绕射所产生。
图5 三面角散射中心特征提取结果
图6 二面角散射中心特征提取结果
图7 立方体散射中心特征提取结果
将三类典型标准体的HRRP归一化后,作为稀疏自编码器网络的输入,每类标准体目标HRRP的角度范围从0°到90°,共600组一维像数据,送入深度学习网络进行训练。本文中第一层网络设置隐含层数目为256,第二层网络设置隐含层数目为64,第三层网络设置隐含层数目为9,从而实现1 024维距离像到9维特征的学习和降维过程,每层训练后自编码器的输出特征均为该层得到的非监督学习特征。从每一层网络中提取训练过程中的权重系数,并进行相乘,可以获取学习网络的综合权重系数W。
三面角、二面角、立方体三类标准体HRRP降维后的9维特征为9×600的矩阵,综合权重系数为9×1 024的矩阵,将降维特征和综合权重系数进行二维和一维显示,如图8~图10所示。综合权重系数矩阵由9个1×1 024的行向量组成,称每个行向量为综合权重系数向量。值得注意的是,每个综合权重系数向量与输入的一维距离像具有相同的维数。
图8 三面角深度学习特征提取结果
图9 二面角深度学习特征提取结果
图10 立方体深度学习特征提取结果
从网络降维过程中提取的综合权重系数(如图8~图10所示)中可以发现,大部分维度的权重系数向量都有比较强的峰值,但其他维度的权重系数向量没有强峰值,整体权重值都比较低,如图11所示。由于网络学习过程中不仅要对信号部分进行学习,还会对噪声部分进行学习,因此权重系数具有强峰值时则实现了对HRRP强散射中心的训练,而弱权重系数则会实现对一维像中噪声的训练。后续研究过程中需要首先去除噪声训练产生的权重系数。
图11 噪声训练权重系数
另外,有些不同维度的权重系数会比较相似,如图12所示,说明在降维过程中出现了冗余。多层特征学习会减少权重系数之间的冗余度,但是仍然会存在少量的冗余。因此,在关联性研究之前,需要去除掉冗余的权重系数。
图12 冗余权重系数
经过分析发现,综合权重系数峰值在距离维度上的位置与散射中心的位置有很强的吻合性,将去冗余和去除掉噪声权重系数向量后的权重系数按照散射中心位置随角度的变化规律重新排序,并与HRRP历程图相比,如图13所示,两者具有很强的相似性,说明权重系数向量峰值位置即为HRRP强散射中心的位置,不同维度的权重系数则可以实现对HRRP角度区域的划分。
图13 权重系数与散射中心历程图的对比
为进一步验证这个结果,将传统方法提取出的散射中心位置变化曲线与权重系数变化进行对比,如图14所示,可以看出,不同维度的权重系数峰值对应着不同角度区域中HRRP强散射中心的位置。其中,立方体HRRP关于45°左右两边是对称的,训练完的权重系数则仅需反映对称一侧的特征变化过程。
图14 权重系数与散射中心位置特征的对比
因此,综合权重系数矩阵W为与散射中心密切相关的类字典系数矩阵。综合权重系数W与由式(12)定义的散射中心在距离域的字典A是相关的,但W与字典A不完全相同,字典A的每个原子只有一个散射中心,而W中与信号相关的行向量可能有多个散射中心,即它可以看成字典A的多个原子的组合,故将其称为分子。每个分子中原子的个数与输入HRRP数据的散射中心个数有关,从而对于每个HRRP数据只需要一个分子就可以表达,从而利用HRRP稀疏自编码器网络学习后,可获得更为稀疏的表达。
从降维后的特征图中可以看出,降维特征能够反映不同距离单元内散射中心强度随角度的变化。由于第3层特征维度较少,难以直观反映出散射中心特征的变化,因此以第一层为例开展研究。第一层特征维为256,图15分别为二面角和三面角的第一层特征图,三面角仅有一个强散射中心,特征图中则可以反映出该散射中心位置和强度随角度的变化情况,并且仅保留了散射中心相关的距离维,去除了仅有噪声的距离维度。二面角有两个散射中心,但是两个散射中心是沿距离中心对称的,因此特征图中仅保留了一个散射中心的信息。通过上述分析可以发现,降维特征能够实现对强散射中心的学习和提取,反映了强散射中心位置和强度随角度的变化。从图15中可以看出,二面角的第一层降维特征图中提取到的散射中心在降维维数上会有展宽,这是因为二面角第一层训练得到的权重系数W矩阵中有很多向量是冗余的,字典不够稀疏,导致训练完后的特征量也会存在冗余,因此不同维度的特征结果相似,导致在特征图上会有展宽的现象。
图15 第一层降维后特征表示
利用稀疏自编码器对HRRP进行学习训练和特征挖掘过程中,训练层数和降维维数两个参数的选择非常重要,会直接影响训练效果和特征的准确性。下面分析网络训练层数和降维维数对学习效果的影响。
(1)网络训练层数影响分析
利用综合权重系数W对网络训练层数的影响进行分析,对比二面角和三面角的综合权重系数W,发现二面角三层网络的综合权重系数能够很好地实现方位角度区域的划分,并准确反映散射中心的位置,而三面角的三层综合权重系数则效果比较差,如图16所示。再对三面角的第一层权重系数进行分析,可以看出,第一层权重系数已经能够比较好地提取出散射中心的位置,由此可见,在学习过程中,并不是训练层数越多越好,层数的选择与输入数据有很大关系。
图16 二面角与三面角权重系数比较
对比二面角和三面角HRRP历程图发现,三面角的散射中心距离单元变化范围较大,而二面角的散射中心距离单元变化范围相对较小,导致在训练过程中,第一层训练完之后,三面角的权重系数冗余已经很少,而二面角权重系数则存在较多的冗余。再单独比较三面角经过两层降到64维和仅通过一层就降到64维的结果,如图17所示,发现单层网络降维后的结果要好于两层网络。结果表明,在权重系数冗余较多时,则需要再设置新的网络层进行训练,而权重系数冗余较少时,则不再需要做进一步的训练,此时单层网络已经足够。
图17 三面角单层网络与两层网络的权重系数比较
(2)网络降维维数优化选择
利用综合权重系数W的冗余度对降维维数的选择进行分析,冗余度定义为冗余维度数量与总维度的比值。以二面角为例进行说明,当降维到不同维数时的冗余度如表2所示。
表2 二面角降维维数与冗余度
可以看出,同网络层数一样,降维维数的选择同样与冗余度有很大关系,二面角在维度降低到15维之前,冗余度均在50%以上,此时应该降到更低的维数,冗余度最低时对应的维数即为能够完整表达HRRP数据的最小维数。因此,冗余度可以作为降维维数选择的重要依据之一。
上述主要针对二面角、三面角、立方体3类简单散射结构的仿真数据而开展研究的,其结果还需要推广到一般性复杂雷达目标去进行验证。因此,本文还选取了MSTAR标准体SLICY目标进行了学习训练,SLICY模型是由二面角、三面角反射器、平面、曲面、圆柱空腔、Tophat等结构复合而成的单个目标体,如图18所示。
图18 SLICY模型
对SLICY模型进行电磁散射特性计算,仿真条件以及入射角度定义与前面几类标准体一样,方位角从0°到360°,处理后一维距离像历程图如图19所示,几个强度比较大的散射中心主要由方板型三面角、三角板形三面角和圆柱顶帽等典型结构形成。利用稀疏自编码器对SLICY模型一维距离像进行深度学习,得到第一层(降维到256)的权重系数和降维特征如图20所示。
图19 SLICY模型一维距离像历程图
图20 SLICY模型深度学习特征
从图20中可以看出,权重系数矩阵是可以反映强散射中心位置随角度变化的分子集,降维特征实现了对强散射中心的学习和提取,可以反映出3~4个比较强的散射中心位置和强度随角度的变化过程。由于SLICY模型中几个散射中心的强度差异较大,因此第一层权重系数重点实现了对最大强度散射中心的学习训练,基本上每个维数的分子集中仅有一个原子。训练结果验证了本文对于稀疏自编码器深度网络特征与散射中心特征之间关联性的分析结论。
本文利用稀疏自编码器网络对典型标准体目标HRRP进行了学习训练,并通过综合权重系数和降维特征与散射中心位置和强度特征的对比分析,研究了稀疏自编码器深层特征与散射中心特征之间的关联性,对综合权重系数和深层降维特征的物理意义进行了解释。相关结论如下:
(1)深度学习网络的训练过程可以实现对方位角度区域的划分,并可以同时实现对信号部分和噪声部分的学习训练;
(2)综合权重系数矩阵为与散射中心密切相关的类字典系数矩阵,反映了强散射中心位置随角度变化的可能的分子集;
(3)降维特征能够实现对强散射中心的学习和提取,反映了强散射中心位置和强度随角度的变化;
(4)散射中心沿某一角度对称时,综合权重系数仅需保留一半的特征,从而可以实现更低维度的降维;散射中心沿某一距离单元对称时,降维特征只保留一半散射中心的特征,从而降低学习特征的维度;
(5)网络层数与降维维数对训练结果有很大的影响,当某层降维后权重系数的冗余度小于一定的值后,则不需要再增加网络层数;降维维数与散射中心距离变化和权重系数冗余度均有关系,当散射中心距离变化缓慢并且权重系数冗余度较高时,需要减小降维的维数。
本文首次针对HRRP稀疏自编码器网络特征与散射中心特征的关联性开展了深度学习特征的可解释性研究,得到了一些初步的结论,可为后续深度学习在雷达数据处理中的广泛应用提供有益的指导。但是仍有许多问题有待于进一步研究,如多层网络结构中每一层特征的物理意义、网络训练完成后特征角度区域的自动排序、网络层数与降维维数等参数的具体优化选择方法、稀疏自编码器在散射中心频率特征提取中的应用等等,后续还将加强深度学习网络在电磁散射特征提取与识别中的应用研究,为雷达目标的智能识别提供更有效的工具。