徐 彬 陈 渤 刘宏伟 金 林
基于注意循环神经网络模型的雷达高分辨率距离像目标识别
徐 彬①②陈 渤*①②刘宏伟①②金 林②
①(西安电子科技大学雷达信号处理国家重点实验室 西安 710071)②(西安电子科技大学信息感知技术协同创新中心 西安 710071)
针对雷达高分辨率距离像(HRRP)数据的识别问题,该文利用HRRP生成的时序特性,提出一种基于循环神经网络的注意模型。该模型利用具有记忆功能的循环神经网络对时域数据进行编码,并根据HRRP中不同距离单元所映射的隐层对目标识别的重要性,自适应地赋予隐层不同的权值系数,并根据隐层特征编码特征进行HRRP目标识别。该模型利用了隐藏在HRRP数据内部的目标结构信息,提高了特征的区分度。实测数据的实验结果表明,该方法可以有效地进行识别,在样本存在一定余度数据和样本偏移的情况下,都能准确地找出目标支撑区域。
雷达目标识别;高分辨距离像;循环神经网络;注意模型
雷达高分辨率距离像(HRRP)是用宽带雷达信号获取的目标散射点子回波在雷达视线方向投影的矢量和,它包含了目标尺寸和散射点分布等重要结构信息,并且易于获取、存储和处理,如今已成为了雷达自动目标识别(RATR)领域的一个重要的研究方向。针对雷达目标识别这一问题,大量学者进行了广泛的研究。文献[1]针对基于HRRP的一阶统计特性的模板匹配分类器(MCC-TMM)和融合一阶和二阶统计特性的自适应高斯分类器(AGC)两种不同方法的特性,提取对应的统计特征来进行目标识别。文献[2]对HRRP在一定方位角内进行均值平滑,然后通过支持向量机(SVM)来进行雷达目标识别。文献[3]在主成分分析(PCA)子空间投影特征基础上,构建最小重构误差准则实现HRRP目标识别。文献[4]利用冗余字典学习HRRP的稀疏表示特征,获得了较好的泛化能力。这些基于模型的特征都具有明确的物理含义,比较利于推广。但它们都是将HRRP样本作为一个整体来考虑,而没有考虑样本内部的相关性。鉴于这一特性,文献[5-7]提出了基于时序特性的隐马尔科夫模型。该方法先将HRRP作为一个序列特征来处理,然后将训练数据通过不同的方位角进行分帧建模,在测试阶段利用最大后验概率判断类别。这种方法考虑了目标内部的结构信息,并且通过分帧的方式解决了方位敏感性的问题。但是作为生成模型,需要先对模型分帧并对每一个分帧构建一个概率模型,每一个测试样本均要求解在所有模型下的后验概率,具有较高的计算量。
近年来,循环神经网络模型(RNN)在识别领域取得了不错的成果。该模型不仅能够通过编码的方式对数据提取特征,而且在隐层引入相关矩阵来考虑数据内部的相关性。除此之外,模型的非线性映射以及较大的状态空间使得模型的数据表达能力比较强。HRRP时域数据反映的是目标上的散射点沿雷达视线的分布情况,数据内部具有一定的相关性,因此本文将循环神经网络应用到HRRP目标识别中。基于循环神经网络的HRRP目标识别,每一个时刻都会输出一个类别,但是单个HRRP序列仅需要输出一个类别。基于原始循环神经网络的HRRP目标识别是通过投票的方式将HRRP类别归为所有时刻类别个数最多的那一类。对于不同类目标,HRRP中的支撑区域是不同的,即便是同一类目标在不同的姿态角下支撑区域也不相同。通常情况下,HRRP中还包含噪声区域。这种方法在投票过程中,不加区分地对不同距离单元的回波进行简单的投票加权,忽略了各部分对识别的差异,因而并不合理。
为了解决前面提出的问题,本文提出了一种基于循环神经网络的注意模型。该模型通过循环神经网络对序列数据进行编码,然后对数据每一个区域求解权值系数,使得HRRP样本不同区域在识别中起不同的作用。相比于前面的方法,该模型存在以下几个优点:首先,是一种端到端的判别模型,对于测试数据直接输出类别,不需要通过投票的方式来判断。其次,考虑到了样本内部的相关性,通过一种反馈的神经网络对样本进行编码使得提取的特征不仅仅包含当前的信息,也考虑了样本的结构信息。最后,考虑了样本不同的区域在识别中所起的作用是不相同的,通过对不同区域的隐层进行加权求和得到最终的隐层来进行识别,更符合HRRP目标识别的实际情况。通过实测数据验证了该模型的有效性,并且在测试样本存在一定偏移的情况下,也依然能够找出有效的识别区域。
文章结构安排如下,第2节具体描述循环神经网络与注意模型的结构;第3节说明将模型应用到HRRP上的具体步骤;第4节为实验部分,通过在实测数据上的实验来说明模型的有效性;最后为总结部分。
2.1 循环神经网络
循环神经网络最早是由文献[13]提出,专门用来解决序列数据问题。在处理过程中,循环神经网络在每一个时刻都会接收当前时刻的输入和前一时刻的隐层,并且输出类别或者预测的结果。
图1 展开的循环神经网络结构图
(2)
(4)
2.2 注意模型结构
本文提出了一种适用于高分辨距离像数据的注意模型,如图2所示。这种新的模型在原来循环神经网络的基础上,增加了权值系数这一项来衡量每一个数据段在进行识别中所起的作用,从而使得网络可以自适应地寻找存在可分性的区域。
图2 注意模型
在这个新的模型中,我们定义输出概率为
(7)
(9)
3.1 时域特征提取
图3是HRRP生成的示意图,它反映了在一定雷达视角时,目标上散射体(如机头、机翼、机尾等)的雷达散射截面积(RCS)沿雷达视线(RLOS)的分布情况,体现了散射点的相对几何关系[15]。在对HRRP数据进行识别时,首先要对HRRP提取时域特征,将时域特征序列化之后,利用循环神经网络进行处理。高分辨率距离像数据的波长远小于一般雷达目标的尺寸,时域回波包含了目标尺寸、散射点分布等许多重要的结构信息,可以通过散射中心模型进行描述。在距离像中的每一个距离单元都等于该距离单元内的所有的散射点目标回波叠加,而HRRP也就对应于一个复向量,表示第个距离单元的子回波,表示HRRP中距离单元个数。对当前的HRRP时域回波取幅值,即。
图3 HRRP生成示意图
3.2 HRRP预处理
由文献[2]可知,雷达目标的原始HRRP数据存在强度、平移敏感性等问题,这些敏感性对于雷达目标识别性能影响很大。本文对HRRP进行了2范数归一化来消除强度敏感性。HRRP的平移敏感性则是由于目标运动导致HRRP在距离门内发生平移,在本文中采用的是质心对齐方法,即求取HRRP的质心位置,并将质心位置平移至HRRP中心位置[4]。其中质心为
将预处理完之后的HRRP数据转化为序列数据,设经过预处理之后的1维距离像数据为
(14)
3.3 基于注意模型的雷达目标识别
HRRP样本包含目标重要的结构特征,体现了散射点的相对几何关系,对目标识别和分类很有价值。在当前时刻的维数据对应于目标的部分区域的散射点回波,而下一个时刻的维数据则对应于目标邻近部分区域的散射点回波。在同一个目标的情况下,我们认为相邻时刻的数据之间存在一定的相关性[5]。因此,将注意模型应用于预处理后的数据。
将注意模型应用于时域特征的HRRP主要包括训练阶段和测试阶段。训练阶段主要是利用雷达目标HRRP的时域特征来建立模型,通过目标函数对模型中的参数进行调节,从而使得当前的模型可以更好地表达训练数据。测试数据的主要任务则是在已经训练好的网络结构的基础上,输出测试数据属于每一类目标的概率,将测试目标归为最大概率类别。训练阶段和测试阶段的具体步骤如下所示:
(1)训练阶段:
(2)测试阶段:
步骤1 对于给定的测试样本进行同训练样本相同的预处理方式,即能量归一化,绝对对齐处理以及滑窗处理得到测试数据时域特征。
4.1 实验数据介绍及实验设置
本文的识别实验使用的是国内某所的逆合成孔径雷达(ISAR)的飞机飞行数据,其中雷达和飞机的参数如表1所示,3类飞机的航迹在地面上的投影如图4所示。实验的飞机有3种,其中“安-26”为中小型螺旋桨飞机,“奖状”为小型喷气飞机,“雅克-42”为中型喷气飞机。从飞行的航迹可以看出,“奖状”和“安-26”飞机的HRRP数据均给分成了7段,“雅克-42”飞机的HRRP数据给分成了5段。为了更全面地考虑方位角信息,本文采用“雅克-42”的第2, 5 段,“奖状”的第6, 7 段,“安-26”的第5, 6段数据作为训练样本,用来训练模型;其他的数据段作为测试样本来验证算法的性能。训练和测试数据均为间隔20采样,训练样本个数为7375,测试数据的样本个数为16655。图5给出了3类目标的距离像的时域特征,它反映了3类飞机的物理结构特征。
图4 雅克-42,奖状和安-26飞机的航迹图
表1 ISAR实验雷达和飞机参数
4.2 模型性能比较
本实验将基于循环神经网络的注意模型同两种降维提取特征的方法进行了比较,除此之外,还同原始神经网络模型以及同样处理序列数据的HMM模型进行了比较。其中PCA降维至同隐层维度相同的50维,LDA降维之后采用线性支撑向量机(LSVM)来进行识别。原始循环神经网络是经过模型的编码之后对于每一个时刻的隐层进行识别,然后将识别结果通过投票的方式得到最终识别结果。HMM在HRRP中的应用采用文献[7]中的方法,将原始HRRP滑窗序列化,然后分帧建立模型。
表2中,PCA为降维的方法,在将样本降低至同样维度的情况下,ARNN的识别结果比该方法要高大约5个百分点。对于LSVM,当前的网络模型主要存在两个优点:(1)由于LSVM采用二次规划来求解支撑向量,而求解二次规划涉及阶矩阵求解问题(为样本个数),没有办法处理大量训练样本。而ARNN采用批量学习的方法,每次参数更新时可以通过目标函数对部分训练样本求偏导来进行更新,可以处理大量的训练数据。(2)原始LSVM更适合做二分类问题,而对于多分类则需要进行改进。ARNN模型输出的是样本属于每一类的概率,因此,更适合于多类别问题。
图5 时域特征
表2 不同方法的识别结果
方法LDAPCAHMMLSVMRNNARNN 识别结果0.7300.8300.8700.8800.8500.883
另外两种降维提取特征的方法相比于基于循环神经网络编码方法进行的特征提取得到的目标识别效果要低。除此之外,原始循环神经网络的识别结果相比于注意模型的结果也要低大约3个百分点,主要是有两个方面的原因。第一,注意模型可以寻找有效的区域进行识别,而不是将全部的数据(包括噪声)来识别;第二,注意模型是一个端到端的模型,模型更利用训练。同样是对数据序列化来进行处理,HMM是对数据每一帧建立一个模型,同时设置模型的状态。相对而言,循环神经网络隐层的非线性映射和更大的状态空间使得模型的表达能力更强,这也可能是当前模型的结果优于HMM的原因。
4.3 注意模型同原始循环神经网络对比
由于3类飞机的长度不同,在不同姿态角下的径向长度也不同,因此在接收的回波数据中噪声部分和目标部分所占的距离单元也不同。原始循环神经网络对于每一个时刻的隐层进行识别,然后每一个时刻的识别结果通过投票的方式得到最终的识别结果。噪声部分区域是不具备识别能力的,按照投票的方式进行识别,目标区域同噪声区域在识别中所起的作用是相同。
为了验证注意模型在HRRP上的有效性,本实验将注意模型同原始循环神经网络进行了对比。
原始数据经过处理之后变为长度为15的序列,图6(a)显示了测试数据不同时刻隐层特征的识别结果,其中前面的0~4个时刻以及11~14时刻对应的为噪声区域,中间部分对应的为目标区域。由于前面的噪声区域并不具备识别能力,因此识别结果比较差。从上面的识别结果看出,可识别区域集中在目标部分。而由于原始神经网络的记忆功能,使得11~14区域的隐层也包含了一定的识别能力。在这种情况下,注意模型可以自动地寻找可识别的区域,从而赋予目标区域较大的权值,而对于噪声区域赋予较小的权值。图6(b)对应的是测试样本不同时刻的权值系数,其中横坐标为不同的测试样本,纵坐标为样本在不同时刻所对应的系数。从图6(b)可以看出权值系数主要集中在6~10区域,即目标区域。我们取出其中一个测试样本,然后用虚线在原始HRRP中画出较大权值系数对应的距离单元,即图6(c)。从图中可以看出,在识别中真正在起作用的是HRRP的目标区域,当前的注意模型可以自动地找出可识别区域。
4.4 可视化分析
图7给出了经过RNN编码之后的隐层和原始HRRP的2维PCA可视化投影,可以比较直观地看出,本文所提方法获得的特征,不同类样本间的重叠区域较小,可分性更好。相比于原始的HRRP的2维PCA投影,注意模型经过循环神经网络编码和隐层加权求和之后得到的特征具有更好的可分性。
4.5 样本平移对权值系数的影响
通常情况下,距离像数据的平移敏感性会对模型造成一定的影响。在前面的预处理中,滑窗的长度取32,滑动距离为16。因此,本实验测试样本在平移16个距离单元和32个距离单元情况下的权值系数。在模型已经训练好的前提下,对测试样本分别平移16个距离单元和32个距离单元,求出当前情况下的权值系数。当前的权值系数与未平移的测试样本的权值系数的相关系数,其中,为原始系数的第个距离,为平移之后的权值系数。图8(a)为平移16个距离单元的相关系数,从图中可以看出在横轴为14的时候取得最大值,意味着在样本平移一个时刻的情况下,权值系数也随之平移了一个时刻。图8(b)为平移32个距离单元的情况下权值系数也随之平移了两个时刻。说明在样本存在平移时,模型也依然能够找到支撑区域来进行目标识别。
图6 实验结果
图7 2维PCA投影
图8 权值系数平移之后的相关系数
本文提出了一种针对HRRP目标识别问题的注意循环神经网络模型。该模型考虑了目标时序数据内部之间的相关性,先利用循环神经网络对时域回波进行编码,然后对不同的距离单元赋予不同的权值系数来决定其在目标识别中所起的作用。在实测数据上的实验结果表明该模型不仅能够提取出有效的特征来进行识别,在目标存在一定偏移和余度数据时也能够寻找出有效的可识别区域。
[1] 张英军, 白向辉. 雷达自动目标识别中的HRRP特征提取研究[J]. 系统工程与电子技术, 2007, 29(12): 2047-2053. doi: 10.3321/j.issn:1001-506x.2007.12.012. ZHANG Junying and BAI Xianghui. Study of the HRRP feature extraction in radar automatic target recognition[J]., 2007, 29(12): 2047- 2053. doi: 10.3321/j.issn:1001-506x.2007.12.012.
[2] 梁海涛, 张学礼, 童创明, 等. 基于小波分解与方位角平均HRRP的SVM目标识别方法[J]. 数据采集与处理, 2010, 25(1): 29-35. doi:10.3969/j.issn.1004-9037.2010.01.006. LIANG Haitao, ZHANG Xueli, TONG Chuangming,. SVM target identification method based on wavelet decomposition and azimuth average HRRP[J].&, 2010, 25(1): 29-35. doi: 10.3969/j.issn.1004-9037.2010.01.006.
[3] DU Lan, LIU Hongwei, BAO Zheng,. Radar automatic target recognition using complex high-resolution range profiles[J].,&, 2007, 1(1): 18-26. doi: 10.1049/iet-rsn:20050119.
[4] FENG B, DU L, LIU H W,. Radar HRRP target recognition based on K-SVD algorithm[C]. IEEE CIE International Conference on Radar, Chengdu, 2011: 642-645.
[5] 潘勉, 王鹏辉, 杜兰, 等. 基于TSB-HMM模型的雷达高分辨距离像目标识别方法[J]. 电子与信息学报, 2013, 35(7): 1547-1556. doi: 10.3724/SP.J.1146.2012.01190. PAN Mian, WANG Penghui, DU Lan,. Radar HRRP target recognition based on truncated stick-breaking hidden Markov model[J].&, 2013, 35(7): 1547-1556. doi: 10.3724/SP.J.1146. 2012.01190.
[6] PAN Mian, DU Lan, WANG Penghui,. Multi-task hidden Markov modeling of spectrogram feature from radar high-resolution range profiles[J]., 2012, 2012(1): 1-17. doi: 10.1109/CIE-Radar.2011.6159624.
[7] JI S H, LIAO X J, and CARIN L. Adaptive multi-aspect target classification and detection with hidden Markov models[C]. International Conference on Acoustics, Speech and Signal Processing, Montreal, 2004: 125-129.
[8] GREGOR K, DANIHELKA I, GRAVES A,. DRAW: A recurrent neural network for image generation[C]. Proceedings of the 32nd International Conference on Machine Learning, Lille, 2015: 1-8.
[9] ZAREMBA W and SUTSKEVER I. Recurrent neural network regularization[C]. International Conference on Learning Representations, San Diego, 2015: 1-8.
[10] SRIVASTAVE N, MANSIMOV E, and SALAKHUTDINOV R. Unsupervised learning of video representations using LSTMs[C]. Proceedings of the 32nd International Conference on Machine Learning, Lille, 2015: 1-9.
[11] LI J W, LUONG M T, and JURAFSKY D. A hierarchical neural autoencoder for paragraphs and documents[C]. Proceedings of the 53rd Annual Meeting of the Association for Computational Linguistics and the 7th International Joint Conference on Natural Language Processing, Beijing, 2015: 1106-1115.
[12] CHEN J X, YANG L, ZHANG Y Z,. Combining fully convolutional and recurrent neural networks for 3D biomedical image segmentation[C]. 29th Conference on Neural Information Processing Systems, Barcelona, 2016: 1-9.
[13] ELMAN J L. Finding structure in time[J]., 1990, 14(2): 179-211.
[14] CHOROWSKI J, BAHDANAU D, SERDYUK D,. Attention-based models for speech recognition[C]. 27th Conference on Natural Language Processing Systems, Montreal, 2015: 1-19.
[15] SU B and LU S J. Accurate scene text recognition based on recurrent neural network[C]. 12th Asian Conference on Computer Vision, Singapore, 2015: 35-48.
徐 彬: 男,1988年生,博士生,研究方向为雷达目标识别.
陈 渤: 男,1979年生,教授,研究方向为统计机器学习、雷达目标识别、统计深度网络等.
刘宏伟: 男,1971年生,教授,长江学者,研究方向为雷达信号处理、雷达自动目标识别、认知雷达、协同探测等.
Attention-based Recurrent Neural Network Model for Radar High-resolution Range Profile Target Recognition
XU Bin①②CHEN Bo①②LIU Hongwei①②JIN Lin②
①(,,’710071,)②(,,’710071,)
To improve the performance of radar High-Resolution Range Profile (HRRP) target recognition, a new attention-based model is proposed based on time domain feature. This architecture encodes the time domain feature which can reveal the correlation inside the target with Recurrent Neural Network (RNN). Then, this model gives a weight to each part and sums the hidden feature with each weight for the final recognition. Experiments based on measured data show that the attention-based model is effective for radar HRRP recognition. Furthermore, the proposed method can still find the support areas even with the removed test data.
Radar Automatic Target Recognition (RATR);High-Resolution Range Profile (HRRP); Recurrent Neural Network (RNN); Attention-based model
TN957.51
A
1009-5896(2016)12-2988-08
10.11999/JEIT161034
2016-10-08;改回日期:2016-11-25;
2016-12-14
陈渤bchen@mail.xidian.edu.cn
国家杰出青年科学基金(61525105),国家自然科学基金(61201292, 61322103, 61372132),全国优秀博士学位论文作者专项资金(FANEDD-201156)
The National Science Fund for Distinguished Young Scholars (61525105), The National Natural Science Foundation of China (61201292, 61322103, 61372132), The Program for New Century Excellent Talents in University (FANEDD-201156)