基于注意力机制的雷达有源干扰信号识别

2021-11-12 11:19陈涛李君汪向阳黄湘松
航空兵器 2021年5期
关键词:注意力机制特征提取

陈涛 李君 汪向阳 黄湘松

摘 要:针对复杂背景下, 无法有效识别雷达有源干扰信号的问题, 提出一种基于注意力机制的雷达有源干扰信号识别算法。 首先将干扰信号的时频图输入到特征提取网络中, 得到时频图的深度特征; 然后引入注意力机制, 通过RPN网络, 定位干扰信号的位置, 得到受关注区域; 最后对受关注的区域进行干扰信号类型识别。 仿真结果表明, 该算法可在复杂背景下完成对干扰信号的定位、 识别以及分离。 相比于卷积神经网络, 减少了一半的训练样本, 提高了训练效率, 同时总体识别正确率提高了10%, 可以达到95%。

关键词: 注意力机制; 特征提取; 干扰识别; 有源干扰; RPN; 雷达信号

中图分类号: TJ765; TN972+.1 文献标识码:    A 文章编号: 1673-5048(2021)05-0086-06

0 引  言

空间中的干扰信号和雷达信号是并存的,  雷达想要适应干扰信号, 首先要了解干扰信号的类别, 根据类别调整发射信号, 因此对干扰信号识别的研究具有重要意义。 雷达干扰信号分为有源干扰和无源干扰, 本文主要对雷达有源干扰信号进行识别。

目前, 国内外学者对雷达有源干扰识别开展了大量研究。 王桂胜等[1]针对变换域干扰识别的问题, 提出从信号空间理论角度对干扰信号进行特征提取, 采用支持向量机对干扰信号进行识别的算法, 但该算法运算量较大, 而且在高干噪比下才有较高的识别正确率。 方芳等[2]针对基于高阶累积量和信号特征空间提取特征参数的识别算法复杂繁琐的问题, 提出从时域、 频域、 变换域等多维域提取特征参数, 采用决策树进行识别,  该算法简单, 但是在低干噪比下识别正确率较低。 随着深度学习的发展, 深度学习网络在干扰识别的应用越来越多, 相比于经典的支持向量机和决策树机器学习算法, 深度学习网络降低了手工提取信号特征参数的复杂性, 并且有更高的识别正确率。 Wang[3]等针对传统识别方法效率低和精度低的问题, 通过采用卷积神经网络的方法对雷达有源干扰信号进行了识别, 虽然该算法有较高的识别正确率, 但是针对的只是单个干扰信号的识别, 在雷达环境日益复杂的背景下, 一个雷达脉冲中可能夹杂着多个干扰信号, 仅对单个干扰信号识别缺乏实际意义。 池添放[4]将线性调频干扰和噪声调频干扰叠加在一起的时频图用来训练, 利用训练好的网络模型完成对叠加干扰信号的识别, 但是信号的组合类型非常多, 采用这种识别方式的训练样本过大, 识别效率低。

基于卷积神经网络的干扰识别算法是对整张时频图的识别, 对图片的全部特征是等价处理的, 然而图片中目标信号部分是重要信息, 其他部分是无关信息。 无关信息不仅会影响识别的效率, 还会影响识别的结果。 当图片中频谱弥散干扰与噪声调频干扰同时存在, 且频谱弥散干扰部分占更大的比例时, 卷积神经网络会将图片识别成频谱弥散干扰, 而无法识别噪声调频干扰。

针对以上问题, 引入注意力机制, 使网络只关注重点信息, 忽略无关信息。 通过软注意力类型的RPN网络得到受关注的区域, 将受关注区域输入到分类网络里进行干扰信号类型识别。

本文采用带有RPN网络的Faster R-CNN网络模型对干扰信号进行识别。 Faster R-CNN作为经典的目标检测网络, 用来检测图片中要识别的目标,首先得到目标的位置,  再进行识别,  相比于YOLO和SSD具有更高的检测精度; 整个检测网络共享全图的卷积特征, 相比于R-CNN和Fast R-CNN具有更快的检测速度[5-7]。 针对Faster R-CNN模型里RPN网络对干扰信号定位不准确的问题, 对候选框进行修改, 使候选框的大小比例与目标信号更加契合, 得到更加精确的受关注区域。 在干扰信号定位精确的前提下, 采用单信号的时频图训练, 利用训练好的模型可完成对时频图中多个干扰信号的识别及分离, 提高训练效率的同时保证了识别的正确率。

1 识别过程

基于注意力机制的雷达有源干扰信号识别过程如图1所示, 将输入的有源干扰信号的时频图进行尺寸归一化, 并输入至Faster R-CNN网络中, 通过CNN特征图提取网络得到特征图, 通过RPN网络定位干扰信号的位置, 最后输入到分类网络中, 对干扰信号的类型进行识别[8-9]。

1.1 CNN特征提取网络

本文训练时输入的时频图像尺寸为677×535, 首先将尺寸调整为800×600输入到CNN特征提取网络中。

CNN特征提取网络包含13个卷积层, 13个激活层和4个池化层, 所有的卷积层的卷积核大小为3×3, 步长为1, pad为1, 卷积层不改变图片的大小。 所有池化层的卷积核大小为2×2, 步长为2, pad为0, 每经过一次池化, 图片的长宽都会变成池化之前图片长宽的1/2。 一个 M×N 大小的图片经过CNN特征提取网络得到 (M/16)×(N/16) 大小的特征图。

1.2 RPN网络

RPN网络分为三个部分, 第一部分是候选框回归层, 用于计算候选框的位置回归偏移量; 第二部分是分类层, 通过softmax分类获得候选框是正样本还是负样本, 是一个二分类; 第三部分负责综合正样本和对应的位置回归偏移量获取目标建议框, 得到受关注的区域。

1.2.1 候选框

滑动窗口实质上是一个3×3的卷积核, 以特征图上每个点为中心, 以步长为1在特征图上进行滑动。 将滑动窗口的中心点映射到原图片上, 由于特征图是经过原图片16倍放大得来的, 所以特征图上的每个点对应原图片上的16×16区域, 以该区域为基础框, 对其进行长宽分别2∶1, 1∶1和1∶2的变换, 得到23×12,  16×16和11×22共3种框。 这3种框相比于目标信号的區域太小, 分别将其放大8倍、 16倍和32倍, 得到184×96, 128×128, 88×176, 368×192, 256×256, 176×352, 736×384, 512×512和352×704共9种框, 作为候选[10]。

滑动窗口会遍历特征图上的每个点, 滑动窗口每滑过一个点, 对应原图片上的区域移动16个点, 其对应候选框的中心点移动了16个点。 原图片经过CNN网络生成特征图的大小为50×38, 滑动窗口遍历完所有的点, 一共生成17 100个候选框。 候选框的数量过多, 通过非极大值抑制的方法分别选取128个正样本和128个负样本, 与真实目标框(人为标记的矩形框)有最大Iou(候选框与真实目标框的并集与交集的比例)的128个候选框作为正样本, 与真实目标框有最小Iou的128个候选框作为负样本。 对正样本和负样本计算分类损失, 对正样本计算回归损失, 并进行位置回归[11]。

1.2.2 候选框回归

图2为候选框与真实目标框图, 图中绿色框为线性扫频干扰的真实目标框(手工标注), 红色为提取的候选框, 需采取一种方法对紅色框进行微调, 使得候选框与真实目标框更加接近。

将一个窗口用四维向量 (x,  y,  w,  h) 表示, 寻找一种关系, 使得候选框经过映射得到一个与真实目标框更加接近的回归窗口,  如图3所示。 图中, A为候选框窗口, G为真实目标框, H为回归窗口。

由候选窗口到回归窗口, 一种简单的变换是先进行平移, 后进行缩放。

平移时, 候选窗口的中心坐标 (Ax, Ay) 分别加上平移量(Δ x,  Δ y) , 得到回归窗口的中心坐标 (Hx, Hy) :

Hx= Δ x+AxHy= Δ y+Ay (1)

式中:  Δ x=Aw·dx(A);  Δ y=Ah·dy(A) 。

缩放时, 将候选窗口的长宽 (Aw, Ah) 进行相应倍数缩放得到候选窗口的长宽 (Hw, Hh) :

Hw=Aw· exp dw(A)Hh=Ah· exp dh(A))  (2)

4个系数做回归的候选框离真实目标框很近, 可以看作是一种线性变换, 可以采用线性回归获得 dx(A) ,  dy(A) ,  dw(A) ,  dh(A) 这4个比例系数。

线性回归是给定输入的特征向量, 学习一组参数, 使得线性回归后的值和真实值非常接近。 对于该问题, 经过特征提取网络输出的特征图是 50×38×512 , 特征图上每个像素点是512维的, 输入为每个像素点对应的512维特征向量, 因为在一个点上生成9个候选框, 输出的是这9个候选框分别对应的预测值( dx(A) ,  dy(A) ,  dw(A) ,  dh(A) ), 即输出是36维的。 目标函数定义为

d(A)=WX (3)

式中: X为特征图上一个点对应的特征向量; W为需要学习的参数;  d(A) 为得到的预测值。

得到的预测值与真实值的变换系数之间仍然有差距, 需要让其差距更小, 定义损失函数[12-13]:

Loss=∑i∈x, y, w, h smoothL1(ti-di(A)) (4)

式中:  ti 为候选框到真实目标框之间的变换系数;   smoothL1 损失函数为

smoothL1=0.5x2  if x<1

x-0.5    otherwise (5)

候选框到真实目标框之间的变换如下:

tx=Gx-AxAwty=Gy-AyAh

tw= lg (Gw/Aw)

th= lg (Gh/Ah)  (6)

1.2.3 候选框的修改

本文训练使用的时频图中, 信号所占区域的长宽比例在3∶1以上, 原始网络中生成的9种候选框与目标信号差距过大, 不利于候选框做回归, 会造成目标建议框定位不准确。 对9种候选框的长宽比例做修改, 改为2∶1, 4∶1和8∶1, 放大比例改为8倍、 16倍和20倍, 不会造成倍数过大产生所有比例的框超出边界, 也不会造成倍数小产生候选框与目标差距过大。 经过尺寸调整后, 得到184×96, 256×64, 384×48, 368×176, 512×128, 768×96, 460×120, 640×160和960×120共9种框。

1.3 分类网络

通过RPN网络得到的目标建议框是生成在原图片上的, 需要将其映射到特征图上。 不同大小的目标建议框对应特征图的大小也不同, 在输入到全连接层之前需要将其变换至固定大小。 感兴趣区域池化实现了这两个过程。 池化原理: 将大小不同的特征图的长宽分别分为7份, 对每一份进行最大值池化, 输出7×7的大小。

将感兴趣区域池化后的特征图输入到两个全连接层里, 之后分别送入到分类层和边框回归层, 分类层输出干扰信号的类别, 边框回归层对建议框进行位置精修, 输出更加精确的目标框。

2 实验流程及仿真结果

2.1 实验环境

实验过程在Windows 10系统下调试运行, 深度学习框架使用的是tensorflow 1.13.1, 编程语言是python, 深度学习网络的训练过程是在CPU的环境下。

2.2 干扰信号数据集的建立

本文所用到的干扰信号类型有单音干扰、 线性扫频干扰、 频谱弥散干扰、 切片干扰、 噪声调幅干扰和噪声调频干扰[14-15]。 所有干扰信号的采样频率为1 GHz, 采样点数为5 000, 中心频率在85~250 MHz随机取值, 信号带宽在65~125 MHz随机取值, 参数设置见表1。

在干噪比为-6~8 dB,  每间隔2 dB产生一组样本, 每类干扰在每种干噪比下产生100幅时频图, 时频分析方法采用SPWVD分布[16]。 每个干扰总共产生100×8=800幅时频图, 6种干扰总共产生4 800幅时频图。

按照VOC2007数据集的格式对干扰信号的时频图进行手工标注目标框和标签。 制作完成数据集, 并用此数据集进行训练。

2.3 仿真结果

2.3.1 噪声背景下仿真结果

建立测试集, 每类干扰在每种干噪比下生成100个样本, 共5 600组样本用来测试, 测试结果如图4所示。  由图可知, 时频图经过Faster R-CNN网络, 完成了干扰信号的定位以及识别, 红色框表示干扰信号的位置, 红色框左上角显示了干扰信号的类别以及概率。

单信号的识别正确率和总体识别正确率对比如图5所示。

由图5(b)可知, 当干噪比在-4 dB以上时, 本文算法对每类干扰的识别正确率达到100%; 基于信号空间理论提取干扰信号的空间频谱带宽、 空间时域峰均比和空间功率谱平坦度等特征参数, 采用支持向量机的干扰识别算法在干噪比为-2 dB时, 对每类干扰的识别正确率达到100%; 基于时域、 频域以及变换域提取干扰信号的幅度峰均比、 归一化带宽和单频因子系数等特征参数, 采用决策树的识别算法在干噪比为6 dB时, 对每类干扰的识别正确率才达到100%, 而且该算法在低干噪比下识别正确率很低。 由此可见, 与经典的支持向量机和决策树算法相比, 本文的总体识别正确率更高。

2.3.2 复杂背景下仿真结果

在单音干扰、 线性扫频干扰、 频谱弥散干扰和切片干扰中掺入其他信号, 两两进行复合, 时域交叠而频域不重合。 在每种干噪比下建立200组混合信号的测试集, 进行测试。 识别结果如图6~8所示。

复杂背景下每种干噪比的识别正确率如图9所示。  由图9(a)可以看出, 本文算法对线性扫频干扰的识别效果不佳, 对切片干扰和频谱弥散干扰的识别效果更好。

由图9(b)可以看出, 本文算法在同时出现两个干扰的情况下, 在每种干噪比下的识别正确率都达到93%以上。 采用卷积神经网络识别的算法正确率在干噪比大于0 dB时, 不高于90%, 且随着干噪比增加, 识别正确率逐渐降低。 由此可以看出, 相比于卷积神经网络, 本文算法的性能更好。

2.3.3 候选框修改前后识别结果对比

Faster R-CNN网络中原本生成的候选框的大小与真实目标信号的差距过大, 会造成当两个信号距离近的时候, 无法定位目标信号的问题。 经过候选框修改后的网络解决了这个问题, 如图10所示。

3 结  论

本文提出了基于注意力机制的雷达有源干扰信号识别算法。 引入注意力机制, 修改候选框, 定位干扰信号的位置, 当出现其他信号影响待识别的干扰信号時, 实现了干扰信号的定位以及识别; 使用单信号的样本进行训练, 提高了训练效率又保证了识别的准确率。 仿真实验表明, 在复杂背景下, 该算法对单信号的识别正确率较高, 对多个干扰信号同时识别也有着不错的正确率。

参考文献:

[1] 王桂胜,  任清华,  姜志刚,  等. 基于信号特征空间的TDCS干扰分类识别[J]. 系统工程与电子技术,  2017,  39(9): 1950-1958.

Wang Guisheng,  Ren Qinghua,  Jiang Zhigang,  et al. Jamming Classification and Recognition in Transform Domain Communication System Based on Signal Feature Space[J]. Systems Engineering and Electronics,  2017,  39(9): 1950-1958.(in Chinese)

[2] 方芳,  李永贵,  牛英滔,  等. 基于决策树算法的干扰信号识别[J]. 通信技术,  2019,  52(11): 2617-2623.

Fang Fang,  Li Yonggui,  Niu Yingtao,  et al. Jamming Signal Reco-gnition Based on Decision Tree Algorithm[J]. Communications Technology,  2019,  52(11): 2617-2623.(in Chinese)

[3] Wang Y F,  Sun B Y,  Wang N. Recognition of Radar Active-Jamming through Convolutional Neural Networks[J]. The Journal of Engineering,  2019,  2019(21): 7695-7697.

[4] 池添放. 基于CNN的四类干扰信号识别算法[D]. 武汉: 华中科技大学,  2019.

Chi Tianfang. Recognition Algorithm for the Four Kinds of Interference Signals[D]. Wuhan: Huazhong University of Science and Technology,  2019. (in Chinese)

[5] Ren S Q,  He K M,  Girshick R,  et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,  2017,  39(6): 1137-1149.

[6] Liu B,  Zhao W C,  Sun Q Q. Study of Object Detection Based on Faster R-CNN[C]∥Chinese Automation Congress (CAC),   2017: 6233-6236.

[7] 郑渝,  沈永健,  周云生. Faster R-CNN实现交叠雷达信号的调制识别与参数提取[J]. 遥测遥控,  2019,  40(3): 32-40.

Zheng Yu,  Shen Yongjian,  Zhou Yunsheng. Radar Signal Modulation Identification Based on Multilayer Bidirectional LSTM[J]. Journal of Telemetry, Tracking and Command,  2019,  40(3): 32-40.(in Chinese)

[8] Basri H,  Syarif I,  Sukaridhoto S. Faster R-CNN Implementation Method for Multi-Fruit Detection Using Tensorflow Platform[C]∥2018 International Electronics Symposium on Knowledge Creation and Intelligent Computing (IES-KCIC),  2018: 337-340.

[9] Abbas S M,  Singh D S N. Region-Based Object Detection and Classification Using Faster R-CNN[C]∥4th International Conference on Computational Intelligence & Communication Technology (CICT),  2018: 1-6.

[10] Cai W D,  Li J D,  Xie Z Z,  et al. Street Object Detection Based on Faster R-CNN[C]∥37th Chinese Control Conference (CCC),  2018: 9500-9503.

[11] Zhu B B,  Wu X Y,  Yang L,  et al. Automatic Detection of Books Based on Faster R-CNN[C]∥Third International Conference on Digital Information Processing,  Data Mining,  and Wireless Communications (DIPDMWC), 2016: 8-12.

[12] Tang J H,  Mao Y C,  Wang J,  et al. Multi-Task Enhanced Dam Crack Image Detection Based on Faster R-CNN[C]∥ IEEE 4th International Conference on Image,  Vision and Computing (ICIVC), 2019: 336-340.

[13] Yang J Q,  Ren P,  Kong X X. Handwriting Text Recognition Based on Faster R-CNN[C]∥Chinese Automation Congress (CAC),  2019: 2450-2454.

[14] 陳玉绒,  闫泽林,  吴若妤,  等. 雷达有源压制式干扰信号建模与仿真[J]. 智能计算机与应用,  2019,  9(5): 220-222.

Chen Yurong,  Yan Zelin,  Wu Ruoyu,  et al. Modeling and Simulation of Radar Active Suppression Jamming Signal[J]. Intelligent Computer and Applications,  2019,  9(5): 220-222.(in Chinese)

[15] 罗彬珅,  刘利民,  刘璟麒,  等. 噪声调制类有源干扰信号识别技术研究[J]. 雷达科学与技术,  2019,  17(6): 597-602.

Luo Binshen,  Liu Limin,  Liu Jingqi,  et al. Research on Noise Modulated Active Jamming Signal Recognition Technology[J]. Radar Science and Technology,  2019,  17(6): 597-602.(in Chinese)

[16] 李秀梅,  楊国青. 几种时频分析方法的性能比较[J]. 计算机仿真,  2015,  32(3): 220-224.

Li Xiumei,  Yang Guoqing. Performance Comparisons among Time-Frequency Representations[J]. Computer Simulation,  2015,  32(3): 220-224.(in Chinese)

Recognition of Radar Active Jamming Signal

Based on Attention Mechanism

Chen Tao1, 2, Li Jun1, 2*, Wang Xiangyang3, Huang Xiangsong1, 2

(1.College of Information and Communication Engineering,  Harbin Engineering University, Harbin 15001, China;

2.Key Laboratory of Advanced Marine Communication and Information Technology, Ministry of Industry and Information

Technology, Harbin 150001, China; 3.Unit 63861 of PLA, Jilin 137001, China)

Abstract: Aiming at the problem that radar active jamming signal cannot be recognized effectively in complex background,  a recognition algorithm of radar active jamming signal based on attention mechanism is proposed. Firstly,  the time-frequency map of the interference signal is input into the feature extraction network to obtain the depth feature.  Then,  the attention mechanism is introduced to locate the location of  interference signal through RPN network to get the region of interest. Finally,  the type of interference signal is identified for the region of interest. The simulation results show that the algorithm can locate,  recognize and separate jamming signals in complex background. Compared with convolution neural network,  the training sample is reduced by half,  and the training efficiency is improved. At the same time,  the overall recognition accuracy is  improved by 10%,  which can reach 95%.

Key words: attention mechanism; feature extraction; recognition of jamming;  active jamming; RPN; radar signal

猜你喜欢
注意力机制特征提取
面向短文本的网络舆情话题
基于自注意力与动态路由的文本建模方法
基于深度学习的问题回答技术研究
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
基于LSTM?Attention神经网络的文本特征提取方法
基于注意力机制的双向LSTM模型在中文商品评论情感分类中的研究
InsunKBQA:一个基于知识库的问答系统
基于曲率局部二值模式的深度图像手势特征提取
一种针对特定无线电信号的识别方法
基于模糊K近邻的语音情感识别