基于自编码器的雷达信号联合预分选方法

2022-11-03 12:29张星池
电光与控制 2022年10期
关键词:特征参数特征向量编码器

张星池, 胡 进

(中国船舶重工集团公司第七二四研究所,南京 211000)

0 引言

随着雷达信号波形设计不断改进,常规脉冲雷达逐渐被脉内调频调相、频率分集和频率捷变等新体制雷达取代[1]。在雷达辐射源信号形式越来越复杂的今天,常规的5大参数已不能完整表述现代雷达信号,难以对雷达信号做出准确描述[2]。

在雷达信号变化丰富的同时,脉内特征参数由于具有一定的稳定性而引起了学界的注意。许多学者尝试提取多种脉内特征参数用于聚类分选,如盒维数、稀疏性特征、双谱熵特征和维格纳熵特征等[3-4]。由于单个脉内特征参数提供的特征信息有限,现有的借助脉内特征的聚类分选方法通常会提取多个脉内特征参数,或联合常规的载频(CF)、脉宽(PW)和到达角(DOA)等参数,从而形成特征向量进行聚类分选。然而,已有的研究通常关注单个特征参数的复杂度和稳定性等性能[5-6],而非分析如何在多种脉内特征参数之间进行选取,从而用于聚类分选。

因此,本文提出一种新的联合预分选方法,不同于传统方法的分多步完成常规参数和多种脉内特征参数提取后再进行聚类,本文方法首先将接收机前端处理后的脉冲波形转换为时频图像,随后借助自编码器自动地提取时频图像中的特征,同时完成脉内特征参数的提取、调制类型识别和聚类分选,直接从时频图像输出预分选结果,因此称为联合预分选。

1 时频图像生成

雷达信号需经过Choi-Williams分布(Choi-Williams Distribution,CWD)[7]转换为时频图后再由自编码器提取特征参数。本文以CW,LFM,NLFM,BPSK,QPSK,FSK,LFM-BPSK和FSK-BPSK为例,其时频图像如图1所示。

图1 不同调制信号的时频图像

Choi-Williams分布属于Cohen类时频分布。Cohen类时频分布的一般定义为

(1)

(2)

代入式(1)可得Choi-Williams分布的定义为

(3)

式中,α为可调参数。

2 自编码器结构和预训练

设X={x1,…,xN}为空间RD中的所有待聚类脉冲,常规的聚类算法依赖于X中所有样本之间的距离关系进行聚类。然而当维度D很高时,高维空间中的距离关系可能会失去参考价值[8],因此高维空间中的聚类相比低维空间会更加困难。而自编码器能够进行降维和特征提取,从而降低聚类难度。

自编码器[9-10]包含编码器(Encoder)和解码器(Decoder)两部分。编码器接收D维向量输入,并输出降维后的d维特征向量,即构建了映射fθ:RD→Rd,θ为构成编码器的神经网络的参数。而解码器接收来自编码器的d维特征向量,尝试将其还原回输入的D维向量,即构建映射gω:Rd→RD,ω为解码器的网络参数。自编码器通过最小化从d维特征向量还原回的D维向量与输入的原始向量之间的距离来确保编码得到的d维特征向量能够充分包含原始输入中的特征信息,即

(4)

式中:Gω(Y)=[gω(y1) …gω(yN)];Y=Fθ(X),Fθ(X)=[fθ(x1) …fθ(xN)];||·||F表示F范数。

自编码器并未对其中编码器、解码器以及降维后的向量严格规定结构。如图2所示,本文编码器和解码器选取为两层全连接层(Full-connected,Fc),每层4000个神经元,并采用ReLU激活函数。将编码器的输出(同时也是解码器的输入)设置为两个向量,分别为代表调制类型的类别向量C和代表调制特征的特征向量Y。

图2 自编码器结构

编码器接收经标准化处理后的128×128尺寸的时频图像X,通过两层全连接层输出类别向量C和特征向量Y。编码器的第2层全连接层输出类别向量C时会使用Softmax函数进行分类,即

(5)

由于引入了类别向量C,在式(4)之外还需对编码器进行有监督训练使其能够判断脉冲信号的调制方式。本文方法使用交叉熵损失函数,即

(6)

其中,R=[R1…RK],为真实的调制类别经独热(One-hot)编码后的真实类别向量。预训练阶段将同时对式(4)和式(6)计算梯度并反向传播。由于两个优化目标并不冲突,因此不需要设置平衡系数。

3 基于自编码器的聚类算法

在完成预训练后,自编码器利用提取出的特征向量代表输入的原始信号时频图。来自同一辐射源的雷达信号可以认为具有较为相似的脉内特征,因此其提取出的特征向量将会较为接近。也就是说,如果两个脉冲信号经时频转换后提取出的特征向量较为接近,则很有可能来自于同一个雷达辐射源。因此,多种基于自编码器的聚类方法[10-12]可用于对特征空间进行聚类从而实现预分选。

本文首先对测试集信号库X={x1,…,xN}中的全部信号计算时频图并通过编码器提取特征,得到特征空间Rd中的N个点Y={y1,…,yN}。另外,也可以额外增加更多人工测算的特征信息(如到达角(DOA))作为特征空间Rd的新增维度。新加入的特征信息需要进行标准化来保证与原始的d维特征向量中的数据处于同一数量级,例如:

(7)

提取得到的所有信号的特征向量Y={y1,…,yN}之间的距离关系代表了信号之间的相似程度。特征向量相近的两个信号有较大概率来自于同一个雷达辐射源。将每个点与距离最近的k个其他点相连,得到一张近邻图ε。编码器将学习如何缩短图中较短的边,尽可能令来自相同辐射源的脉冲信号提取出的特征向量趋于相同。此外,当近邻图ε中的一条边连接的点来自两个不同调制类型的信号,这条边将被删除。

在初始构建的近邻图ε中,不同边的长度差异极大。本文方法引入文献[10]中的软阈值函数作为损失函数处理边长,从而避免极端值的影响。软阈值函数形如

(8)

软阈值函数能够限制输出,使其不超过阈值μ,同时保持函数可微,便于神经网络使用梯度下降法优化。

(9)

损失函数分为两项,前一项用于保持编码器输出的特征向量能够被用于还原输入的时频图像;后一项迫使较短的边的长度缩短,从而使来自同一辐射源的相近信号输出的特征向量趋同。训练过程中将同时对这两个目标进行优化,λ被用于平衡两个目标。λ选取为所有待分选特征向量的二范数和与初始的ε中所有边的权重的和的比值。

相较于预训练阶段完全通过时频图像训练特征提取,聚类阶段引入了来自近邻图的反馈(即式(9)中的第2项)来修正噪声对特征向量提取带来的干扰。

算法流程见图3。

图3 算法流程图

如图3所示,算法分为预训练和聚类两个步骤。预训练阶段先将雷达数据库中的大量已知信号波形作为训练集,将其经Choi-Williams分布处理得到时频图像,最后使用得到的时频图像训练神经网络,使其能够判断输入信号的调制类型并提取其中的特征参数。

在完成预训练后神经网络便可用于聚类分选。在聚类阶段,首先将待分选信号作为测试集,经CWD处理后得到其时频图像,并送入神经网络提取其特征参数,同时判断调制类型,随后根据全体信号提取出特征向量的距离关系计算得到近邻图。神经网络将依据近邻图的收敛结果反复迭代,不断修正从时频图像提取出的特征信息,从而尽量排除噪声带来的影响。最终在近邻图完成收敛后,算法将输出聚类结果。

4 雷达信号预分选实验

本文的仿真实验包括3部分:神经网络预训练、对不同调制类型信号分选实验和对相同调制类型信号分选实验。

4.1 神经网络预训练

神经网络在预训练阶段使用大量已知或仿真的雷达信号进行训练。本文中随机生成8种调制类型共计60 000个雷达信号,其中,50 000个作为训练集,10 000个作为测试集。调制类型包括CW,LFM,NLFM,BPSK,QPSK,FSK,LFM-BPSK和FSK-BPSK。所有信号脉宽范围均为10~20 μs,采样率均为100 MHz。FSK和FSK-BPSK信号的两个调制频率分别在10~20 MHz和30~40 MHz之间随机选取。其余信号载频在10~40 MHz之间随机选取。LFM,NLFM和LFM-BPSK的调制信号带宽随机选取为10~20 MHz。BPSK,LFM-BPSK和FSK-BPSK信号的相位编码随机为3种巴克码之一,即[1110010],[11100010010]和[1111100110101]。FSK和FSK-BPSK信号的频率编码规律与前者相同。QPSK信号的相位编码随机为法兰克多项码和泰勒四项码之一,包括[000012302020321]和[0123030303210]。

训练时对上述信号随机施加0~20 dB的噪声,随后将全体信号生成的时频图像作为训练集。训练方法采用随机梯度下降法。批大小取为256,学习率取为0.000 1。损失函数和测试集上的调制类型识别准确率随迭代次数的变化如图4所示,图中损失函数为式(4)和式(6)的和。

图4 损失函数和识别准确率变化图

相比重建时频图,调制类别识别更为简单。因此,在损失函数还远未收敛时调制类别识别的准确率就已达到最优。损失函数停止下降后结束预训练阶段。

4.2 不同调制类型信号分选

仿真8种调制类别不同的雷达信号,调制类别分别为CW,LFM,NLFM,BPSK,QPSK,FSK,LFM-BPSK和FSK-BPSK。所有信号脉宽为10 μs,采样率均为100 MHz。FSK和FSK-BPSK信号的两个调制频率分别在20 MHz和30 MHz,其余信号载频为25 MHz。LFM,NLFM和LFM-BPSK信号带宽为20 MHz。BPSK,LFM-BPSK,FSK和FSK-BPSK信号的频率和相位编码规律均为[1110010]。QPSK信号的相位编码规律为[000012302020321]。每种信号生成2000个进行仿真实验。

分选准确率定义为用匈牙利算法重排分类结果后计算得出的F1值。F1值由查准率P(Precision)和查全率R(Recall)定义,即

(10)

式中:TP为正确分选信号数;FP为误分选信号数;FN为漏分选信号数。

不同信噪比环境下的分选结果如表 1所示。

表1 不同调制类型信号分选准确率(F1值)

不同调制类型信号的分选很大程度上依赖编码器对信号调制类型的判断。可见,在信噪比高于-5 dB的环境下依靠调制类型预测,分选准确率较高。而在信噪比低至-10 dB后,QPSK和FSK以外的信号分选准确率大幅下降。

4.3 相同调制类型信号分选

为进一步验证本文方法对相同调制类型信号分选的适应性,设计了对调制类型相同但调制参数不同的雷达信号的分选测试。设置调制类型分别为LFM,BPSK和LFM-BPSK的3组信号,其中,LFM和BPSK信号各设置2种,LFM-BPSK设置4种,共计8种信号。所有信号载频均为25 MHz,脉宽为10 μs,采样率为100 MHz。2种LFM信号带宽均为20 MHz,区别为一种载频从15 MHz线性提高至35 MHz,另一种则从35 MHz线性降低至15 MHz。2种BPSK信号的相位编码规律分别为[1110010]和[11100010010]。在上述2种LFM信号基础上分别施加与BPSK信号相同的2种相位编码,构成4种LFM-BPSK信号。全部8种信号依次标记为1~8号,每种信号生成2000个进行仿真实验。不同信噪比环境下的分选准确率如表 2所示。

表2 相同调制类型信号分选准确率(F1值)

整体上分选准确率低于前文中不同调制类型信号之间的分选结果。可见,依赖脉内调制参数区分相同调制类型的信号难度大于之前区分不同调制类型的信号。但在低信噪比环境下本文方法仍能依据相位编码不同而良好地区分2种BPSK信号。

将-4 dB信噪比环境下的分选结果表示为混淆矩阵,如图5所示,可见,主要的错误源自于将LFM-BPSK信号识别为相近的LFM信号。此外,被识别错误的5号和6号LFM-BPSK信号均被错分为1号LFM信号,7号和8号信号仅有部分被错分为2号信号。而相同调制类型的4种LFM-BPSK之间保持了良好的区分效果,未出现混淆,证明算法具备良好的在低信噪比环境下识别相同调制类型信号之间不同调制参数的能力。

图5 -4 dB信噪比环境下分选结果的混淆矩阵

5 结束语

本文利用自编码器联合了脉内特征提取和聚类过程,提出了一种新的预分选方法。仿真结果表明,该方法能在低信噪比环境下对雷达信号的脉内特征进行提取,并依靠脉内特征参数进行分选,具有一定的参考价值。

猜你喜欢
特征参数特征向量编码器
基于ResNet18特征编码器的水稻病虫害图像描述生成
基于视频图像序列的船用雷达目标检测和目标特征参数提取
WDGP36J / WDGA36J编码器Wachendorff自动化有限公司
克罗内克积的特征向量
高中数学特征值和特征向量解题策略
基于Beaglebone Black 的绝对式编码器接口电路设计*
三个高阶微分方程的解法研究
基于TMS320F28335的绝对式光电编码器驱动设计
说话人识别特征参数MFCC的提取与分析
民用飞机预测与健康管理技术与系统特征参数研究