基于栈式降维与字典学习的辐射源调制识别

2020-12-08 01:06李东瑾杨瑞娟李晓柏朱晟坤费太勇
兵工学报 2020年10期
关键词:正则降维识别率

李东瑾, 杨瑞娟, 李晓柏, 朱晟坤, 费太勇

(空军预警学院, 湖北 武汉 430019)

0 引言

快速高效地辐射源调制识别在电磁频谱对抗等领域发挥着关键作用,能够为综合航电、一体化电子战等系统的多任务实施提供无源信息增益。调制识别技术的发展经历了漫长历程,基于特征提取和分类器设计的识别方式一直备受青睐。诸多学者在此架构下提取了熵特征、小波变换特征、模糊函数特征、时频特征等非线性特征[1-3]以增强特征稳定性,并基于各类机器学习分类器完成识别任务,如最近邻分类器(KNN)[4]和支持向量机(SVM)[5]等。近年来,智能识别算法在辐射源调制识别领域得到广泛应用,基于卷积神经网络(CNN)等方式的识别算法通过多层非线性映射机制提高特征稳定性,在样本容量和计算资源充足的前提下取得了更为理想的识别效果[6-14]。随着电磁频谱域对抗日趋激烈,对低信噪比环境下的调制识别准确率和时效性提出了更高要求。综合来看,传统方式难以适应低信噪比环境,而常规人工特征提取和机器学习等方式在兼顾识别准确率和时效性方面仍然存在一定局限性,智能识别算法具备较强的能力上限,但其识别性能依赖于大数据样本和计算资源,实际应用中诸如样本容量有限等场景往往难以满足其优化需求。因此,如何在有限样本容量下实现较高的识别准确率并兼顾时效性仍是值得关注的问题。

近年来,基于稀疏表示和字典学习的分类方式在压缩感知、计算机视觉和图像识别等领域取得了突出成绩[15-18]。该方式直接利用数据样本进行学习表示,对小样本数据具备适应性。同时,其多样化判别约束和分类形式为解决实际问题带来便利。目前,已有部分学者将其引入辐射源调制识别领域,文献[19]采用稀疏表示分类(SRC)模型进行辐射源识别,其l1正则约束形式带来较大计算开销。文献[20]采用随机投影(RP)降低特征维度,并采用l2正则约束的协同表示分类方式(CRC)提高时效性。SRC和CRC能够有效挖掘数据内在特征,取得了较好地识别效果,但低信噪比环境下识别能力仍然有待提升,且未考虑字典优化和强化判别,难以有效兼顾识别准确率和时效性。在分类识别领域,高效识别对应的另一关键技术为降维学习。针对高维特征易引入维数灾难的问题,研究者提出了各类降维学习技术。目前,主成分分析(PCA)[21]、RP和线性判别分析(LDA)等线性降维技术应用广泛;多维尺度分析(MDS)、局部线性嵌入(LLE)、核主成分分析(KPCA)[22-23]等非线性降维技术在解决数据线性不可分方面成效显著。近年来,流行学习降维技术[24]备受关注,各类降维学习技术的发展将为解决实际应用问题提供重要支撑。

综合以上分析,智能识别算法能够通过多层非线性映射机制提高特征稳定性,而字典模型可通过灵活的优化设计增强识别准确率和时效性。基于此,本文融合栈式神经网络的多级非线性映射结构和字典学习分类(DLC)架构,提出了基于栈式降维和字典学习分类(SDR-DLC)的识别方法。其中,栈式神经网络采用无监督贪婪算法和随机梯度下降算法完成优化,实现高维特征空间至低维特征空间的非线性映射,降低了特征冗余。字典学习模型采用多项判别约束和正则约束进行设计,增强了字典判别能力和分类时效性。

1 识别系统及预处理

1.1 调制识别系统及信号模型

基于SDR-DLC的联合识别系统如图1所示。首先利用短时傅里叶变换(STFT)将时间序列信号变换至二维时频域,通过稀疏域降噪处理降低时频空间噪声成分,并完成向量化表示,为后续识别提供较稳定的初始特征。随后特征经栈式网络完成低维非线性表示,并送至字典学习模型完成分类识别。网络优化通过离线训练完成,随后信号直接输入系统完成自动分类识别。

图1 基于SDR-DLC的辐射源调制识别系统Fig.1 Emitter modulation recognition system based on stacked dimension reduction and dictionary learning

高斯白噪声环境下,截获辐射源单脉冲时间序列为

x(k)=A·exp (j(2πf0k+φ(k)+θ0))+n(k),

(1)

式中:A为辐射源幅度信息;f0为信号载频;θ0为初始相位;φ(·)为脉内调制信息,辐射源特征差异集中体现在φ(·).

1.2 STFT及降噪预处理

二维时频处理[25]能够获取较高的能量聚集性和稀疏性,但信号时频结构易受噪声干扰,降噪等预处理方式能够带来性能增益。通过STFT获取二维浅层时频特征Ap×q,Ap×q仍包含噪声影响和特征冗余,采用如下步骤降低噪声干扰和信息冗余:

1)对原始时频信号Ap×q下采样,降维至Ap′×q′.

2)构建滤波系数矩阵Fp′×q′,Fp′×q′=[f1f2…fj′…fq′]中列信号对应局部频域维特征,具备稀疏性,逐列进行最值归一化处理,即fj′=fj′/max(fj′),max (·)为求最大值运算,fj′对应Fp′×q′的第j′列元素。

3)滤波系数优化。选取系数增强函数c(x)=x3,进行系数稀疏化表示:

(2)

式中:i′∈[1,p′];j′∈[1,q′];μj′为列向量fj′的均值。由于系数增强函数收敛较快,重复步骤2~步骤3两次完成系数优化。

图2所示为单载频(SCFM)信号在信噪比-6 dB环境下的降噪预处理前后时频特征对比图,图中时间索引值对应信号的不同时刻,且其单位间隔对应时间分辨率,频率索引的单位间隔对应一个频率单元。由图2可知,时频特征具备较好地稀疏性质,降噪处理有效降低了时频空间噪声冗余。

图2 SCFM预处理前后时频图对比Fig.2 Comparison of time-frequency graphs before and after SCFM signal pre-processing

2 基于降维学习与字典学习的识别算法

2.1 联合表征模型

对降维学习与字典学习进行联合表征时,采用G函数进行降维学习,并利用重构误差、强化判别约束和正则约束增强判别能力。设初始样本集、字典和编码系数分别为X、D、S,则基于降维学习和DLC的全局目标函数定义为

J(G,D,S)=r(G(X),D,S)+ηz(D,S)+λφ(S),

(3)

式中:r(G(X),D,S)为判别误差项;η和λ分别为强化判别系数和正则约束系数;z(D,S)为强化判别项;φ(S)为正则约束项。降维学习的优势在于降低特征冗余并提高分类时效性,(3)式所含降维算法主要分为两类:1) 有监督降维,即采用全局优化方式获取降维投影表示G,如联合判别降维字典学习(JDDRDL)[26];2) 无监督降维,即采用独立降维算法实现,包含线性降维与非线性降维,其中线性降维算法有PCA、RP等方式,此时G函数可线性表示为G(X)=PX,P为降维投影矩阵,非线性降维算法有KPCA等,通过核函数等非线性映射实现表征。综合来看,有监督降维方式能够有效兼顾全局目标函数,但特征非线性表征能力不足,且时效性不及无监督降维方式。实际应用中,非线性降维学习性能往往优于线性方式,且无监督降维方式能够有效降低样本容量需求和计算开销。因此本文重点考虑无监督的非线性特征降维。

2.2 基于栈式神经网络的降维算法

栈式神经网络[27]引入了多层非线性映射机制,其降维函数为G,可实现L维特征空间到m维(m≪L)空间的非线性投影,进而增强数据表征能力。

图3 SDR网络Fig.3 Stacked dimension reduction network

网络优化采用无监督逐层贪心训练方式,选择均方误差和Kullback-Leibler (KL)散度[30]构建各层优化的目标函数,并采用批量随机批量梯度下降(MSGD)算法[31]完成参数优化。批量优化的第l层目标函数定义为

(4)

G(x′)=g(W(2)g(W(1)x′+b(1))+b(2)),

(5)

式中:x′为L维特征样本;g(·)为sigmoid形式的非线性激活函数,g(x1)=1/(1+e-x1),x1为任意向量数据。得益于多层非线性映射机制和无监督贪心训练算法,降维函数G能够有效获取低维非线性映射特征。

2.3 多项约束的字典学习模型及优化

(6)

(7)

(7)式可采用交替迭代方式进行优化求解,具体求解步骤如下:

1)初始化。采用K迭代奇异值分解(K-SVD)方式初始化子字典,并将字典原子归一化;Mi初始化为零向量并在每次编码系数求解后更新。

2)编码系数S更新。分解为C类独立问题进行优化,J等效为

(8)

(9)

(10)

(11)

利用∂JDi/∂Di=0更新字典Di,即

(12)

Di更新后进行原子归一化处理。

4)设定终止条件,当达到最大迭代次数或相邻误差下限时停止迭代,否则跳转至第2步继续执行。

2.4 基于SDR-DLC的调制识别

字典优化在训练阶段完成,识别阶段将降维样本y送至各子字典进行编码,即

(13)

式中:si为样本y在第i类字典下的编码系数。(13)式根据不同正则约束形式完成编码系数求解,l2正则时满足si=((Di)TDi+λI)-1(Di)Ty. 随后采用子字典重构误差、正则惩罚项和类内编码差异项进行分类判定,判别误差为

(14)

3 仿真实验

3.1 实验数据

为验证识别方法有效性,选取如下7类信号进行实验:SCFM信号、二相频率编码(BFSK)信号、四相频率编码(QFSK)信号、线性调频(LFM)信号、二相编码(BPSK)信号、四相编码(QPSK)信号、Frank信号。

信号包含载频随机性、脉宽随机性和调制参数随机性,参数采用归一化方式描述,其中U表示区间内数据的均匀随机分布,具体设置如表1所示,所有频率项基准为采样频率,即U[1/20,2/5]在采样频率为100 MHz时对应[5 MHz,40 MHz]的频率变化范围。设中频带宽内截获信号采样总时长T为10 μs,采样频率100 MHz. 其中,QPSK和QFSK信号可选码序列为[3,0,1,2,2,1,3]、[0,0,2,1,1,3,3,2,1,2,3]或[3,1,0,0,2,1,0,3,0,2,1,2,3]. 所有数据样本按照对应参数分布和特征处理流程生成,识别结果取10次平均,对应测试环境为:1)训练集在10 dB信噪比条件下生成,每类信号500个样本,样本容量为3 500;2)测试集在-14~10 dB(步长2 dB)信噪比条件下生成,每个信噪比下单类信号样本为200,样本容量为18 200.

表1 信号参数设置Tab.1 Parameter setting of signal

3.2 参数设置及分析

字典学习的2种可选正则约束方式中,l2正则采用(10)式求解,l1正则和l1、l2联合正则优化分别采用FISTA算法[32]、LARS-EN算法[33],正则参数λ=0.01,l1、l2联合正则参数α=1、β=0.02. 3种正则方式对应识别性能如表2所示,对比得出:1) 时效性方面,l2正则时效性较高,l1正则和l1、l2联合正则涉及稀疏求解和多次迭代,较为耗时;2) 识别率方面,l2正则约束充分利用所有字典原子进行表征,具备较高的识别精度,实际应用中,l2正则常用于时效性要求较高场景,l1正则和l1、l2联合正则对字典完备性要求较高,字典原子数较多时时效性不强。

表2 不同正则方式下识别性能Tab.2 Recognition performances in different regular ways

字典原子数的选取一定程度影响识别性能,应尽量保证字典完备性。当训练样本数较少且特征维度较高时,字典原子数一般与样本数保持一致;当样本数较充足时,字典原子数可适当压缩以降低原子冗余,并提高分类时效性。子字典原子数Ki对识别性能影响如表3所示,结果表明:1)时效性方面,时间消耗与原子数呈正相关关系,随着原子数目增大,时间消耗增大;2)识别率方面,Ki较小时表征能力相对不足,Ki为100时,整字典原子数K大于特征维度m,形成过完备字典,识别率相对较高;Ki进一步增大时,类间相似原子增多且字典冗余性增大,l2正则利用全部字典原子进行表示,误分类概率随之增大。当字典冗余度较大时,具备稀疏性质的l1正则方式通常性能更优。考虑到辐射源识别的时效性等实际需求,选择l2正则方式进行优化;字典原子数需满足完备性要求但冗余不宜过大,本文设置Ki为100.

表3 字典原子数对识别性能影响Tab.3 Recognition performances with different numberof atoms

3.3 各阶段处理性能分析

3.3.1 降噪处理对识别性能影响

降噪处理前后的识别性能如图4所示,识别率随信噪比同步递增。无降噪处理时,信噪比-10 dB环境识别率低于40%,约信噪比-4 dB时达到90%;降噪处理后,信噪比-14 dB环境下识别率提升至60%,整体识别性能显著提升。降噪处理不可避免引入微量信息损失,信噪比0~4 dB时识别率略低于不降噪处理方式。结果表明:1)降噪处理能够较好地抑制噪声干扰,增强了系统在低信噪比环境下的鲁棒性;2)高信噪比数据用于训练具备可行性。在实际应用中,低信噪比数据的标注通常面临较大的人工消耗,合理选择可用的高新信噪比数据完成系统优化能够降低数据需求。

图4 降噪处理性能比较Fig.4 Comparison of recognition performances before and after denoising

按表1顺序将各信号依次记为R1~R7,信噪比-8 dB时SDR-DLC方式识别结果的混淆矩阵如表4所示,整体平均识别率约为95.93%. 其中,SCFM、BPSK和QPSK 3种窄带信号特征差异性相对较小,混淆程度较大。

3.3.2 不同降维方式和参数对识别性能影响

表4 信噪比-8 dB时识别结果混淆矩阵Tab.4 Confusion matrix of signal recognition at -8 dB %

图5 降维方式和参数对识别性能影响Fig.5 Recognition performances with different dimension reduction methods and parameters

表5 不同维度和方式下时效性对比Tab.5 Comparison of timelinesses in different dimensions and methods s

3.4 不同识别算法性能对比

3.4.1 不同稀疏表示方式对比

为验证本文字典学习算法有效性,选择如下3种算法进行对比:1) SRC[19]; 2) CRC[33-34];3) JDDRDL[26]. 其中,SRC算法对应l1正则约束,CRC和JDDRDL算法对应l2正则约束。由于SRC和CRC算法不具备特征降维能力,选择降维后特征在SRC和CRC两类方式下进行识别,分别记为SDR-SRC、SDR-CRC.

不同字典学习算法识别结果如图6所示,对比分析得出:1)随着信噪比增大,所有识别算法性能均逐步提升,SDR-DLC算法整体最优,具备较强的判别能力;2)JDDRDL算法利用鉴别投影强化判别能力,在信噪比-14~12 dB时性能与SDR-DLC算法相当,但其降维特征仍处于原线性特征空间,特征辨识能力存在局限性;3)SDR-SRC和SDR-CRC算法直接利用降维特征集作为字典,仅考虑重构误差,不涉及特征降维、字典优化和判别强化,判别能力存在局限性,同时降维特征所属完备字典集的冗余较大,l1正则约束下SDR-SRC算法性能较优,SDR-CRC算法性能受冗余原子影响较大。

图6 不同字典学习算法识别性能比较Fig.6 Recognition performances of dictionary learning algorithms

3.4.2 不同调制识别方式对比

不同调制算法识别结果如图7所示,对比分析得出:1)本文方式具备最优性能,在低信噪比条件下具备较大优势;2) KNN和SVM方式在高信噪比条件下仍存在一定程度混淆,判别能力不及CNN和本文方式;3)CNN方式在低信噪比时性能较差,其性能依赖于足量的训练样本,在本文的低信噪比环境样本不足等场景下识别性能不佳。

图7 不同调制识别算法性能比较Fig.7 Performance comparison of different modulation recognition algorithms

3.4.3 识别率与时效性综合对比

为综合对比识别率和时效性,在相同仿真条件下记录各算法的计算复杂度,实验环境与3.4.1节、3.4.2节保持一致,均为-14~10 dB(步长2 dB)信噪比环境,对应识别率为整体平均识别率,具体结果如表6所示。结果表明:1) KNN和SVM算法训练耗时相对较优,测试时间不及本文字典学习方式,且识别性能不足;2)SDR-SRC和SDR-CRC算法直接将降维输入特征数据集作为整字典,无需字典优化训练,因此训练时耗为0 s,其中,CRC算法采用l2正则测试时效性较高,而SRC算法采用的l1正则约束形式求解复杂度较大;3)JDDRDL算法兼顾线性降维学习和字典学习,降低了原子冗余和特征冗余,测试时效性较高,但列原子迭代优化形式导致训练阶段耗时较大;4)本文DLC算法在无降维特征输入下具备优势,其判别能力与JDDRDL算法相当,且优于其余无降维方式;5)本文的SDR-DLC算法具备低维特征表示和紧致的字典表示,测试时效性和识别率最优。综合来看,SDR-DLC算法通过无监督学习获取低维非线性特征,利用字典学习降低原子冗余性并增强判别性,测试时效性和整体识别率最优,具备一定的应用优势。

表6 不同识别算法在不同特征下的综合性能比较Tab.6 Comprehensive performances of different recognitionalgorithms under different features

4 结论

针对复杂电磁环境及噪声干扰引入的噪声敏感与识别能力不足问题,提出了基于SDR-DLC的联合识别算法,首先提取二维时频特征,设计了稀疏域降噪算法降低时频空间噪声成分;其次构建了降维学习与字典学习的统一表征模型,设计了基于栈式神经网络的非线性降维算法;同时充分考虑判别能力和时效性,提出了多项判别约束的DLC模型。仿真结果验证了算法的有效性,得出以下主要结论:

1)降噪处理使得低信噪比条件下特征稳定性提高。

2)SDR方式进一步增强了特征低维表征能力,性能优于PCA和RP等线性降维方式。

3)DLC算法性能优于SRC和CRC算法。

4)在低信噪比样本不足情况下,联合识别系统性能亦优于CNN等识别算法,具备较强鲁棒性和分类时效性。

猜你喜欢
正则降维识别率
混动成为降维打击的实力 东风风神皓极
基于数据降维与聚类的车联网数据分析应用
具有逆断面的正则半群上与格林关系有关的同余
大气腐蚀数据降维最优维度研究
降维打击
任意半环上正则元的广义逆
sl(n+1)的次正则幂零表示的同态空间
绿色建筑结构设计指南
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术