陈 林 唐文波 丁学科 樊 荣
(1.同方电子科技有限公司 九江 332000)(2.中国民用航空飞行学院航空电子电气学院 广汉 618307)
近年来,机场终端区面临的电磁环境日益复杂,以VDL 航空数据链、PBN 导航、ADS-B 监视为代表的航空设备遭受无线电信号干扰频次日益增多,干扰信号调制类型种类多达数十种,导致机场终端区的干扰信号调制类型识别难度加大。针对机场终端区的信号调制类型识别方法研究已在机场无线电通信[1~2]、无人机信号检测[3]、GNSS干扰源排查[4]以及空中交通管理[5]等领域受到广泛关注。
当前信号调制类型识别方法主要包含三类:即基于似然比准则的信号调制类型识别方法、基于特征提取的信号调制类型识别方法以及基于数据驱动的信号调制类型识别方法。由于基于似然比准则的信号调制识别方法在实际应用中难以获取信号模型中随机变量的概率分布,计算复杂度高,且在部分场景下仅在理论上存在计算可能性,故本文不对其作详细论述;基于特征提取的信号调制类型识别方法,首先提取原始基带I、Q 信号的特征,再利用分类器对所提取的信号特征进行分类,以实现信号调制类型识别[6~11]。具体上讲,文献[6]从信号调制类型识别原理、算法以及应用角度进行了系统地总结。在文献[7]中,使用经验模式分解(Empirical Mode Decomposition,EMD)提取原始信号特征,解决了传统信号调制识别方法在处理信号时受样本序列长度以及数据异常值影响的缺点。类似地,Siuly 等利用EMD 方法提取原始脑电信号特征,提出了一种基于EMD 技术的脑电信号诊断方法[8]。与此同时,T.Dutta 等利用变分模态分解(Variational Mode Decomposition,VMD)方法提出了一种基于非高斯脉冲噪声和加性高斯白噪声环境下的自动调制分类识别方法,证实了在不同噪声环境下所提取的信号特征对信号调制类型识别的优越性[9]。除上述EMD、VMD 进行信号特征提取外,多尺度排列熵(Multi-scale Permutation Entropy,MPE)也被作为一种重要的信号特征提取工具[10],当前主流做法是首先对原始信号采用EMD、VMD 分解得到信号在不同时间尺度下的模态分量,接着采用多尺度排列熵进行特征提取,再将其送入分类器完成信号调制类型识别,提升了低信噪比环境下信号调制类型识别性能,增强了对信号相位噪声、频率漂移以及谐波失真等细微特征的识别能力[11]。然而,当机场终端区所面临的干扰信号调制种类增多(典型值超过10 种)、信号间的特征区分度不明显以及信噪比降低时,基于特征提取的调制识别方法的识别性能不高,已成为基于特征提取的信号调制类型识别技术工程应用中面临的主要瓶颈。对此,雷志坤通过提取原始I、Q 数据的高阶累积量特征,利用全连接神经网络具有的非线性深度学习能力,提升了基于特征提取的信号调制识别方法性能[12],但由于将原始数据的高阶累积量特征作为网络输入,该方法仍属于基于特征提取的信号调制识别方法。
基于深度学习端到端的调制信号识别方法已成为新的研究热点[13~14]。S.Hu 等采用循环神经网络(Recurrent Neural Networks,RNN),针对高斯白噪声、高斯色噪声以及非高斯噪声场景进行了信号调制类型识别研究[15]。F.Meng等也提出一种基于端到端的调制类型识别神经网络,所提网络对信号调制类型识别能力已超过基于特征的信号调制识别方法[16]。然而,上述调制类型识别神经网络仍存在两个缺陷:第一,构建的信号调制类型数据集种类有限,面对信号调制种类更多、调制类型间的区分度低的信号调制类型时,网络的识别性能是否得到保证缺乏实证;第二,若实际环境发生变化,则需更新数据集,并对之前已训练好的网络重新训练。鉴于此,针对上述问题,本文首先构建多达24 种不同调制类型的数据集,超过了上述各文献中所构建的调制类型种类数量;同时,针对构建的信号调制类型,在网络卷积层数、卷积核大小、训练数据集大小对网络信号识别性能影响基础上,设计出一款端到端的信号调制识别网络;此外,针对信道环境变化导致信号调制类型识别性能下降问题,进一步研究了不同训练数据量场景下的迁移学习方式,提升了网络在信道环境变化场景下的网络适应能力和识别性能。
一方面,通过上位机Matlab 软件仿真生成22种不同调制类型的基带波形数据文件(最大符号速率限为1MSPS),每种调制类型信号波形I、Q 数据长度为106;通过网口下载到矢量信号发生器(VSG)作为基带周期调制波形,经过VSG上变频调制至载波频率为666MHz 后经放大射频输出(输出功率为0dBm)。输出的射频信号通过射频线缆连接至信号采集卡,其中采集卡工作频率范围为70MHz~800MHz。经信号采集卡在射频以200MHz采样率低通采样并做16bit 量化后、将其下变频至零中频25 倍抽取输出,最终获得8MSPS 速率的基带I、Q 信号。每种调制识别信号采集时长为10s。另一方面,利用智能频谱传感器(由同方电子科技有限公司提供)采集了广汉机场专用的VHF 电台基带I、Q数据,共同构成24种不同调制信号类型原始数据,信号调制类型分别为256-QAM、128-QAM、64-QAM、32-QAM、16-QAM、32-PSK、16-PSK、4-ASK;2-ASK、8-PAM、2-PAM、8-PSK、QPSK、OQPSK、MSK、DQPSK、D8PSK、DBPSK、AM、FM、GFSK、GMSK、VHF-1(广汉)、VHF-2(广汉)。数据采集原理框图如图1所示。
图1 原始I、Q数据采集原理框图
对于采集的24种原始I、Q数据,针对每种调制类型数据进一步人工添加不同强度噪声(SNR=-4dB~12dB)后,再对各种生成的含噪信号进行分段,并将分段数据构造成数据集。原始I、Q数据加噪后的信号s͂(k)建模为
其中,σs,σn和SNR 分别表示原始I、Q 信号功率、噪声功率以及信噪比值(单位:dB);s(k)为信号采集卡得到的第k点原始I、Q数据;N为采集的原始信号数据总长度;ξ(k)为0 均值且方差为1 的随机量。
文中构建的深度信号调制识别神经网络主要基于卷积神经网络(Convolutional Neural Networks,CNN)结构,包括预处理层、卷积层、池化层、展平层、全连接层等。网络输入端为基带I、Q 数据,输出端为信号调制类型分类概率,采取的网络架构及处理流程如图2所示。
图2 CNN网络结构与处理流程
1)预处理层
用于图像识别的CNN 网络无法直接用于处理基带I、Q复数数据,在使用CNN网络对输入基带复数信号序列进行调制识别时,需对符号序列进行预处理以匹配网络卷积层,具体预处理过程如下:
其中,ℜ 表示数据的实部,ℑ 表示数据的虚部,r为I、Q数据序列,L为数据预处理长度。
2)卷积层
在CNN 网络结构的卷积层中,影响网络性能的主要超参数有卷积核大小、步长、数量以及边界填充方式等。数据经过卷积层输出包含若干特征平面,同一特征平面的神经元共享权值,特征平面个数即为卷积核数。卷积核每次计算一个局部感受野后需要平移计算下一局部感受野的值,移动偏移量即为步长,卷积核提取特征方式如下:
其中,yi,j是卷积核进行卷积运算后的结果;f(·)为激活函数;θij、xij为卷积核、卷积块的设置参数;n为卷积块大小。
3)池化层
卷积后得到的特征维度通常很大,通过池化处理将特征分割成多个子区域,取其最大值或平均值得到新的、维度较小的特征。若网络输入维度为W1×H1×D1,每层池化大小为F×F,且步长设置为S,则数据经过池化后的输出维数为
式(6)中的第一项代表交叉熵,后一项为正则化项;yi(k)和y͂i(k;W,b)为输入数据所对应的标签结果以及网络识别输出;R(·)、W、b表示正则化函数、网络层权值和偏置;λ、N、M表示正则化系数、每次训练的批次大小以及信号调制类别数。
通过在网络训练后的测试性能指导下迭代设计深度调制识别神经网络。网络训练过程中,使用Adam 优化器求解,学习率取为0.0001,模糊因子设为10-8,每次更新后学习率的衰减值为0.9,每轮训练数据均随机洗牌,数据集总样本数为26 万,选取数据集中80%作为训练数据,20%作为测试数据,每次调整网络参数前选取的样本数量为256。
1)网络输入数据维度选取
分别按照128、256、512 和1024 长度的分段方式构建训练数据集,测试结果表明:当输入数据维度为1024 点数据分割方式时,网络在低信噪比条件下(-4dB)识别性能达到60%,在高信噪比(>8dB)条件下识别性能达到80%。若继续增加数据维度,网络的运算时间将会成倍增加,而网络的识别精度则不会显著提升。综合考虑,本文按1024点I、Q 数据长度分段生成训练数据集。即网络输入数据维度设为2×1024×1。
2)网络卷积层数选取
在给定网络输入数据维度下(2×1024×1),进一步测试了信号调制识别网络分别在不同卷积层数(2层依次增至6层)下的识别性能,结果表明:不同层卷积神经网络的性能相差不明显,当卷积层数为2 层时,在低信噪比条件下的识别准确性达到60%,高信噪比场景下达到80%,继续增加卷积层数,其识别精度并没有明显提升,相反还略微有所下降。鉴于此,在信号调制类型识别神经网络的卷积层数设为2层,即保证网络识别性能。
3)网络卷积核大小选取
在给定网络输入数据维度(2×1024×1)和2层卷积层数条件下,进一步研究了不同卷积核大小(卷积核大小分别取为2、3、4、5)时神经网络的识别性能。测试结果表明:卷积核长度设置为4 或5时,均能均相似且达到最佳。鉴于此,综合网络性能和网络复杂度因素,卷积核长度取为4。
经过上述步骤确定网络超参数后,最终设计的信号调制识别网络结构超参数如表1所示。
表1 信号调制识别网络结构超参数
采取表1 所示的网络架构及超参数对网络训练,若信道环境发生变化,将导致信号调制识别性能严重恶化。而在目前的移动平台(例如,机载、舰载、车载)的信号调制识别场景中,传播信号由于多径效应而引起的信道衰落等原因,到达接收机的信道环境通常会发生变化,即实际场景下的信道为时变信道。这大大限制了所提信号调制识别网络的性能。实际上,作者对测试数据人工添加瑞利衰落效应模拟信道发生变化,采用新的模拟数据再次测试网络识别性能,发现网络识别性能从80%直降至40%,亦证实了上述所提网络不能直接用于移动平台下的信号调制识别场景。若对信道发生改变后的信号进行调制识别时,需要使用新信道环境下的训练数据对网络进行重新训练以更新网络参数。然而,如果完全重新训练网络,则需大量训练数据,增大了网络训练的时间成本,不能满足实时性要求高的场景。
鉴于此,采用迁移学习思路,利用信道变化后的数据对旧信道环境下已训练好的网络进行权值微调,利用微调后的神经网络进行新信道下的信号调制类型识别,可以充分利用旧信道环境下的知识,避免了对网络完全重新训练,仅需采用新信道环境下的少量训练数据对网络进行微调便能达到同样的识别性能,同时提高了信道变化环境下的网络训练速度和识别实时性。本文具体研究了三种迁移学习方案:方式一,网络所有层参数微调;方式二,网络全连接层参数不变、卷积层参数微调;方式三,网络卷积层参数不变,全连接层参数微调。
下面通过多个试验与文中所提的方法进行验证,揭示了本文所提信号调制识别方法的性能优势。
为揭示所提调制识别网络的识别性能和泛化能力,计算了网络训练过程中损失值和识别性能随着迭代次数的变化曲线,结果如图3 所示。结果表明:网络训练与测试损失总体上均呈现下降趋势,网络具有良好的学习能力。迭代次数超过30 次后,识别精度大于95%。顺便指出,本文设计的信号调制识别网络在不同信噪比和信号类型的数据集上的整体识别精度为80%。整体识别精度统计公式为
图3 识别性能与迭代轮数曲线
其中,pi(i=1,2,…,n)为单个信噪比下的识别精度,n为选取的不同信噪比种类数。
然而,若直接采取上述网络进行信号类型识别,网络的可移植性差。鉴于此,作者进一步采取迁移学习技术提升网络可移植性。文中分别利用2.1 万(8.1%)、4.2 万(16.5%)、6.4 万(24.6%)、8.6 万(33%)、26 万(100%)的数据样本对网络调制识别进行测试,获得的调制识别精度分别为77.5%,79%,81.1%,84.1%,86.7%。考虑到采用26 万个数据样本重新训练网络所需要的运算时间是采用8.6万数据集对网络进行微调的运算时间的3 倍以上。因此综合考虑,在三种迁移学习方式中,将迁移学习数据集样本数定位8.6万。采用三种迁移学习方案对网络进行迁移学习后,其网络的识别性能如图4所示。
图4 三种迁移学习方法在不同信噪比下的识别精度(方式1:CNN_TL1;方式2:CNN_TL2;方式3:CNN_TL3)
由图4 可知,经过三种迁移学习的网络对于新信道的数据具有较好的识别性能,尤其是对网络所有层的权值偏置均进行微调后,其识别精度与采用新数据对网络进行重新训练后的识别性能相当。主要原因在于本文设计的信号调制识别神经网络卷积层较少,导致网络的全连接层的参数占网络总参数的60%,若仅更新卷积层参数,网络的大部分参数并未得到更新,从而导致网络在进行微调后,对新信道下的测试数据的识别性能不佳;如果网络仅对全连接层参数进行更新,又因为网络提取信号特征主要是依靠卷积层对数据进行卷积、池化等运算,若不对卷积层进行更新,网络则无法学习到新信道下的数据所具有的特征,从而造成网络识别性能不佳。因此,本文选择基于网络所有层参数微调的迁移学习方案对CNN网络进行迁移学习。
利用基于网络所有层参数微调的迁移学习方案对原信道下训练完成的网络进行迁移学习后,网络识别性能在典型信噪比下的测试结果如图5 所示。
图5测试结果表明:对于所研究的24种信号调制类型而言,本文的迁移学习方法不能对16QAM、8PAM、OQPSK 调制类型信号进行有效迁移学习。而其余21 种波形存在不同程度的迁移学习效果。具体上讲,在SNR=-4dB 场景下,所提方法对16QAM、256QAM、2ASK、4PAM、8PAM、DBPSK、OQPSK 信号调制类型的识别精度低于50%,对64QAM、4ASK、8PSK、AM、FM、GFSK、GMSK、MSK、QPSK 信号调制类型的正确识别性能达到90%,剩余8 种信号调制类型识别性能位于56%~86%之间;在SNR=12dB 场景下,所提方法对16PSK、16QAM、8PAM、DQPSK、OQPSK 信号调制类型的正确识别性能低于50%,而对128QAM、2ASK、32QAM、4ASK、4PAM、64QAM、8PSK、AM、FM、GFSK、GMSK、MSK、QPSK、VHF-1信号调制类型的正确识别性能超过90%,剩余5 种信号调制类型识别性能集中在66%~88%区间。
图5 基于网络所有层参数微调的迁移学习方案
针对基于信号特征的传统信号调制识别分类方法对多种调制类型(典型值大于10 种)识别性能不足的问题,设计出一种适用于信号调制识别的卷积神经网络,实现了以原始I、Q 数据流作为算法的输入数据,避免了传统方法复杂中的特征选择、特征提取等问题。针对时变信道应用场景,将深度神经网络结合迁移学习思想,降低了网络训练所需的样本数,减少了网络训练所需的时间成本,提升了网络对于时变信道环境的快速适应能力,针对所设计的网络架构给出迁移学习推荐方案。基于实测数据证实了所提方法对信号调制类型识别的有效性。本文识别网络也可直接用于GNSS干扰源智能识别等应用中,未来主要研究工作是进一步增加信号调制类型和提升信号调制类型的识别性能。