张 航,吴泓霖,余 勤,黄承钊,欧阳厚德,雒瑞森
(四川大学 电气工程学院,四川 成都 610065)
自动调制识别技术是通信过程中进行准确信息提取的基石。在非合作通信中,由于复杂电磁环境的影响和无线电信号调制方式的未知,要想准确地识别无线电信号的调制方式存在巨大的挑战。当前,调制识别算法主要分为两大类:基于似然比的方法[1,2]和基于特征的方法[3,4]。这两类传统的方法需要较多的先验知识,严重依赖人为设定的阈值,以及受人工特征选取的影响,在未知电磁环境下缺乏鲁棒性,应用范围存在一定的局限性。
如今,随着深度学习展现出的巨大潜力,大量的研究者开始着手研究基于深度学习的调制识别算法。这类算法可通过神经网络进行自动特征提取,避免了手工特征提取的繁琐,且鲁棒性较高。为了便于研究的规范以及方便对照各种算法的优劣,文献[5]公布了一个无线电信号标准数据集RML2016.10a。文献[6]设计了一种较为简单的卷积神经网络来进行调制识别,表现了神经网络相较于传统算法的优越性。随后,文献[7]设计了一种结合卷积神经网络和循环神经网络的模型,实现了更高准确率。而考虑到调制信号内在的时序特性,文献[8]利用改良后的循环神经网络—GRU(gated recurrent unit),也取得了不错的调制识别效果。文献[9]将调制信号的瞬时特征输入到长短期记忆网络(LSTM)中进行处理,最终可实现0 dB以上,接近90%的准确率。而在复杂电磁环境下,目前这些基于神经网络的调制识别算法,仅仅利用I/Q信号或者单一瞬时特征,一定程度上限制了模型的性能。因此,为了丰富各种调制信号的特征表达形式和提高算法鲁棒性,本文提出了一种基于深度学习的多特征信息调制识别算法,实验结果表明,所提方法可以得到更高更稳定的调制识别准确率,可行性较高。
为了克服通信过程中复杂电磁环境的影响,更加有效地提取调制信号的高阶特征,本文提出了一种基于多特征信息的调制识别算法,将I/Q调制信号与瞬时特征信息相结合,丰富了调制信号的有效特征信息,并设计了一种高效的神经网络模型,以自动提取多种调制信号的隐藏特征,可实现对多种调制信号的高精度识别。
由于在现实生活中,大多数有效信息都属于低频信息,无法直接作为传输信号,为了更有效地远距离传输,需要采用调制技术对基带信号进行频谱搬移,保证其稳定高效传输。对于接收机所接收到的调制信号模型如下
y(t)=s(t)*h(t)+n(t)
(1)
其中,y(t) 表示实际接收到的I/Q调制信号,s(t) 表示调制后的信号,h(t) 代表信道脉冲响应,n(t) 代表信道中的加性高斯白噪声。
1.2.1 多特征信息结合
调制信号本身蕴含丰富的特征信息,如何挖掘并提取其有效信息是非常关键的步骤。而传统的专家特征提取方法是对原始信号进行一系列的数学运算,最终得到对应的特征值,再对特征值进行分析,这些特征差异性较明显,可看作对该信号的高度凝练,但在复杂的电磁环境下以及各种信道干扰的影响下,容易出现与理想条件计算结果存在较大差异的情况,导致调制类型识别困难。而调制信号的瞬时幅度和相位值,计算简单且含有丰富信息,因此,为了更加充分地挖掘I/Q调制信号的特征,以及避免经过多次复杂计算而造成的有效信息丢失,本文提出将调制信号的瞬时幅度和相位值与原始I/Q信号相结合,再送入神经网络进行自动特征提取以提高各种调制方式的识别率。本文提出的调制识别算法处理步骤如图1所示。首先将I/Q调制信号进行瞬时特征提取,包括瞬时幅度和瞬时相位值。由于I/Q调制信号分为I、Q两路正交信号,令I通道信号为x(t),Q通道信号为y(t),则瞬时幅度A(t)和瞬时相位P(t)可由以下公式所得
(2)
(3)
然后将得到的瞬时幅度和相位值进行归一化处理,再将原始I/Q信号和瞬时特征值进行拼接融合。其中原始I/Q信号维度为2*N, 2代表I路和Q路,N代表采样点数,融合瞬时幅度和相位信息后的数据维度变为4*N。再将其输入到设计好的神经网络模型,以提取不同类型调制信号潜在的特征信息,最后得到该信号所属每一类的概率分布,概率值最大的那一类则为最终调制类型识别结果。
1.2.2 基于深度学习的调制识别模型
一直以来,许多相关研究者都致力于探究设计一种高效的神经网络模型,对无线电信号进行特征提取并完成识别任务。出色的网络模型在调制识别任务中扮演着重要的角色。本文提出的模型包括两部分,通过将Attention-SCNN和引入注意力机制的双向LSTM(BiLSTM)相级联,以期望模型从多方位、多维度提取调制信号内部的时空特征信息。
Attention-SCNN:经过多特征信息的融合之后,原始信号数据从I/Q双通道数据扩展到了I/Q信号和瞬时特征结合的多维信息4*N,使得调制信号特征信息更加丰富,便于神经网络模型提取更多有用的特征,实现复杂电磁环境下对多种调制信号的高精度识别。融合后的数据首先输入到本文所设计的Attention-SCNN结构,如图2所示,它主要由若干个深度可分离卷积块(SepaConvBlock)和一个逐点卷积层构成,其中SepaConvBlock内部结构如图2(b)所示。为了减少模型的参数量,提高网络特征提取的效率,在SepaConvBlock中,我们以深度可分离卷积层[10]为基础层,相比于普通卷积,其卷积过程如图3所示,主要分为深度卷积和逐点卷积两步,其在轻量化网络结构中被广泛使用[11,12]。
在SepaConvBlock结构中,首先利用1*1卷积层实现跨通道的交互与信息整合,并控制通道数量,然后再通过批归一化[13],缓解内部数据分布偏移的影响并加速网络训练。接下来将批归一化的结果输入到两个深度可分离卷积层中,其中卷积核尺寸为2*2,输出通道数为32。考虑到特征映射图的不同通道的影响不一致,为了进一步提升有用信息的利用率和网络性能,还引入了通道注意力机制[14]。其主要通过对通道间的依赖关系进行建模,以自适应调整每个通道之间的特征响应值。这种注意力机制的实现如图4所示,主要包括压缩(Squeeze)和激励(Excitation)两部分,压缩部分是利用全局平均池化技术(GAP),将特征映射U压缩到通道描述符z∈Rc,z的第c个元素zc可以通过以下公式计算
(4)
其中, Fsq(uc) 代表对第c个通道的特征映射uc进行压缩操作,H代表通道的高度,W代表通道的宽度。
时序特征提取:由于调制信号本身属于时序信号,而循环神经网络在时序数据处理方面取得了巨大成功和广泛应用。因此,为了进一步提取调制信号潜在的时序特征,在本文所设计的模型中,还引入了优化后的循环神经网络——LSTM,其主要采用门控机制,可选择性地记忆有效的信息,可以有效解决神经网络中长序列依赖问题。在本文提出的模型中,通过将Attention-SCNN的输出送入到BiLSTM,其节点数为64,使得网络可以提取数据过去和未来的关联信息,捕获更加全面的时序特征。而BiLSTM中存储有大量的信息,为了降低冗余信息的影响,使得模型关注更有效的特征信息,我们还在LSTM中添加了注意力机制[16],以期望能过滤掉不相关的信息,提升模型的效率。其实现主要是提取位于BiLSTM中间的输出向量,再利用全连接层作为投影,得到查询向量,然后与输出做点积操作,再利用Softmax函数进行归一化操作,得到注意力权重向量。最后将该注意力分布值与BiLSTM的输出做点积操作,得到最终的特征向量。接下来,再利用两个全连接层,将该特征向量映射到容易分离的假设空间,其中激活函数采用“Relu”,并添加Dropout[17]策略,防止过拟合现象出现。最后再利用一个节点个数为需要识别的调制类型数量的全连接层,其激活函数采用“Softmax”,得到调制信号对应于每一种类的概率分布,其中最大值所对应的类别即为识别结果。
本文以无线电调制信号标准数据集RML2016.10a[5]为研究对象,将提出的调制识别算法与其它相关文献进行了对比,分析了不同算法在不同信噪比下的调制识别准确率,还探讨了网络深度对实验结果的影响,并对比了添加瞬时特征与不添加瞬时特征对实验的影响,实验结果表明了本文提出算法的有效性。
在本文的实验中,采用的是2016年公开的由GNU Radio软件生成的标准数据集RML2016.10a,一共包括11类常见的调制信号,如:8PSK、AM-SSB、AM-DSB、BPSK、CPFSK、GFSK、PAM4、16QAM、64QAM、WBFM 和QPSK。每种调制类型的信噪比分布在-18 dB~20 dB区间, 每种信噪比下的每一类调制信号数量为1000条,信号样本尺寸为2*128,一共220 000条样本。在样本生成过程,除加入噪声外,还考虑了多径衰落、采样率偏移和频率偏移等信道传输影响,以模拟真实的通信环境,具备较高的研究价值。
为了对比评估本文所提出的算法,我们与之前流行的算法[6-9]进行了对比,分别名为VTCNN2、CLDNN、GRU2、LSTM-AP。对于整个实验,本文主要讨论了不同信噪比条件下、不同调制类型的识别准确率,还分析了SepaConvBlock个数对识别效果的影响,并比较了不添加瞬时特征和融合瞬时特征的识别效果,从多方面、多角度分析说明了所提出算法的优良性。
2.3.1 不同信噪比下准确率对比
图5显示了不同算法在不同信噪比条件下的识别准确率。由于在低信噪比阶段,调制信号受噪声干扰较大,信号失真严重,本文提出的算法准确率与其它算法准确率相当。当信噪比高于0 dB时,所提算法识别准确率明显高于其它几种算法,0 dB~18 dB平均准确率达到91.5%,同比提升1.1%~17.7%,见表1。当信噪比大于4 dB时,识别准确率均高于92%,最高可达到93%,说明了本文提出算法的稳健性。这是因为,该算法从调制信号本身出发,充分考虑到其多种特征表达形式,将简单但信息量丰富的瞬时特征和I/Q数据结合,并利用卷积神经网络和循环神经网络各自的优点,从时序和空间维度,多方位有效提取每种调制类型的潜在特征,继而实现了对多种调制信号的高精度识别。
表1 0 dB~18 dB信噪比区间的不同算法 平均识别准确率/%
2.3.2 模型效果的混淆矩阵对比
图6展现了其它各种调制识别模型在SNR=4dB时生成的混淆矩阵。其横轴代表预测的调制类型,纵轴代表真实的调制类型,对角线表示每一种调制种类的识别准确率,颜色越深,表示准确率越高。可以发现,对于所有模型来说,其中最难区分的两类调制方式是AM-DSB和WBFM,这是因为它们都属于模拟调制方式,是通过采样模拟声音信号产生的,而该声信号存在静默期,使得识别困难加剧。而对于16QAM和64QAM,它们同属于正交幅度调制,具有重叠的星座映射形式,这使得模型在较低信噪比识别时具有一定难度。从图6可以发现,相比于其它算法,本文模型可以较大程度缓解这一问题,降低对这两类调制方式的识别混淆难度,提升了对多进制正交幅度调制(MQAM)的识别精度,说明了所提算法具有较高鲁棒性,可有效提升调制识别任务的性能。
当信噪比处于较高阶段时,调制信号所蕴含的特征更加清晰,使得模型提取更加容易。表2反映了各种算法在高信噪比18 dB时,对每一种调制类型的具体识别准确率。当SNR=18dB本文所提算法所实现的平均准确率相比较高,达到92.7%,而对于调制识别较困难的类型,如16QAM、64QAM、WBFM等类型,所提出模型实现的准确率也都达到了最高,且都具有明显的提升幅度。这些结果表明了本文算法的优越性,说明了结合多特征信息,并有效挖掘调制信号内部的时序和空间特征,可以提升调制识别任务的效果,提高对某些容易混淆的调制类别的识别准确率。
2.3.3 融合瞬时特征与不加瞬时特征的效果对比
为了探究瞬时特征在调制识别任务中所起到的作用,本文主要是通过改变输入数据的形式以进行对比实验。即直接将I/Q信号送入所设计的网络中进行调制识别,以及将瞬时特征与I/Q信号合并后再送入相同的网络进行调制识别。从图7(其中Our_features代表添加了瞬时特征的效果,Our_non_features代表不加瞬时特征的效果)可以看出,在0 dB~18 dB之间,融合了瞬时特征后的调制识别准确率高于直接将I/Q信号送入模型进行识别的准确率。它揭示了多特征信息的结合对于自动调制识别的有效性,也反映了I/Q信号本身所携带的潜在特征对于调制识别可能存在一定的欠缺。将I/Q信号与瞬时特征的结合,丰富了每一种调制方式的特征表示形式,便于神经网络理清每种调制方式的内在关系,从而提升调制识别的准确率。
2.3.4 SepaConvBlock个数对实验结果的影响
在深度学习领域,神经网络模型性能通常会受到网络深度的影响。因此,为了探究网络深度对自动调制识别的影响,本文主要通过改变模型中所设计的SepaConvBlock数量来控制网络深度。从图8可以看出,在0 dB~18 dB之间,随着SepaConvBlock个数的变化,模型的识别准确率总
表2 当SNR=18 dB,不同算法对于每种调制 类型的识别准确率/%
体呈先上升后下降的趋势。当SepaConvBlock数量为4时,0 dB~18 dB平均准确率达到最高,为91.5%(本文其它未特加说明的地方,模型中的SepaConvBlock个数都为4)。这说明了网络深度对调制识别具有一定的影响,但过于复杂的模型可能会造成过拟合现象的出现,在设计模型时应当合理控制模型容量。
本文提出了一种结合多特征信息的调制识别算法,从调制信号本身出发,将调制信号的瞬时幅度和瞬时相位与I/Q信号相结合,丰富了每一种调制方式的数据表示形式,可实现不同类型数据特征之间的互补。还设计了一个基于深度可分离卷积块和LSTM的高效网络结构,并引入了注意力机制,有利于挖掘调制信号内部潜在的时空特征。通过在标准数据集上的实验,表明了本文所提算法的优越性,说明了对于调制识别任务,特别是在受到各种干扰条件下,多类型数据源可以给模型提供多种观察视图,降低调制识别的难度。而结合网络特性,设计一种较好的模型结构对于调制识别也是至关重要的。
总的来说,当前调制识别领域还存在很多亟待解决的问题,例如低信噪比下,如何提高调制识别的准确率,以及在调制信号存在一定程度混叠时,如何准确识别其调制方式都是值得进一步研究的。