吴美霖,高瑜翔*,涂雅培,覃镜涛,唐芷宣,胡 斐
(1.成都信息工程大学 通信工程学院,四川 成都 610225;2.气象信息与信号处理四川省高校重点实验室,四川 成都 610225)
自动调制识别(Automatic Modulation Classification,AMC)技术在电子侦察、认知无线电等[1-2]智能通信应用中一直发挥着重要作用。随着通信信号调制方式的激增以及通信电磁环境愈加复杂,如何提高调制识别的精度、降低特征提取的复杂度已成为通信领域研究的热点。
传统的调制识别方式识别性能严重依赖于人工提取特征的区分度,对于多种调制方式的识别需要设计的特征个数增加,对特征区分度的要求也更高。近年来,无线通信技术的发展逐步进入认知智能时代,大量研究人员将深度学习应用到AMC领域。文献[3]将时频图像处理为二值图像,利用卷积神经网络(Convolutional Neural Network,CNN)完成8种认知无线电波形的分类。文献[4]通过生成对抗网络增强数据集,生成轮廓星座图用于数字调制方式的识别。文献[5]通过平滑循环相关熵谱和残差网络完成了Alpha稳定分布噪声下的调制识别。调制信号图像特征集的制作及后续一系列图像处理操作,将会引入图像处理领域的难题到原本的调制识别工作中。
目前,AMC的调制信号分类特征参数已经非常成熟,其中不乏计算量低、分类效果好的特征参数。研究表明,多输入结构有利于调制信号隐藏特征的充分提取及融合,有利于提高AMC的识别精度。注意力机制能够改变输入特征不同维度的权重,应用于AMC中,可以为神经网络学习到的调制信号特征分配权重,进而减少数据冗余。据此,本文提出了一种基于特征融合和自注意力机制的并联调制识别算法——MACLNN。提出的模型不再依赖于复杂冗长的网络结构,无需制作调制信号的图像特征集。将原始采样数据和特征参数组合作为网络的输入,使用复杂度更低的浅层网络完成11类数字和模拟调制信号的高精度识别。
通信信号的特征分为统计量特征、谱相关特征和小波变换特征等,主要表征为特征参数和图像的形式。出于探寻一种便于在硬件平台部署、可作为数模调制信号混合识别工作通用模型的目的,使用复杂度更低的特征参数组合作为分支模型的输入。实验原始数据集为IQ数据集,因此接收到的数据可以表示为:
x[i]=xI[i]+jxQ[i],
(1)
式中,x[i]表示第i个信号样本;xI[i]和xQ[i]分别表示第i个信号的同相分量和正交分量。由于高斯噪声在二阶以上的统计量为零,高阶累积量对高斯噪声具有鲁棒性,因此其常用于信号的调制方式识别。
通过累积量-矩公式(C-M公式)和矩-累积量公式(M-C公式)[6],对于零均值复随机信号x[i]的p阶矩和q阶累积量可表示为:
E[x(i)p-qx*(i)q],
(2)
(3)
式中,*表示复共轭;p为阶数(p>q);q为取复共轭的序列个数;E表示求均值,下同。经过推导,可得到x(i)的常用高阶累积量表达式[7]为:
C21=M21,
(4)
(5)
C41=M41-3M20M21,
(6)
(7)
(8)
(9)
(10)
(11)
因为各种调制方式的高阶累积量不完全相同,所以从中提取的信号特征可用于信号的调制方式识别。为节约计算开销,根据经验构造以下3种分类特征参数:
(12)
(13)
(14)
为了进一步区分模拟调制方式宽带调频(Wide Band Frequency Modulation,WBFM)和双边带抑制载波调幅(Amplitude Modulation-Double Side Band,AM-DSB),本文引入了零中心归一化瞬时幅度谱密度最大值Rmax[8]作为第4个调制特征参数:
(15)
式中,N为每条采样信号的采样点数,即128;Acn(i)为零中心归一化瞬时幅度,计算式为:
(16)
然而,这些特征对于多进制正交幅度调制(Multiple Quadrature Amplitude Modulation,MQAM)的分类效果不佳,因此加入归一化采样信号的功率谱密度最大值(PSD)、峰均方根比(PRR)和峰均比(PAR)这3个特征参数,分别作为特征参数集的F5,F6,F7:
(17)
(18)
(19)
式中,N为接收信号x(i)的采样点数;x(:)为x(i)的所有采样点;max()表示x(i)中采样点最大值。
由Rmax,PSD,PRR,PAR以及3种组合重构的高阶累积量共同构成特征参数数据集F=[F1,F2,F3,F4,F5,F6,F7,F8]。
本文网络MACLNN为双路输入的并联结构,其中分支1使用2层CNN代替决策树等传统方法对调制特征参数进行特征提取,加入自注意力机制进一步获取信号的关键特征,是对参数类调制数据集特征提取的一种新结构。本分支是对参数类调制数据集的一种新的处理思路,使用深度学习的方法对参数数据集进行特征提取处理。
分支2为了充分提取时间序列的特征,使用一层CNN和2层长短期神经网络串联的结构,同时加入自注意力机制,减少网络叠加带来的数据冗余。分支2进行原始调制信号的调制方式识别时,其在公开数据集上具有较好的识别性能。
经过并联层拼接2路分支模型所提取的特征,进行展平后通过Dense层完成调制分类识别。MACLNN的结构如图1所示。
图1 MACLNN结构
CNN是一种由卷积运算和深层结构组成的前反馈神经网络,其基本结构单元有卷积层、激活层、池化层和全连接层,CNN的作用可看作输入到输出的映射。随着智能信息处理领域的发展,CNN分类的能力逐渐被研究人员应用到调制识别技术中并加以改进。
无论是特征参数还是原始数据集的分支模型输入,卷积层均使用一维卷积。MACLNN的分支1用于特征参数组合的输入,因此将卷积层的核尺寸设为1,且不使用池化层;分支2用于采样序列的输入,根据其输入结构将核尺寸设计为8,2条分支模型所使用的卷积层滤波器个数均为64。
为了更好地提取原始序列的特征信息,本文引入了长短时记忆网络(Long Short-term Memory,LSTM)。LSTM在文献[9]中首次提出,被广泛应用于处理时间序列数据。相较于循环神经网络(Recurrent Neural Network,RNN),LSTM引入了输入门、遗忘门和输出门,以及与隐藏状态相同的记忆单元,用于记录附加信息,其单元结构如图2所示。
图2 LSTM结构
图2中,Ct和Ct-1分别表示当前时刻和上一时刻的细胞状态;ft表示遗忘门;it表示输入门;ht表示输出门。计算过程如下:
ft=σ(Wf·[ht-1,xt]+bf),
(20)
it=σ(Wi·[ht-1,xt]+bi),
(21)
(22)
(23)
ht=σ(W0[ht-1,xt]+bo)⊗tanh(Ct)。
(24)
由于LSTM的闸门机制有利于长时间储存有用的历史信息,因此可以持续地学习数据特征。LSTM在处理时间序列任务时,表现出优良的性能。MACLNN的分支2使用了2层LSTM结构来提取时间序列的特征,每层LSTM后使用Dropout层来防止过拟合,所提取的特征经过并联层与特征参数输入层得到的特征进行拼接,送入全连接层进行分类处理。
深度学习领域存在信息过载的问题,为了更好地分配资源,将有限的计算资源用于处理更重要的信息,本文引入了注意力机制。注意力机制可以为关键特征分配更大的权重,使模型的注意力更集中于关键的部分特征。研究表明[10],注意力机制的加入有助于提高AMC的精度。同时,考虑到后续工作以及AMC工作的难度将逐渐加大,所需特征数也随之增加,因此在分支网络的末端均加入自注意力机制,用于改变时间维度的权重,使得深度学习模型关注到更关键的特征参数。
为方便验证和对比MACLNN的性能,使用文献[11]提供的RadioML2016.10a数据集进行实验,此数据集包括11种调制类型:8PSK,BPSK,CPFSK,GFSK,PAM4,QAM16,QAM64,QPSK,AM-DSB,AM-SSB,WBFM。在18 dB下的可视化结果如图3所示,横坐标表示采样点,纵坐标表示IQ数据的采样值大小,红色曲线、蓝色曲线分别表示采样信号实部、虚部在时域的采样值。
(a)8PSK
图3的数据可视化中,信号样本的信噪比区间为[-20,18]dB,以2 dB为间隔,采样长度为128,数据存储为IQ信号。采样数据使用真实的文本信号和语言信号,在通信信道中添加了加性高斯白噪声、多径衰落、中心频率偏移和采样率偏移等干扰,因此十分接近真实场景下的采样数据。
将RadioML2016.10a数据集中70%的数据样本作为训练集,15%的数据样本作为验证集,15%的数据样本作为测试集。实验环境为Windows操作系统,搭载NVIDIA RTX 3060 GPU,使用Python接口的tensorflow2.4.0深度学习框架完成仿真实验。仿真实验部分采用分类识别准确率对网络模型分类精度进行度量,使用混淆矩阵对各类调制方式的识别准确率及错误识别情况进行分析与对比,使用网络参数量作为网络模型复杂度的衡量指标。
使用相同的数据集,本文按照AMC中的经典模型结构设计了3种模型与MACLNN进行对比,用于验证所提方法是否能有效提取调制信号特征,是否能提高AMC的识别率。其中IQ_CNN为3层CNN,IQ_CLNN为1层CNN和2层LSTM,IQ_BiLSTM为1层CNN和2层BiLSTM,以上算法均为级联结构。仿真实验所用CNN均为一维CNN,3种对比模型与MACLNN的分支2所涉及的滤波器个数、卷积核尺寸等参数均相同。
不同算法精度对比如图4所示。由图4可知,相较于其他3种模型,MACLNN的识别准确率有明显提升,在信噪比达到-12 dB后,MACLNN性能开始优于其他算法模型。在0 dB识别准确率达到89%,在高信噪比处MACLNN精度最高达到94.1%,相较于其他3种算法模型,高信噪比处的识别精度高出3%以上。
图4 不同算法精度对比
为了更好地说明MACLNN对不同调制方式识别性能的改善,使用混淆矩阵对4 dB下的IQ_CNN,IQ_CLNN和MACLNN进行对比分析。混淆矩阵中,横、纵指标相同时对应值越大表示此类调制方式识别率越高。3种算法在4 dB时的混淆矩阵如图5~图7所示。
图5 SNR=4 dB,IQ_CNN混淆矩阵
图6 SNR=4 dB,IQ_CLNN混淆矩阵
图7 SNR=4 dB,MACLNN混淆矩阵
为了进一步评估MACLNN的性能及模型复杂度,将其与使用相同数据集的同类型算法对比,将对比算法分别记为1_CNN-BiLSTM[11],2_CLDNN[12],3_CLSNN[13],4_CNN-LSTM[14]和5_HNIC[15],将训练参数、最高识别精度作为指标,对比结果如表1所示。
表1 同类型算法对比
相较于对比的5种算法,MACLNN以较少的训练参数,仅使用原始数据和少量特征参数作为模型输入,在128采样长度的模拟、数字调制数据集中实现了最高94.1%的AMC精度,达到了当前的最高精度。
针对模拟、数字调制混合识别复杂度高和精度低的问题,提出了一种基于特征融合和自注意力机制的并联调制识别模型。MACLNN使用更简单的特征参数组合与原始数据集作为数据输入,同时降低了分类网络的复杂度,实现了数字、模拟调制信号的高精度识别。实验结果表明,MACLNN在RML2016.10a的识别准确率高于同类算法,最高识别准确率为94.1%。而引入的特征参数组合方式有效提高了16QAM,64QAM和WBFM的识别精度,在信噪比4 dB时这3种调制方式均达到了95%以上的平均识别率。为降低数字、模拟调制方式的AMC技术的难度提供了一种新思路,模型复杂度低也使得所提算法更具实际应用价值。