戴江安,栾声扬,赵明龙,张兆军,邱天爽
(1.大连理工大学电子信息与电气工程学部,辽宁 大连 116024;2.江苏师范大学电气工程及自动化学院,江苏 徐州 221116)
调制识别是通信系统接收端信号检测和信号解调之间的重要组成部分[1]。随着现代通信的进步和计算机技术的发展,相较于早期主要由技术人员人工作业,现在的调制识别已基本由机器自动完成,故当今文献中涉及的调制识别技术通常默认为自动调制识别,外文文献中则多写为自动调制分类(AMC,automatic modulation classification)。经过半个多世纪的发展,调制识别技术在诸多领域都得到了推广。随着通信体制和信道环境的复杂化,调制识别受到更广泛的关注,它在软件无线电[2]、雷达[3]、水声[4]、光通信[5]等领域都成为当下的研究热点。
经典的AMC 方法大致可以分为两大类,即基于似然(LB,likelihood-based)的AMC 方法和基于特征(FB,feature-based)的AMC 方法。LB-AMC方法把调制识别视为一个多元假设检验问题,以贝叶斯决策理论为基础,通过构建基于似然函数的检验统计量来完成调制识别任务。LB-AMC 方法虽然具有完备的理论基础,并且在贝叶斯意义下是最优的,但其似然函数推导复杂、对先验知识依赖以及计算复杂度较高等因素都限制了它的应用。FB-AMC 方法的基本思路是通过对信号进行特定处理,使其转换到某种变换域。在该变换域中,不同的调制信号具有良好的可区分性。以此为基础结合特定分类器,最终实现信号的调制识别。虽然FB-AMC 方法在贝叶斯意义下不是最优的,但由于其计算复杂度相对较低、易于实现等优点,FB-AMC 方法在实际中应用的更广泛。FB-AMC方法的关键是选择可区分不同调制信号的有效特征,常见的调制识别特征包括信号瞬时特征[6]、高阶统计量特征[7]、循环平稳特征[8]、分形特征[9]、星座图特征[10]等。
近10 年来,作为机器学习的一个分支领域,深度学习在人工智能领域获得了广泛关注。在各种复杂的网络结构和大规模计算单元的支持下,深度学习在众多非线性分类和预测任务上不断刷新着最佳纪录。如今,深度学习已经在计算机视觉、自然语言处理、经济、生物信息学等领域取得了广泛应用。深度学习的成功使许多传统的模式识别领域都焕发了新的生机。和图像识别、语音识别一样,调制识别也是经典的模式识别问题。近年来,在调制识别领域也出现了许多和深度学习相关的文章。一部分学者专注于对特征选择。例如,Peng 等[10]以星座图为特征,采用AlexNet 和GoogLeNet 来完成调制识别;Zhang 等[11]结合卷积神经网络(CNN,convolutional neural network)和信号时频分布特征进行调制识别。也有一部分学者专注于对网络结构进行改进。例如,Zhang 等[12]通过引入调制滤波和自相关操作,实现一种MACN(modulated autocorrelation convolution networks)结构进行分类;Huynh-The 等[13]通过向CNN 引入快速连接层,实现一种MCNet 结构来进行调制分类。
尽管以上基于深度学习的方法在调制识别领域取得了一些进展,然而现有方法大多是基于背景噪声符合高斯分布假设的。实际通信环境中的噪声往往具有某种冲激性,如低频大气噪声(雷电、磁暴)、汽车点火、多用户干扰等。这些具有尖峰脉冲特性的噪声,其概率密度函数比高斯分布衰减得慢,具有较厚的拖尾。描述脉冲噪声的常用信号模型有混合高斯分布、广义高斯分布和Alpha 稳定分布[14],其中Alpha 稳定分布是唯一满足广义中心极限定理的分布。因此,使用Alpha 稳定分布对脉冲噪声环境建模更具有普遍意义。Alpha 稳定分布脉冲噪声理论发展至今已有许多研究处理方法,而分数低阶统计量(FLOS,fractional lower-order statistics)属于其中比较有效的一类,它包括分数低阶矩、共变、分数低阶相关等[15]。然而由于需要稳定分布特征指数的先验知识,FLOS 的应用存在一定的局限性。近些年来,一种称为相关熵的局部相似性测度在非高斯信号处理领域获得了广泛关注。在此基础上,学者又把上述理论推广到循环频率域,提出了分数低阶循环统计量和循环相关熵[16]的概念。循环平稳方法具有良好的性能,但目前只有很少的学者结合深度学习和循环平稳方法来处理AMC 问题。Ma等[17]采用循环相关熵谱投影作为特征并用简单的RBF 神经网络进行分类。之后Ma 等[18]又采用对数变换后的循环相关熵谱作为特征,并提出一种基于深度学习的AMC 方案。
本文提出一种改进的循环相关熵谱,并将其命名为平滑循环相关熵谱(Pol-CCES,polished cyclic correntropy spectrum)。结合Pol-CCES 特征和低计算复杂度的浅层残差网络(ResNet,residual network),提出一种AMC 方案,能够实现脉冲噪声环境下8 种调制方式的有效识别。仿真实验验证了本文方案的优良性能。
本文目标是解决脉冲噪声环境下的调制识别问题,整体处理流程如图1 所示。
图1 本文AMC 方案整体处理流程
本文采用Alpha 稳定分布作为脉冲噪声模型。由于稳定分布没有统一的概率密度函数,通常采用特征函数进行描述,其表达式为
Alpha 稳定分布随机变量由α、β、γ、μ这4 个参数决定,其中,0<α≤ 2为特征指数,用于度量概率密度函数的拖尾厚度,当α=2时,稳定分布退化为高斯分布;-1≤β≤1为对称系数,用于表示分布的斜度;γ> 0为分散系数,用来度量样本的分散程度;-∞<μ<+∞为位置参数。由于Alpha 稳定分布噪声不存在有限二阶矩,因此采用广义信噪比(GSNR,generalized signal-to-noise ratio)来衡量脉冲噪声的强度,其定义式为GSNR=10lg(P/γ),其中P表示信号功率。
近年来,随着无线通信技术的飞速发展,无线通信信号难免会受到多种噪声和干扰的污染,在某些极端条件下,例如当脉冲噪声和同频带干扰并存时,现有的大多数信号处理方法都会出现不同程度的退化。循环相关熵(CCE,cyclic correntropy)和循环相关熵谱(CCES,cyclic correntropy spectrum)是在相关熵和循环统计量理论基础上发展出的概念,它们不仅扩展了信号处理的理论体系,而且在脉冲噪声和同频带干扰并存的复杂电磁环境下有良好的性能。同时CCES 本身携带着信号的丰富信息,可以应用于脉冲噪声下的调制识别任务。关于CCE 和CCES 理论的详细介绍和相关应用,可以参考文献[15-17,19]。
本文工作是在CCE和CCES理论基础上展开的。信号x(t)的循环相关熵V x(ξ,τ)表达式为[16]
其中,ξ表示循环频率,τ表示时延,κσ(·) 表示高斯核函数,σ表示核长。高斯核函数表达式为
图2 给出了8 种信号(AM/FM/MSK/2ASK/2PSK/4PSK/16QAM/64QAM)的CCES。
从图2 中可以看出,各种信号的CCES 有明显不同的特征,如谱峰数量、谱峰位置和谱峰幅度。图2 中表示的是纯净信号的CCES,由于脉冲噪声的影响,信号的CCES 会产生一定的畸变。下面以2PSK 为例,展示在不同GSNR 下信号的CCES,如图3 所示。
图2 不同调制信号的循环相关熵谱
图3(a)是无噪声的情况,此时的CCES 图比较平滑。然而,从图3(b)~图3(d)可以发现,随着GSNR逐渐减小,脉冲噪声对CCES 的影响逐渐变大。由于脉冲噪声通常不具有循环平稳性,因此当GSNR变小时,噪声在零循环频率轴的分量逐渐变大。同时在CCES 的其他区域则产生随机毛刺。脉冲噪声对CCES 的影响会导致识别正确率下降,因此必须想办法对其进行消除。
由于CCES 中有效特征是谱峰信息,因此考虑对CCES 进行如下改进
即本文提出的改进的CCES——平滑循环相关熵谱(Pol-CCES)。由于脉冲噪声通常不具有循环平稳性,因此当GSNR 较低时,脉冲噪声在CCES 的零循环频率轴和零频率轴会产生较大的干扰成分。如果不对其进行处理,那么提取出的谱峰特征中将包含大量噪声干扰成分,这会使识别正确率变差。故式(5)中将零循环频率轴和零频率轴置零,仅保留原点处的最大峰值。h表示剩余峰值的判定阈值,本文建议选取能够保存50 个峰值点的阈值。式(5)处理后得到的Pol-CCES 如图4 所示。
从图4 可以看出,经过改进处理后的谱比图3 的CCES 平滑了很多,大部分有效峰值信息被保留了下来并进行了二值化处理,噪声相关成分大部分被去除,相当于谱平面被打磨后变平滑了。因此,改进的循环相关熵谱命名为平滑循环相关熵谱。
图3 2PSK 信号在不同GSNR 下的循环相关熵谱
图4 2PSK 信号在不同GSNR 下的Pol-CCES
图5 是不同信号的Pol-CCES 二维平面图。从图5 可以看出,经处理后,Pol-CCES 可以看作二值图像,同时各信号间区别明显。本文将采用Pol-CCES 作为后续的分类特征。
图5 不同信号的Pol-CCES 平面图
本文采用基于Pol-CCES 和ResNet 的AMC 方案,它可概括为2 个主要步骤:第一步是特征提取与改进;第二步是模式识别。在特征提取与改进阶段,根据接收信号,构建Pol-CCES 特征,其流程如图6 所示。在模式识别阶段,把Pol-CCES 模式输入设计好的ResNet 得到识别结果。
图6 特征提取与改进的流程
本文AMC 方案采用浅层ResNet 进行信号分类。ResNet[20]是目前广泛使用的一种神经网络结构,它通过引入短路连接技巧,解决了传统CNN 的网络过深后性能退化问题。ResNet 的基本单元称为残差块,它由主路径和短路连接共同构成。其中主路径包括多个卷积(Conv,convolution)层、修正线性单元(ReLU,rectified line unit)层和批标准化(BN,batch normalization)层。当残差块的输入输出维度不等时,通常采用卷积残差块(Conv Block,convolutional block),即通过在短路连接中添加卷积层使输入输出维度相匹配。Conv Block 结构如图7 所示。
图7 卷积残差块结构
通过堆叠多个残差块来构建ResNet。网络的深度和计算复杂度可用浮点运算数(FLOPs,floating point of operations)来衡量,表1 列出了几种不同深度ResNet 的FLOPs。
表1 网络的深度和计算复杂度
本文采用的浅层ResNet 结构如图8 所示。该网络采用ReLU 作为激活函数,采用RMSprop 作为优化器,采用交叉熵作为损失函数;在输出层,该网络采用Softmax 作为激活函数。网络共10 层,包含3 个Conv Block。同时由于仅处理单通道二值图像,网络总体计算复杂度为0.14 ×109FLOPs,仅为18 层ResNet 计算复杂度的7.78%。
图8 本文采用的浅层ResNet 结构
为验证本文AMC 方案的性能,本节将进行一系列仿真实验和相关分析。
待识别的调制类型集为{AM,FM,MSK,2ASK,2PSK,4PSK,16QAM,64QAM}。
采用识别正确率PAcc作为调制识别性能评价指标,其定义式为其中,NAcc表示正确分类的样本数,N表示总样本数。同时绘制不同调制类型和识别方案的混淆矩阵来评估识别性能。
实验共分为两组,具体的参数设置如表2 所示。
各信噪比下每种信号样本数均为1 000。将样本充分混合后,按照8:2 的比例生成训练集和测试集。实验1 共考虑21 种不同GSNR,故训练集有134 400 个样本,测试集有33 600 个样本。实验2 共考虑11 种不同的α值,故训练集有70 400 个样本,测试集有17 600 个样本。每组噪声条件下均进行10 次蒙特卡罗实验,最终结果取10 次实验的平均值。
3 种对比方案分别采用星座图[10]、分数低阶循环谱(FLOCS,fractional lower-order cyclic spectrum)[21]和对数循环相关熵谱(Log-CCES,logarithm of cyclic correntropy spectrum)[18]作为特征,为公平起见均采用本文的浅层ResNet 进行分类。其中本文FLOCS 中的参数p与文献[21]中的参数b的关系为
1) 实验1
本组实验比较α=1.3时,各方案在不同GSNR下的性能。具体参数设置如表2 所示。各类信号的识别正确率如图9 所示。从图9 中可以看出,星座图方案对8 种信号的识别效果基本都不理想。p=1.8时的FLOCS 方案识别性能比星座图方案略好,但当信噪比较低时也不够理想。其余3 种方案的识别效果相对较好,而本文的Pol-CCES 方案对大多数信号都有最高的识别正确率。
图9 不同GSNR 下各类信号的识别正确率(α=1 .3)
表2 仿真条件和参数设置
测试集的总体识别正确率如图10 所示。从图10 可以发现,Pol-CCES 方案在所有GSNR 下都有最高的识别正确率,这表明了它在脉冲噪声环境下的稳健性。当GSNR >11 dB,Log-CCES 和Pol-CCES 方案性能接近。这是因为当GSNR 较高时,噪声对CCES 谱峰影响不大。这表明了CCES类特征的稳健性,以及保存CCES 的谱峰信息、消除背景毛刺的重要性。当GSNR <0 时,p=1.2的FLOCS 和Log-CCES 性能接近,但在高GSNR 下其性能不如Log-CCES。同时还可以发现,p=1.8时FLOCS 方案的识别正确率显著低于p=1.2时。这是因为特征指数α=1.3,当FLOCS 的参数p大于特征指数时,算法性能会严重下降。这说明FLOCS 方案严重依赖于噪声的先验知识,这影响了它的性能稳定性。
图10 不同GSNR 下测试集的总体识别正确率(α=1 .3)
为展示各方案下调制信号的具体识别结果,图11 给出它们的混淆矩阵。
由图11 可知,在脉冲噪声环境下,星座图方案基本失效。对于其他3 种方案,AM/FM/MSK/2ASK的识别正确率接近;对于2PSK/4PSK/16QAM/64QAM这4 种信号,Pol-CCES 方案的正确分类数量多于其他2 种方案。以上结果都验证了本文所提Pol-CCES方案的优异性能。
图11 各AMC 方案的混淆矩阵(α=1 .3)
2) 实验2
本组实验对比GSNR=5 dB时,各方案在不同特征指数α下的性能。详细参数设置如表2 所示。首先给出不同特征指数下各类信号的识别正确率,如图12 所示。
图12 不同特征指数α 下各类信号的识别正确率(GSNR=5dB)
由图12 可以发现,其他4 种方案的性能都或多或少会有起伏,本文所提Pol-CCES 方案性能非常稳定,随特征指数变化的起伏很小。这说明本文所提Pol-CCES 方案对不同脉冲噪声具有很好的适用性,尤其是在α较低的强脉冲噪声环境下具有显著优势。各方案的总体识别正确率如图13 所示。
图13 不同特征指数α 下测试集的总体识别正确率(GSNR=5dB)
由图13 可以发现,Pol-CCES 方案的正确率始终维持在95%以上。尽管在α>1.5的情况下,Log-CCES 的准确率比Pol-CCES 高1%~2%,然而当α≤1.5时它的性能迅速恶化。这说明在强脉冲噪声环境下,Log-CCES 的稳健性不如Pol-CCES。对于FLOCS,p=1.2时识别正确率对比p=1.8时有全方位的提升。这验证了参数选择对FLOCS 算法的重要性。星座图方案在各种α下性能均为最差,而当α接近2.0 时,其性能有大幅度提升。这进一步说明了星座图方案在脉冲噪声下失效。图14 给出了4 种AMC 方案的混淆矩阵。
由图14 可知,星座图方案中各信号识别正确率都很低。对于其他3 种方案,AM/FM/MSK/2ASK/2PSK 的识别正确率接近。对于 4PSK/16QAM/ 64QAM,Pol-CCES 相比于其他方案依然有更高的识别正确率。这进一步验证了Pol-CCES方案在脉冲噪声环境中的稳健性。
图14 各AMC 方案的混淆矩阵(GSNR=5dB)
本文提出一种改进的循环相关熵谱Pol-CCES并将其作为特征,结合浅层残差网络分类器,提出一种计算复杂度较低的AMC 方案,用于Alpha 稳定分布噪声下的调制识别任务。与星座图、FLOCS、Log-CCES 这3 种识别方案进行仿真实验对比,验证了本文所提方案的性能优势。本文所提方案在多种不同的Alpha 稳定分布噪声环境中均具有稳健性,为循环平稳和非高斯信号处理提供了新的思路。