邢科,吕泽均
(四川大学计算机学院,成都610065)
目前,无线电自动调制识别算法一般分为两类[1]:一类是基于贝叶斯决策论的方法,一类是基于统计模式识别的方法。基于贝叶斯决策论的方法[2-3]使用最大似然法实现信号的调制识别,为每个样本选择后验结果最优的类别标记,但是似然比分类的充分统计量表达式很复杂,计算量大,难于实时处理。基于统计模式的方法[4-6]是从接收到的信号中提取若干特征后用分类器进行识别分类,实现流程如图1。
图1 基于统计模式识别的调制分类识别方法流程
近年来,机器学习已经在自动调制识别(AMC)领域广泛应用,比较常见的机器学习分类器主要有决策树[7-8]、支持向量机(SVM)[9]、随机森林[10]等。上述算法都已经有完善的理论支撑和成熟的结构,但是在信号特征提取方面主要依赖人工进行标记提取,对于机器学习中系统的学习能力还有很大的提升空间。
针对以上问题,深度学习方法已经被用于自动调制识别。2017 年陈敏华等人[11]通过实验验证了在相同信噪比条件下,基于卷积神经网络的信道均衡算法对QPSK 恢复的误码率相比RLS 算法和MLP 算法分别降低了20%和5%。2018 年彭超然等人[12]将信号数据转换为星座图,然后利用训练好的VGG-19 网络模型进行星座图分类识别,同步实现了特征提取和分类识别,流程简单且保证了信号调制识别过程中的鲁棒性。2019 年周鑫等人[13]提出了RadioImageDet 算法,把无线电信号具象化为二维图片,将图像作为网络模型的输入进行分类识别,成功将无线电信号识别问题转化为图像分类问题,并取得86.04%识别准确率。
上述深度卷积网络模型只是在关注如何在不过拟合的情况下加深网络的结构,很少关注网络的宽度,而GoogLeNet 系列不仅着手加深网络的深度而且加深了网络宽度。因此,本文将Inception-v4 模型引入到调制信号识别网络中,该网络通过深度和并行网络结构充分提取星座图输入特征,以识别数字信号的调制模式,并提高信号在低信噪比环境下的识别精度。
根据基带波形所控制的不同载波参数,可以将调制类型分为振幅键控(ASK)、相移键控(PSK)、频移键控(FSK)和正交振幅调制(QAM)4 种[14]。针对这4 种数字调制信号,我们给出对应的数学建模如下:
多进制频移键控MFSK(Multi-band Frequency Shift Keying):
由(1)、(2)、(3)、(4)可得调制信号的一般表达式为:
其中:s(t)表示连续时间序列信号,A(t)为信号调制振幅。
根据上述公式的信号模型,分别改变其频率、相位、振幅的一个或者多个参数组合,可以得到多种调制模 型,例 如:BPSK、4ASK、QPSK、OQPSK、8PSK、16QAM、32QAM、64QAM 等。
基于Inception-V4 的通信信号调制方式识别新方法包括三个步骤:信号预处理、特征提取和分类识别。为了利用Inception-V4 网络进行调制方式识别,需要在预处理操作中,将信号转换为星座灰度图。然后利用Inception-V4 网络在图像识别领域的突出表现,对信号星座灰度图进行特征提取和分类,最终完成信号调试识别。
DL 依赖于大量数据,并且对于研究和应用而言,这可以在通信系统中轻松获得。我们利用Python 模拟出带有高斯白噪声的复杂样本的基带序列,考虑了8种可能的调制方式作为数据集,包括BPSK、4ASK、QPSK、OQPSK、8PSK、16QAM、32QAM、64QAM,在SNR=4dB 环境下生成星座图,然后转化为灰度图用于训练,每张星座图和灰度图包含1000 个星座符号,灰度图的数据类型为299×299×3 的三维矩阵,训练样本为每种调制方式200000 张灰度图。
2.2.1 星座图
为了利用现有的Inception-V4 网络模型,我们可以将复杂的数据样本转换为图像。星座图可以将信号样本映射到复平面上的散射点,已被广泛用作调制信号的2D 表示。但是,复平面无限延伸,而图像可描绘的区域却受到限制。如果所选区域太小,则可能会由于严重的噪声水平而从图像中排除某些信号样本,并放弃这些信号样本。相反,如果面积太大,信号样本可能会聚集在一个很小的区域中,并且可能会重叠。除非另有说明,本文选择星座图生成在3.5×3.5 复平面上,如图2。
图2 QPSK 星座图
2.2.2 灰度图
如果像素密度足够大,则可以将星座图图像视为信号样本的完整表示。在这种情况下,每个样本可以由一个或多个像素表示。然而,由于有限的像素密度,一个像素内可能存在多个样本,如图3 所示。为了考虑多个采样点的影响,我们将每个像素内的采样数量表示为强度值(例如,像素1、2 和14 的强度值为1、0和5)然后可以将二进制星座图转换为灰度图像,如图4 所示。
图3 像素点
图4 QPSK 灰度图
近年来,非常深的卷积网络一直是图像识别性能最大进步的核心。以GoogLeNet 为代表的Inception 体系结构已显示出用相对较低的计算成本实现非常好的识别性能。
Inception-V1[15]主要是引入1×1 的卷积层,大大的减小权值参数数量,同时增强了网络的非线性能力。同时使用了1×1、3×3、5×5 的卷积,增加了网络对尺度的适应性。
Inception-V2[16]加入了批量归一化层,减少了内部neuron 的数据分布发生变化,使每一层的输出都标准化到具有相同的均值0 和方差1。用2 个连续的3×3卷积替代模块中的5×5 的卷积,进一步增加网络的深度,并且减少了很多参数。
Inception-V3[17]在V2 的基础上,提出在神经网络中分解卷积和降维办法,将7×7 和3×3 卷积分别分解成两个一维的卷积(1×7,7×1)和(1×3,3×1)的非对称的卷积结构,增加特征多样性,并且在减少计算量的基础上处理更多的空间特征。
InceptionV1-V3 采用通过分布式进行训练的模式,以便能够将整个模型适配到内存中。但是,Incep⁃tion 体系结构是高度可调的[18],这意味着各个层中的过滤器数量有很多可能的变化,但这些变化不会影响整个训练网络的质量。为了优化训练速度,需要仔细地调整网络模型的层大小,以平衡各种模型子网之间的计算。
随着TensorFlow 的引入,大部分最新的模型无需分布式的对副本进行训练。Inception-v4[19]网络的大规模结构针对Inception 块的每种网格尺寸做出统一的选择。Inception-v4 网络的大规模结构参见图5,对于其组件的详细结构,参见图6、7、8、9、10 和11。所有图中没有标记“V”的卷积使用same 的填充原则,使用“V”标记的卷积使用valid 的填充原则。
图5 Inception-v4网络的大规模结构
图6 Inception-v4网络的35×35网格模块结构
图7 Inception-v4网络的17×17网格模块结构
图8 35×35到17×17缩小模块的结构。k,l,m,n表示滤波器组大小(见表1)
图9 Inception-v4网络的8×8网格模块结构
图10 17×17至8×8网格缩减模块的结构
表1 Inception-V4 的Reduction-A 模块的滤波器数量
图11 Inception-v4网络的stem模块
本文利用拥有强大的算力和11 Gb 显存的Titan XP 平台,构建了一个TensorFlow-2.1.0+Keras-2.3.1 框架来训练InceptionV4 网络。其中数据集和数据转换都用Python 实现。
实验中,学习率选择0.001,将每种调制方式的512张图片打乱顺序后,逐次输入模型进行训练。为了保证内存可用,最小批次设置为16,同时划分1%的数据集用于验证,输出验证性能,以便观测训练过程,每次训练进行1 轮,经过400 次迭代后,将模型参数保存用于后期测试和可能的迁移学习。信号样本标签编码格式如表2。
表2 信号样本标签具体划分情况
我们选取了BPSK、QPSK、16QAM、32QAM、4ASK、OQPSK 和8PSK 作为训练和识别的调制方式,每种调制方式使用400×512 张灰度图用于训练,其信噪比与测试集保持一致。图12、图13、图14 为不同信噪比下识别正确率的混淆矩阵。
图12 SNR=3.5 dB 的识别率混淆矩阵
图13 SNR=3 dB 的识别率混淆矩阵
图14 SNR=2.5 dB 的识别率混淆矩阵
从识别率混淆矩阵可以看出,经过充分训练后,提出的方案在各信噪比下均能获得比较高的识别率,这证明了基于Inception-V4 模型的通信信号调制方式识别新方法的可行性。其中在SNR=3.5 dB 时识别率达到95%正确率,SNR=3 dB 时识别率达到了93.8%以上,SNR=2.5 dB 时,由于16QAM 和32QAM 具有相似的正方形星座图,因此这两种调制方式的分类能力明显变差,但是BPSK、QPSK、4ASK、OQPSK、8PSK 的分类能力依然保持在99.3%以上。
在相同数据集的基础上,将文献[20]和文献[21]的方法分别与本文方法进行比较,评估Inception-V4 模型的性能。
3.3.1 与AlexNet 模型[20]的对比
这一节,信号参数、训练集与文献[20]保持一致,我们选取BPSK、4ASK、QPSK、OQPSK、8PSK、16QAM、32QAM 和64QAM 作为训练和识别的调制方式,在同样使用灰度图作为训练集的情况下,信噪比与测试集保持一致。其性能对例如图15 所示。信号样本标签编码格式如表3。
表3 信号样本标签具体划分情况
图15 与AlexNet模型中灰度图部分的性能对比
将每种调制类型的灰度图馈送到Inception 网络进行训练,从而形成训练有素的网络。对SNR=2dB 的8PSK 调制信号执行1000 次的分类识别测试,以评估其分类性能,可以看出,针对8PSK 在低信噪比(SNR=2dB)情况下Inception-V4 可以获得比文献[20]中的AlexNet 模型更高的识别准确率。
3.3.2 与InceptionResnetV2-TA 模型[21]的对比
这一节中,我们选取与文献[21]相同的数据集,将BPSK、QPSK 和8PSK 作为训练和识别的调制方式,其识别性能的对例如图16 所示。信号样本标签编码格式如表4。
表4 信号样本标签具体划分情况
从图16 中的分析结果可以看出,在SNR=1dB时,本文方法识别准确率达到98.4%以上,而文献[21]的识别准确率达到89.33%。在SNR=2dB 时,本文方法识别准确率达到100%,而文献[21]的识别准确率达到96.33%。在对BPSK、QPSK 和8PSK 三种信号的分类识别中,本文所提出方案可以获得更好的识别效果,这在有一定先验信息的场景中将发挥非常重要的作用。
图16 与InceptionResnetV2-TA模型的性能对比
本文研究了Inception-V4 模型在数字信号调制分类中的应用。将复杂数字信号转化为图像进行分类识别,仿真结果表明,基于Inception-V4 模型的信号调制方式分类避免了手动选择信号特征,并且在低信噪比的环境下提供了比较高的分类精度。在多种调制方式的信号中,Inception-V4 的分类能力要优于AlexNet、Incep⁃tionResnetV2-TA 模型。未来的工作将考虑两方面的改进,一是在更多种类信号调制方式下采用Inception-V4模型的分类效果研究,二是考虑Inception-V4 模型在非高斯噪声下的通信信号调制模式中的应用研究。