基于结合策略的自动调制识别协作模型

2023-05-11 08:58马圣雨宋逸杰陈丽萍
软件导刊 2023年4期
关键词:信噪比准确率精度

马圣雨,石 坚,宋逸杰,陈丽萍,高 岩

(1.河南理工大学 计算机科学与技术学院,河南 焦作 454000;2.嘉兴南湖学院 图书馆;3.嘉兴学院 信息网络与智能研究院,浙江 嘉兴 314000;4.江西理工大学 理学院,江西 赣州 341000)

0 引言

在频谱监测和电子对抗等领域中,自动调制识别(Automatic Modulation Recognition,AMR)作为信号检测和解调之间的关键步骤,无需先验信息即可在接收端接收并识别出未知信号调制方式[1-2]。高效精准、稳定可靠的调制识别方法对未来日益复杂的通信环境具有重大意义。

早期的调制识别技术受限于科技水平,因此以人工提取特征的方式为主[3-8],这类传统方法需要较多的先验信息,在使用上限制较大。基于深度学习(Deep Learning,DL)的AMR 方法,采用网络的非线性处理单元,直接从原始信号中获取深层次特性。O’Shea 等[9]在2016 年首次将深度学习技术运用于调制识别,利用卷积神经网络(Convolutional Neural Network,CNN)有效区分出了11 种调制方式,并在分类性能上取得了优于传统方法的效果。West等[10]对不同的深度神经网络进行对比分析,发现网络深度对识别精度影响有限。Zhang 等[11]在多通道神经网络中同时馈入同相正交(In-Phase and Quadrature,IQ)信号数据和四阶累积量以补充通过网络学习到的信息特征,有效改善了CNN 和长短期记忆网络(Long Short-Term Memory,LSTM)的分类能力。Ramjee 等[12]针对各种经典神经网络进行分析,并通过子采样技术对数据特征降维,降低训练复杂性。Qi 等[13]通过深度残差网络(Deep Residual Networks,ResNet)提取多模态信号中的特征,通过并联特征融合方式补充数据特征,有效识别出16 种调制方式,包括高阶的正交振幅调制(Quadrature Amplitude Modulation,QAM),如256QAM 和1 024QAM。Wu 等[14]和Lu 等[15]将CNN 和序列模型的输出加以拼接,通过并联方式融合数据特征,以提高模型泛化能力。

鉴于以上研究,当前AMR 模型以CNN、LSTM 及它们的相关变体为主,通过优化网络结构和加工数据特征等方式改善网络性能,但识别精度方面仍有待提升。

本文受文献[14]和文献[15]的启发,针对当前AMR方法识别精度低的问题,提出一种基于结合策略的调制识别协同协作模型(CNN-LSTM Collaboration Model,CLCM)。该识别方法通过加权投票结合策略联合CNN 和LSTM 共同完成调制方式分类任务,实现高精度的调制方式辨识。结果表明,CLCM 可有效识别24 种被广泛应用的调制方式,平均识别精度超过95%;在高信噪比下,对128QAM 和256QAM 等高阶调制方式的识别精度均高于90%,这对于高速数据传输应用意义重大。

1 无线通信系统模型及数据预处理

1.1 无线通信系统模型

无线通信系统基本结构如图1 所示,主要由3 部分组成:发射机、信道和接收机。信号的调制处理通常部署在发射机部分,通过调制可以扩展信号带宽,提高信号的抗干扰能力。

调制识别的处理模块通常部署在接收机部分。假设接收机接收到的信号为r(t),则可以定义为:

其中,s(t)表示由发射机发出的传输信号,c(t)表示无线通信信道的脉冲响应,n(t)指加性高斯白噪声。

1.2 数据预处理形式

本文在接收端得到的信号数据被处理为IQ 信号,这是调制识别任务中被广泛使用的输入数据[12-13]。接收端得到符号序列表示为I+jQ,符号序列的I 分量(实部)和Q分量(虚部)分别表示为I=[i1,i2,...,iL],Q=[q1,q2,...,qL]。L表示序列长度,以此获得IQ 信号的二维数据表达形式,表示为。

Fig.1 Wireless communication system图1 无线通信系统

利用极坐标的形式可以有效表达出相位和振幅的变化规律,这是考虑到了序列模型对相位和振幅变化的敏感性,类似的应用可见文献[15]。极坐标表达式表示为P=(ρ,θ),其中极半径表示为,极角表示为θ=atan(Q/I)。

2 CLCM模型

2.1 模型整体概述

为实现高精度的调制方式智能辨识,本文设计了一种AMR 协作模型CLCM。CLCM 的具体框架结构如图2 所示,它包含CNN 和LSTM 两种分类模型,通过加权投票结合策略联合两种模型,达到提高模型泛化能力的目的。

其中,CNN 模型结构如图3 所示。CNN 用于接收输入大小为2×1 024 的IQ 信号,提取信号的空间特征。IQ 信号依次经过5 个由卷积层和池化层构成的单元结构处理后,得到的特征通过两个全连接层的非线性变换,输出CNN 的预测结果。CNN 中的卷积层用于挖掘数据深层次的抽象特征,其前向传播过程可以表示为:

其中,x表示CNN 的输入数据,滤波器(大小为m×n)的权重为w,*代表卷积操作,f(·)代表激活函数,y为该卷积层的输出。每个卷积层的滤波器大小为1×3,深度为64;池化层通过对数据特征进行下取样,压缩数据维度降低计算复杂度,目前常用的池化方法有最大池化和平均池化。最大池化层的池化窗长宽分别设置为1 和2,平均池化层的池化窗长宽分别设置为1 和16。第一个和第二个全连接层的节点数分别设置为128 和24,第二个全连接层使用Softmax 激活函数,设置的节点数与所需分类的信号调制方式类别数一致。Softmax 是一种将多种类别的输出值映射为介于0和1之间的向量函数,数学表达式为:

Fig.2 CLCM model图 2 CLCM 模型

Fig.3 CNN model structure图3 CNN模型结构

其中,K表示所需分类的类别数,xi表示激活函数所在层对应的第i个节点输出的预测值。

LSTM 作为一种循环神经网络的改进模型,采用门控机制克服了训练过程中的梯度爆炸和梯度消失问题,在序列数据建模上具有长时记忆的优势。LSTM 主要由遗忘门、输入门、输出门、临时单元状态4 部分组成,基本原理如下:

其中,σ表示Sigmoid 激活函数,·表示向量的元素积,X代表LSTM 的输入数据,H代表细胞单元的输出,W代表连接不同门的权重矩阵,b代表相应的偏置。分别表示t时刻下的遗忘门、输入门、输出门、临时单元状态和新单元状态。本文设置的LSTM 共有3 层,其中前两层分别包含128 个LSTM 单元结构,LSTM 单元结构如图4所示。第三层是一个带有Softmax 的全连接层,节点数设置为24(调制方式的类别数)。

Fig.4 LSTM unit structure图4 LSTM 单元结构

2.2 结合策略

针对单个分类模型存在数据拟合程度不高、泛化能力较弱的问题,本文引入结合策略关联独立的CNN 和LSTM,通过加权投票结合策略联合两种模型协同合作,使某一分类模型造成的误分类错误通过其他分类模型进行校正,平衡单一模型在分类性能上的短板。从假设空间的变化来看,加权投票结合策略有利于扩大分类模型的假设空间[16],互补特征提取能力的优势,达到提高模型泛化能力的目的。

本文利用加权投票结合策略互补CNN 和LSTM 的特征提取优势。加权投票结合策略表示如下:

其中,x表示输入数据,m表示所使用的分类模型个数,j表示当前参与决策的网络模型序号,wj表示第j个网络的权重大小(wj≥0,),∏(·)表示指示函数,y表示真实值。C(j)指当前参与决策的网络模型的预测结果。通过结合策略汇总多个神经网络模型对各数据标签的预测结果,最终选择概率之和最大的类标签作为决策结果。这种方式填补了单个CNN 或LSTM 模型对个别信号数据特征表达能力不强的空缺,实现分类模型间的优势互补。

3 实验环境与参数选择

3.1 实验环境

本文基于Python 汇编语言,运用Tensorflow 深度学习开源框架及Keras 高阶应用程序接口进行实验。实验环境具体配置如表1所示。

Table 1 Experimental environment表1 实验环境

3.2 实验数据集与评价指标

为验证CLCM 模型有效性,采用开源调制识别数据集RadioML2018.01a 并进行离线实验。RadioML2018.01a[17]基于GnuRadio 平台产生,模拟了真实无线通信系统中常见的损伤,涵盖了24 种广泛使用的单子载波调制方式,具体信息如表2所示。

调制识别可以看作是一项多分类任务,常采用准确率评价模型分类性能,准确率的定义如下:

其中,TP、TN、FP 和FN 分别表示统计得到的真正例、真反例、假正例和假反例的个数。

4 实验仿真与分析

4.1 模型性能比较

为验证CLCM 模型的有效性,与XGBoost[17]、VGG[17]、ResNet[17]和DrCNN[18]等4 种当前先进的调制识别模型对比,所有模型均在相同条件下进行训练和测试。各模型准确率曲线如图5 所示,随着信噪比的增加,各模型识别精度开始增加。在信噪比超过12 dB 后,大多数模型的识别精度趋于稳定,其中CLCM 的识别精度超过95%,比其他对比模型高20%以上。

Table 2 RadioML2018.01a parameters表2 RadioML2018.01a参数

Fig.5 Recognition performance comparison图5 识别性能比较

4.2 调制方式分类表现

以准确率作为评价指标,通过准确率曲线和混淆矩阵进一步验证所提方法的识别性能。图6 呈现了多种调制方式的识别精度随信噪比增加的变化轨迹。

图6(a)给出了CLCM 对PSK 调制信号和APSK 调制信号的识别精度结果。这些调制方式在信噪比超过10 dB时,识别精度均达到95%以上。

图6(b)给出了低阶数字调制方式和模拟调制方式的准确率曲线。可以看出,大多数数字调制方式得到了有效识别。当信噪比超过0 dB 时,各数字调制方式的识别精度超过90%;当信噪比大于10 dB 时,模拟调制方式FM、AM-SSB-SC、AM-SSB-WC、AM-DSB-SC 和AM-DSB-WC的识别精度均超过70%。

Fig.6 Accuracy curve of modulation classification图6 调制分类的准确率曲线

图6(c)给出了ASK 和QAM 调制方式的识别准确率曲线。CLCM 在信噪比超过14 dB 的情况下,对高阶调制方式的识别精度均超过90%。高阶QAM 调制方式的识别性能受信道影响较大,往往识别难度较高,这是因为QAM 类型的调制方式在数字域中的星座点存在重合。

图7 为CLCM 在高信噪比条件(信噪比=18 dB)下的混淆矩阵。在混淆矩阵中,对角线上的颜色深浅代表着各调制方式识别精度的高低,颜色越深代表该类调制方式被正确分类的可能性越高。对角线以外区域表示某种调制方式被误判为另一种调制方式的概率。可以看出,CLCM能有效识别绝大多数调制方式,包括64QAM、128QAM 和256QAM 等高阶QAM 调制方式;对于单边带模拟调制方式(AM-SSB-SC 和AM-SSB-WC)和双边带模拟调制方式(AM-DSB-SC 和AM-DSB-WC)的识别存在轻微混淆,这是由于模拟调制方式数据经由音频信号采样获得,具有静音周期,相对难以识别。

Fig.7 Confusion matrix at the signal to noise ratio of 18 dB图7 混淆矩阵(信噪比=18 dB)

5 结语

为实现高效精准的无线通信信号调制方式辨识,提出了一种基于加权投票结合策略的协作模型CLCM。仿真实验表明,CLCM 在高信噪比上的识别精度比当前多数先进模型(例如XGBoost、VGG 等)高20%以上;能有效识别24种被广泛应用的调制方式,平均识别精度超过95%;对64QAM、128QAM 和256QAM 等易混淆的高阶调制方式的识别精度均超过90%,这在高速数据传输应用中意义重大。

然而,实验具有一定局限性。深度学习模型由数据驱动,足够的数据量才能保证模型具有良好的鲁棒性,而在实际场景中获取数据较为困难。此外,网络模型能否胜任复杂多变的实际场景有待进一步考究。

猜你喜欢
信噪比准确率精度
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
基于深度学习的无人机数据链信噪比估计算法
高速公路车牌识别标识站准确率验证法
基于DSPIC33F微处理器的采集精度的提高
低信噪比下LFMCW信号调频参数估计
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
GPS/GLONASS/BDS组合PPP精度分析
保持信噪比的相位分解反褶积方法研究
改进的Goldschmidt双精度浮点除法器
巧用磨耗提高机械加工精度