基于小波阈值去噪与时频图像检测的信号调制识别技术

2024-01-18 12:08孙思燕张伟雄
无线电工程 2024年1期
关键词:时频小波信噪比

孙思燕,张伟雄,唐 娉,郑 柯,张 正*

(1.中国科学院空天信息创新研究院,北京 100094;2.中国科学院大学 电子电气与通信工程学院,北京 100049)

0 引言

通信传输信息的调制样式对于接收端来说是未知的,需要先对信号的调制方式进行识别,再进行下一步分析与处理[1]。早期的调制识别主要依靠人工,效率低下、可持续性差。随着技术发展和频率感知需求的增长,自动调制识别(Automatic Modulation Recognition,AMR)技术开始被研究[2]。目前,大量AMR算法及其改进算法被提出,促进了通信领域的进步。

在20世纪80年代,为解决AMR问题,出现了基于决策理论的假设检验调制识别方法[3]。该方法利用待识别信号的统计特征构建最大似然函数,计算似然比后再与判决信号的门限值作比较,得到调制识别结果。根据建立模型方式的不同,又可分为平均似然比检验、广义似然比检验及混合似然比检验[4-6]。基于决策理论的假设检验方法具有理论性完备等特点,但计算复杂,目前主流的AMR技术是基于特征的统计模式识别方法[7-8]。基于特征的统计模式识别方法无需依靠先验知识,利用信号本身来构造特征,再通过设计好的分类器对目标信号进行识别。在特征设计阶段,除了直接从信号的瞬时或统计参数构造专家特征外,也可将时域信号变换到其他特征空间,例如星座图[9]、时频图[10]等。星座图在对特定几种信号的调制识别中发挥着巨大作用,但由于部分信号如调频信号等,其特征无法通过星座图反映,因此,基于时频图的调制识别算法受到了广泛关注。常见的由一维信号生成时频图的时频转换方法有短时傅里叶变换(Short Time Fourier Transform,STFT)、小波变换、魏格纳-维尔分布(Wigner-Ville Distrbution,WVD)和Cohen类时频分布等[11],皆满足信号的测不准原理,即时域信号经过时频转换后,时宽和频宽不可能同时任意的窄。随着深度学习技术在各个领域的广泛应用,通信领域的研究人员也开始利用卷积神经网络(Convolutional Neural Network,CNN)识别信号。在目前的AMR研究中,针对不同的信号数据源,将时频图与深度学习结合对信号调制样式进行识别,成为新的研究热点。2019年,Zhang等[12]创建了不同调制方式下复杂信号的STFT时频图的图像数据集,并研究了不同信噪比下,CNN使用不同激活函数和优化函数对调制识别准确率的影响。2020年,Daldal等[13]研究基于STFT和CNN结合的AMR模型,对比了5种常见的CNN的调制识别准确率。2020年,李红光等[14]采用STFT&WVD组合时频变换方法,对跳频信号进行时频变换得到二维时频图,并经过一系列的处理后,输入CNN中训练学习,进行识别。

为了降低噪声干扰,提高时频图质量,取得更好的识别效果,本文提出一种基于小波阈值去噪与时频图像检测的信号调制识别技术,并对7种常见的数字调制信号进行了训练识别。通过与没有去噪步骤的识别方法,以及其他调制识别方法对比后发现,所提方法对于低信噪比下7类调制信号的识别效果较优。

1 信号调制识别模型

1.1信号模型

信道中传输的信号s(t)通常由噪声和信号两部分组成,公式如下:

s(t)=x(t)+n(t),

(1)

式中:x(t)为发送的调制信号,n(t)为噪声,本文中考虑的是高斯白噪声(Additive White Gaussian Noise,AWGN)。x(t)的一般表达式为:

(2)

式中:Am为信号x(t)的调制幅度序列,an为取值0或1的符号序列,g(t)为符号周期内形成的波形脉冲,Ts为信号x(t)的符号周期,fc为信号x(t)的载波频率,fm为信号x(t)的调制频率,φ0为信号x(t)的初始相位,φm为信号x(t)的调制相位[15]。通过对调制参数的控制,得到不同调制样式的信号,常见的有幅移键控(Amplitude-Shift Keying,ASK)调制、频移键控(Frequency-Shift Keying,FSK)调制、相移键控(Phase-Shift Keying,PSK)调制以及正交振幅调制(Quadrature Amplitude Modulation,QAM)。

1.2 本文信号调制识别方法

针对低信噪比下信号表达模糊导致调制困难的问题,本文提出了一种基于小波阈值去噪和时频图像检测的调制识别方法,该方法的核心思想是将信号调制识别问题转化为图像处理问题。该方法主要分为两部分:第一部分是数据处理,包括利用希尔伯特变换将实信号变为解析信号、利用小波阈值去噪技术对一维信号进行去噪以及通过时频转换方法生成时频图3个步骤。为了让生成的时频图能够更好地反映信号特征,将时频重排技术作为本文的时频转换方法。作为一种后处理技术,时频重排重新分配了信号在时频图上的权重,具有比较好的抗噪声性能。本文选择VGG网络作为调制识别网络,对生成的时频图进行学习训练,得到对应信号的调制样式。具体流程如图1所示。

图1 本文提出的调制识别方法框架Fig.1 Framework of the proposed modulation recognition method

2 数据处理

2.1 希尔伯特变换

(3)

z(t)=f(t)+jH(f(t))。

(4)

任何一个实函数都可以通过希尔伯特变换得到一个解析信号,这个解析信号也可以唯一分解为其实部和虚部。经过希尔伯特变换后得到的解析信号,其相位谱完全继承了实信号的相位信息。

2.2 小波阈值去噪

2.2.1 小波阈值去噪原理

由Donoho[16]提出的小波阈值去噪法具有良好的局域性和多分辨率特性,能有效地区分信号和噪声,是一种被广泛使用的信号去噪方式。原始信号中,信号部分和噪声部分在频谱上的分布不同,信号部分通常体现在低频处,噪声则主要出现在高频处。小波阈值法的本质是利用小波变换分离出信号的小波系数,再选择一个适当的阈值过滤掉信号的异常频率部分,最后对信号进行小波重构,达到去除噪声的目的。整体流程如图2所示。

图2 小波阈值去噪流程Fig.2 Wavelet threshold denoising process

其中,信号小波分解的公式如下:

(5)

式中:c0(k)和dj(k)分别为尺度函数和小波函数的系数,第一项为信号f(t)的零阶近似,前两项为一阶近似,前三项为二阶近似……以此类推。信号小波分解过程如图3所示,原信号被依次分解为ca3、cd3、cd2、cd1,其中ca表示低频信息,cd则表示高频信息。

图3 信号3级小波分解示意Fig.3 Schematic diagram of signal in three-level wavelet decomposition

2.2.2 小波阈值去噪参数确定

影响小波阈值去噪效果的因素有很多,在不同的情况下,需要选择合适的阈值、阈值函数以及小波分解级数(Level,Lev)。结合本文中信号的实际情况,进行了以下分析:

① 小波阈值去噪中常用的阈值函数有2种:硬阈值函数和软阈值函数。

硬阈值函数:

(6)

软阈值函数:

(7)

式中:wj,k为原始小波系数,λ为阈值。从式中可以看出,硬阈值函数有一个明显的阈值点,如果信号的幅度小于该阈值,就会被设置为0,这对信号的主要成分可能会产生较大的影响,从而导致失真。相比于硬阈值函数,软阈值函数具有较为平滑的转折点,因此对信号的较小幅度的噪声成分进行阈值处理时,可以产生连续的减小效应,不会出现明显的失真。基于以上分析,本文方法中选择的是硬阈值函数。

② 阈值的选择

小波中阈值即阈值函数中的λ,常用的有RigSure阈值、Sqtwolog阈值、Heursure阈值和Min-max阈值。一般来说,Min-max阈值和RigSure阈值偏保守,适合噪声较低情况。而用Sqtwolog阈值去噪比较彻底,但是也容易把有用的信号误认为噪声去掉。Heursure阈值则是RigSure阈值和Sqtwolog阈值的综合,比较适合高噪声情况,因此选择Heursure阈值作为本文小波去噪的阈值。Heursure阈值的公式如下:

(8)

式中:n为信号长度,N为小波分解的最大层数,σ为信号标准差。

(9)

③ 小波分解级数的选择

小波分解级数由处理信号本身的特性决定,面对不同的情况时有不同的选择。为对比小波阈值法在不同层的去噪方法性能,选择适合本研究中信号的分解级数,引入信噪比和均方根误差这2个评价指标,对去噪后的信号进行评估。公式如下:

(10)

(11)

表1 2FSK在不同级小波分解下的去噪表现Tab.1 Denoising performance of 2FSK under different levels of wavelet decomposition

从表中可以看出,在RSN≤0 dB,且其他条件相同的情况下,Lev=1时的小波阈值去噪表现在信噪比和均方根误差指标上均不如另外2个分解级数,这说明1级小波分解不能满足本研究中的信号去噪需要。当RSN≤-6 dB时,相比起在其他小波分解级数,Lev=2的小波分解去噪效果是最好的;而当RSN>-6 dB时,3级小波分解的去噪效果赶超了 2级小波分解的效果。因此,对于本文调制识别模型乃至小波去噪算法,以RSN=-6 dB为界,当不低于这个信噪比时,令Lev=2;当小于这个信噪比时,令Lev=3。

大豆窄行种植技术原则上就是缩短大豆之间的行距,增加种植密度,提高大豆作物的阳光面积,使大豆高产。目前,根据我国大豆品种的地理条件和生长规律,大豆窄行密植栽培技术大致可分为平作、大垄、窄行小垄、窄行密植三种。在土壤质量差的偏远地区,窄行密植也能提高大豆产量,而在土壤肥力好、农业资源设备高、碳素好的地区,大垄窄行密植效果较好。生存与管理。因此,在种植时,应选择适宜的技术模式。

2.3 时频重排

作为最具代表性的双线性时频转换方法,WVD可以看作是STFT的扩展,表达式如下:

(12)

相比于STFT,WVD在时频域上更为准确地描述了信号的特性。但其缺点也很明显,WVD易受到边界效应和噪声干扰的影响,导致分辨率不够高或产生假分量等。研究人员在此基础上提出推广的信号时频谱图,以减少交叉项的干扰。信号谱图的一般形式可表示为信号的WVD和短时窗的WVD的二维卷积形式,公式如下:

(13)

(14)

(15)

此时,时频重排的表达式如下:

式中:δ(·)为狄拉克函数。STFT、WVD等常用的时频分析方法符合测不准原理,但时频重排相当于一种后处理技术,可以通过重新排布生成的时频面上的能量分布,同时改善信号的时频分辨率。图4为2FSK信号的谱图与重排后的谱图对比,可以看出,对于相同的信号,通过时频重排生成的谱图,相较于信号谱图具有更好的时间和频率分辨率[17]。

(a)谱图

(b)时频重排谱图

2.4 双线性插值缩放

直接对信号进行时频转换得到的时频图不一定符合网络的输入尺寸,且生成的时频图过大,有可能会影响运算速率。出于统一输入时频图尺寸与提高效率的考虑,本方法对时频图进行了缩放处理。为了能尽量保留原图像中的特征信息,使用了双线性插值图像缩放技术。

(17)

(18)

记原始时频图上的元素坐标为(xold,yold),缩放后时频图中的元素坐标为(xnew,ynew),可使用反向映射的方法计算在原始时频图中的位置,即:

(19)

(20)

接下来利用双线性插值对时频图上的每一点进行缩放操作。对于新时频图中某一位于(Idist,Jdist)位置的点,可以利用其在原始时频图中位置为(i+v,j+u)的点来进行双线性插值,如图5所示。双线性插值的基本思想是通过旧元素周围4个最近邻的元素加权平均,来计算新元素值的方法。可以看作在2个方向分别进行一次线性插值对于坐标(i+v,j+u)附近的4个元素,设它们的元素值分别为a、b、c、d,则新元素值的计算公式如下:

图5 双线性插值缩放示意Fig.5 Schematic diagram of bilinear interpolation scaling

vnew=a(1-u)(1-v)+bu(1-v)+c(1-u)v+duv,

(21)

式中:u和v是坐标(xold,yold)与最近邻元素之间的距离比例。

3 调制识别网络模型

本节对本文中使用的调制识别网络模型进行了详细介绍。由于VGG(Visual Geometry Group)网络模型在图像分类任务中的良好表现[18-20],常被用作调制信号识别网络。在传统VGG16模型的基础上进行了修改,作为本文调制识别使用的训练网络,网络一共有5个卷积-最大池化(Conv-Maxpool)块, 每个块包括2个卷积层(Convolutional Layer,Conv)和一个最大池化层(Maximum Pooling Layer,Max Pooling),每次卷积后,都会经过一次归一化层(Batch Normalization,BN)和激活函数层,激活函数为ReLU。最后是一个具有3个全连接层和一个softmax层的线性模块,结构如图6所示。VGG CNN通过组合与堆叠多个卷积核,提取输入邻域内的特征。实现多个小尺寸卷积核的组合的非线性特征优于单个大的卷积核的目的,提升网络的识别精度,同时大幅减少由于深度增加所带来的参数量。VGG通过最大池化进行图像降维,提取主要特征,全连接层降低参数量并与分类器softmax配合完成分类识别。

图6 本文调制识别方法中VGG网络结构Fig.6 VGG network structure in the proposed modulation recognition method

4 仿真与结果分析

4.1 信号仿真与参数设置

为探究本文调制识别方法的性能,仿真7种常见的数字调制信号,分别为2ASK、4ASK、2FSK、4FSK、2PSK、4PSK、16QAM。采样点数为800,信号的采样频率统一为40 kHz,载波频率集为{4 kHz, 9 kHz,14 kHz,19 kHz}。每类数字调制信号均生成800个样本,共5 600个无噪声信号。然后对这些信号添加噪声,得到的信号样本的信噪比为-14~ 0 dB,间隔为2 dB。无噪声情况下,7类信号通过时频重排生成的时频图如图7所示。

图7 7类调制信号通过时频重排生成的时频图Fig.7 Time-frequency map generated by time-frequency rearrangement of seven types of modulated signals

本实验的数据处理部分在Matlab(2020b)上完成,网络框架使用PyTorch搭建。实验电脑的CPU型号为Intel(R) Xeon(R) W-2135 CPU @ 3.70 GHz,GPU为NVDIA GeForce RTX 2080Ti。对不同信噪比下生成的时频图样本集,每类调制样式随机挑选600个信号时频图样本用于训练,100个样本用于测试,100个样本用于验证。网络训练的历元数(Epochs)设置为100,样本批量大小(Batch Size)为10,选择Adam优化器,学习率(Learning Rate)设置为0.000 9。

4.2 小波阈值去噪对识别结果的影响

一般认为当RSN<0 dB时为低信噪比,本文研究信号的信噪比为[-14,0]dB,信噪比较低,噪声对信号的影响较大,严重影响了生成时频图的质量,降低了调制识别效果。因此在将含噪声信号通过时频重排方法转换成时频图之前,先对一维含噪信号进行小波去噪处理。由2.2.2小节的分析,Matlab中小波阈值去噪函数参数选择如表2所示。

表2 Matlab中小波去噪函数的参数选择Tab.2 Parameter selections for the wavelet denoising function in Matlab

图8展示了当信噪比分别为0、-8 dB时,生成16QAM信号时频图的去噪效果。当RSN=0 dB时,小波的分解级数取2,其他参数设置见表2。可以看出,RSN=0 dB的情况下,噪声对时频的影响不是很大,仍然能从时频图上分辨出信号分量。当RSN= -8 dB时,噪声分量掩盖了信号分量,信号在时频图上的信息受到了很严重的干扰。经过小波阈值去噪后, 时频图上的噪声有所抑制。因为添加高斯白噪声的程度不同,RSN=-8 dB时去噪前后的时频图比RSN=0 dB时的时频图更加明显。但噪声越高,信号分量与噪声的区分度也越低,因此,部分信号信息也在去噪过程中被去除。

(a)RSN=0 dB,16QAM,去噪前

(d)RSN=-8 dB,16QAM,去噪后

为了验证小波阈值去噪确实提高了调制识别效果,同样通过时频重排对没有经过小波阈值去噪的信号进行了时频转换,生成的时频图同样输入VGG网络中,并与本文的模型进行了比较。使用信号的整体识别准确率做为评价指标,即正确识别样本数量与样本总数量的比值,得到的结果如图9所示。可以看出,经过小波阈值去噪的识别效果会优于没有经过小波阈值去噪的调制识别模型。信噪比为 -12~-4 dB时,小波阈值去噪带来的识别准确率提升明显。当信噪比为-8 dB时,去噪后的方法的识别准确率是89.14%,而没有经过小波阈值去噪的识别准确率为87.71%。当RSN≤-12 dB以及RSN≥-2 dB时,小波阈值去噪对模型调制的优化效果并不明显,这是因为当信噪比较高时,噪声对信号信息的影响有限,这时去噪上步骤的意义不大。而当信噪比过低时,噪声严重影响了信号本身的信息,去噪效果并不理想,因此识别准确率没有较大的提高。

图9 调制模型在有无小波阈值去噪的整体识别准确率Fig.9 Overall recognition accuracy of modulation models with and without wavelet threshold denoising

4.3 识别准确率仿真

为了探究本文提出的调制识别模型的性能,将本文的仿真数据,输入文献[16,21]提出的调制识别模型进行训练识别,并与本文方法进行了对比,如图10所示。整体来看,3种模型的识别准确率与信噪比成正相关。当信噪比大于-2 dB时,本文提出的调制识别模型效果与其他2个模型的性能接近。而当信噪比小于-6 dB时,本文提出的方法与其他 2种方法的识别准确率差距逐渐增加,这说明本文提出的识别模型对低信噪比下7种信号的识别表现优异。当信噪比取-10 dB时,本文提出方法的识别准确率为81.71%,文献[21]的识别准确率为 80.28%,文献[15]的识别准确率为76.51%。

图10 本文模型与其他调制识别模型的识别准确率Fig.10 Recognition accuracy of the proposed model and other modulation recognition models

为了探究在低信噪比下3种方法具体对每类信号的识别表现,图11展示了3种方法在RSN= -12 dB情况下的混淆矩阵。整体来看,本文提出的方法具有较好的一致性。从每类信号的识别准确率中可以看出,即便是在信噪比为-12 dB的情况下, 3种方法对2ASK、2FSK信号的识别准确率都要高于对应的4ASK、4FSK信号,3种方法对2ASK、2FSK的识别准确率都达到了90%以上。这能够说明二进制的调幅与调频信号对比相应的多进制信号来说,具有更好的抗噪能力。而2PSK信号在低信噪比的情况下,最容易被错分为4PSK信号,本文方法的错分率分别达到了15.58%,文献[15]方法的错分率为25.86%,文献[21]方法更是将34%的2PSK样本错分成了4PSK。4PSK信号则容易被错分为2PSK信号和4ASK信号。造成调相信号识别准确率低的原因是,时频图对于相位特征的反应不如时域和频域特性敏感,因此在低信噪比的情况下,模型很容易对信号产生误判。类似的,16QAM信号也是因为相位信息被模糊,本文方法得到的混淆矩阵显示,有39%的样本被错分为4ASK信号,而在文献[21]和文献[15]得到的混淆矩阵中,也分别有65%、39%的样本被错分成4ASK信号。

(a)RSN=-12 dB,本文方法

(c)RSN=-12 dB,文献[15]

从混淆矩阵中不难发现,3种方法各有优劣。本文方法对2PSK信号的识别准确率达到了77%,比文献[21]方法的35%、文献[15]方法的58%要高得多。而文献[21]对4ASK信号的识别准确率则达到了70%,也要明显优于其他2种方法。但从图8展示的不同信噪比下的整体识别准确率变化来看,本文方法对这7种信号的识别整体表现最优。

5 结束语

本文提出了一种基于小波阈值去噪与时频图像检测的信号调制识别方法,该方法的核心思想是将一维信号转换成二维时频图像进行处理。而在信号转换成时频图之前,先利用小波阈值去噪方法对信号进行去噪,以降低干扰,提高时频图质量。本文使用时频重排技术的生成时频图,相较于其他时频转换方法,时频重排通过重新分配信号能量,能有效提高时频图的时间和频率分辨率。由于VGG在图像领域的识别优越性,本文使用修改的VGG网络作为时频图的训练网络。由于生成的时频图不一定符合网络尺寸,本文使用了双线性插值对时频图进行缩放处理,保证输入网络的时频图大小为256×256。通过对7种数字调制信号,即2ASK、4ASK、2FSK、4FSK、2PSK、4PSK、16QAM进行调制识别,发现本文方法在低信噪比下的表现较好。尽管在低信噪比下的整体识别准确率较高,但对于某几类调制信号,如PSK和QAM,本方法的识别表现还有待提高。因此,如何进一步提高这2类信号的识别准确率,是接下来的研究方向。

猜你喜欢
时频小波信噪比
构造Daubechies小波的一些注记
基于MATLAB的小波降噪研究
基于深度学习的无人机数据链信噪比估计算法
低信噪比下LFMCW信号调频参数估计
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
保持信噪比的相位分解反褶积方法研究
基于时频分析的逆合成孔径雷达成像技术
对采样数据序列进行时频分解法的改进
基于FPGA小波变换核的设计