基于卷积双向长短期神经网络的调制方式识别*

2020-08-10 00:58谭继远张立民钟兆根
火力与指挥控制 2020年6期
关键词:张量识别率卷积

谭继远,张立民,钟兆根

(1.海军航空大学研究生一队,山东 烟台 264001;2.海军航空大学信息融合研究所,山东 烟台 264001;3.海军航空大学航空基础学院,山东 烟台 264001)

0 引言

信号调制识别技术一直是无线通信领域的一个研究热点,广泛应用于军事、民用领域,例如电子对抗、信号监测与信息获取等,是认知无线电、感知频谱的基础[1-2]。近年来,调制识别技术得到了极大的发展,国内外学者对信号不同调制方式的识别和不同信道、噪声条件下的信号调试识别进行了大量的研究,取得了一些较为实用的成果,包括最大似然法[3-4]、高阶累积量法[5]、循环谱算法[6]和KS 检测算法[1,7]等。

随着通信技术的发展,通信信号的调制方式种类也多种多样,如何在不同信噪比以及不同信道条件下有效区分多种调制方式仍是一个研究的难点,目前该方面的文献相对较少。

N.Ghani 提出了利用等信号的平方谱谱峰数以及功率谱的差异进行分类[8],该方法能对10 种调制方式进行识别,但是仅限于AWGN 信道。2007 年,K.Maliatsos 等人首次引入小波变换[9],先通过小波变换来降低噪声的影响,然后提取特征进行调制识别,实现了PSK、FSK、ASK 和QAM 的多种调制方式的识别,同时降低了计算复杂度,但是没有分析信噪比低于10 dB 时算法的性能。近年来,深度学习逐渐应用到调制识别领域,与传统的机器学习相比,深度学习不需知道关于调制信号的信息,具有直接从原始数据自动学习特征的优点。2016 年,Timothy J O’Shea 等人提出了利用卷积神经网络对11 种调制信号进行分类[10],结果表明,该方法优于传统的识别方法,在识别种类和准确率上都有所提高,但是对QPSK 的识别率较低,同时算法的运算时间较长。2017 年,Krishna Karra 等提出了基于深度神经网络(Hierarchical Deep Neural Networks,H-DNN)的识别方法[11],该方法解决了文献[10]中对WBFM 识别率不高的问题,但是产生了新的问题,4-QAM 和16-QAM 之间的识别率有所降低。2018 年,Rundong Li 等提出了基于深度卷积神经网络的鲁棒自动VHF用于调制识别[12],该方法提高了抗噪声性能和算法的鲁棒性,但是识别种类有所降低,共识别了7 种调制方式,同时网络复杂度有所增加。文献[13]中首次将CNNs 和LSTM 结合的卷积长短期深层神经网络应用于调制识别领域,相比于CNNs 识别网络,CLDNN 由于网络深度的增加,识别性能得到了提高。

本文将卷积神经网络与双向长短期记忆神经网络相结合,提出了一种卷积双向长短期神经网络的信号多调制方式识别。该方法首次将BiLSTM 应用于调制识别领域,同时减少卷积层的数目,构建成一个更简单的神经网络,达到了调制识别的目的。本文提出的CNN-BiLSTM 方法具有以下优点:1)网络层数与训练参数减少,识别时间大大减少;2)无需信道、噪声等先验信息,调制识别率得到了一定的提高。

1 信号模型与网络描述

1.1 信号模型

假设接收信号的模型为

其中,yn为接收信号,H 为信道,xn为输入信号,ωn为时刻n 处的噪声采样。调制识别就是研究接收信号{yn},n=1,2,3,…,N 为何种调制方式问题,其中信号可以是模拟或数字数据类型。

1.2 卷积神经网络

CNNs 是一种前馈神经网络,卷积神经网络在图像处理中具有平移不变性的特点,因此,一直是图像识别领域的核心算法之一。标准的CNNs 一般由输入层、卷积层、池化层、全连接层和输出层组成[14],如图1 所示。

图1 标准卷积神经网络

1.3 双向长短期记忆神经网络

BiLSTM 是一种特殊的循环神经网络(Recurrent Neural Networks,RNN),它能将预测信息的前面若干输入和后面若干输入共同利用,这样预测会更加准确。BiLSTM 的网络结构如图2 所示。

图2 双向LSTM 网络结构图

该网络的前向传播层和反向传播层共同连接着输出层,其中包含6 个共享权值W1~W6。该网络首先通过前向传播层正向计算一遍,保存正向计算过程中每时刻向前隐含层的输出[15]。然后,通过反向传播层反向计算,得到反向计算的每时刻向后隐含层的输出。最后,每个时刻的输出为相应时刻前向传播和反向传播输出的综合,数学表达式如下:

其中,ht表示正向传播中,t 时刻向前隐含层的输出。ht'表示反向传播中,t 时刻向前隐含层的输出。ot为t 时刻输出层的输出。

2 实验数据与CNN-BiLSTM 网络

2.1 实验数据库

调制识别的数据库来源于Timothy J O’Shea 公开的RML2016.04C 和RML2016.10a 数据集,该数据集是由I/Q 两路数据组成,是一个包括每次采样数据的同相和正交分量,维数为2×128。两个数据集分别由220 000 个调制数据样本和162 060 个调制数据样本组成[16],共包含11 种调制类别,其中包括AM-DSB,AM-SSB,WBFM 3 种模拟调制和BPSK,8PSK,CPFSK,GFSK,4QAM,16QAM,64QAM 和QPSK 等8 种数字调制。这些数据在SNR=-20 dB 到SNR=18 dB 上以2 dB 间隔近似均匀分布,这些调制数据样本使用真实的语音和文本信号,在衰落、多径和加性高斯白噪声等信道条件下获得,因此,逼近真实场景数据。与RML2016.04C 数据集相比,RML2016.10a 数据集通过了更加严格的信道条件,加强了各种外在条件的影响,因此,该数据集更加接近真实场景下的调制信号。

2.2 网络结构

本文采用的CNN-BiLSTM 网络由一个BiLSTM层和一个全连接层两个卷积层组成。两个卷积层采用修正线性单元ReLU 作为激活函数,BiLSTM 采用sigmoid 作为激活函数,全连接层采用软最大函数SoftMax 作为激活函数对11 种调制数据进行分类,同时卷积层和BiLSTM 层采用丢失输出Dropout 防止出现过拟合的现象。同时,选用Adam 作为梯度下降优化算法,具体网络结构如图3 所示。

图3 CNN-BiLSTM 网络结构图

输入层为I/Q 两路的2×128 维度的调制数据,第1 层卷积层卷积核大小为1×3,个数为128 个。第2 层卷积层卷积核大小为2×3,个数为32 个。BiLSTM 层神经元个数为128 个,最后一层全连接层神经元个数为11 个,对应11 种调制类型。

2.3 网络实现

首先对输入数据进行处理,使用Keras 中的Reshape 函数将2×128 维度的调制数据转换为(None,1,2,128)的4D 张量,依次代表(样本数、图像高度、图像宽度、图像通道数),作为卷积层的输入。经过两层卷积层的卷积后,输出为(None,32,1,124) 的维度为32×124 的4D 张量。因为BiLSTM 层的输入要求为3D 张量,所以再次使用Reshape 函数将4D 张量转换为(None,32,124),将32 作为BiLSTM 网络输入序列的维度,124 作为BiLSTM 网络输入序列的长度输入到BiLSTM 网络中[19]。经过式(1)~式(3)的双向运算后,输出3D 张量(None,32,256),然后,经过Flatten 将3D 张量转化为2D 张量,传递到最后的全连接层中。

2.3.1 卷积层的学习

在卷积层中,假设卷积层的输入为X∈RA×B,其中A 表示输入信号的特征的数量,B 表示输入信号的数量。令x=[x1x2… xB],其中,xb表示信号b的特征矢量。卷积层的激活可以计算成:

其中,hj,k表示第j 个特征图的卷积网络输出,为第j 个卷积器的权值参数,s 是卷积器的大小,aj是第j 个特征图的偏置。输入和卷积器进行加权平均后,由非线性激活函数θ 计算得到网络的输出结点值。通过式(4),卷积层实现了特征图的卷积,得到了相应的输出特征。本文采用的非线性激活函数θ为ReLU,具体表达式如式(5)所示:

卷积层的输入通道数由输入4D 张量的通道数决定。输出张量的通道数由卷积层的输出通道数决定,输出张量的高度和宽度计算公式如下。

其中,heightout代表卷积层输出张量的高度,heightin代表卷积层输入张量的宽度,heightkernel代表卷积核的高度,padding 代表扫描方式,本文选择的是valid。stride 代表卷积核个数,widthout代表输出张量的宽度,widthout和widthkernel分别代表卷积层输入张量的宽度与卷积核的宽度。

2.3.2 BiLSTM 层

卷积层后,仍然会保持着前后时序相关性,经过式(2)~式(4)的双向运算后,输入到最后的全连接层,BiLSTM 层的实现采用的是Keras.model,从Keras 库中引入Bidirectional,代码实现如下:

model.add(Bidirectional(LSTM(128,return_sequences=True),merge_mode=’concat’))

model.add(Dropout(dr))

其中,dr 为0.5,代表每次训练随机删除50 %的隐神经元,由于每次训练删除的神经元不同,使得每个神经元会尽可能发挥自己的作用,避免过拟合的出现。

2.3.3 softmax 层

全连接层采用的是softmax 函数,其可以用于多分类过程,将多个神经元的输入映射到(0,1)之间,每个映射可以看成输出概率,从而进行多分类。假设上一层的输出为{z1,z2,…,zn},softmax 层运算公式如式(8)所示。

其中,ki代表代表zi在预测结果中的概率。将输出概率转化为图像显示,就是混淆矩阵,能直观地反映各调制方式的识别情况。

3 实验结果与分析

3.1 实验环境

实验运行在Windows7 系统下,CPU 为Intel(R)Core(TM)i5-4210U,无GPU 的参与,内存为12 G。网络搭建的深度学习库采用Keras,后端选择的是TensorFlow。网络训练做大次数为100 次,采用EarlyStopping 函数,将网络的训练损失函数设置为监测值,当监测值超过5 次训练未发生下降时,网络将停止训练并输出训练结果。将两个数据集的各个信噪比下50%的数据作为训练数据,其余50%的调制数据作为检测数据。

3.2 网络训练分析

本文提出的CNN-BiLSTM 网络在两个数据集下的训练与测试损失函数如图4、图5 所示,从图中可以看出,在调制环境较为理想的RML2016.04C下,经过大约30 次训练网络的损失函数趋于稳定;在RML2016.10a 下,大约经过60 次训练,网络的损失函数趋于稳定。而且两者的训练损失函数与测试损失函数较为平滑且较为接近,没有出现明显的波动,说明本文提出的网络训练过程良好,未出现过拟合或欠拟合的问题。

图4 RML2016.04C 下CNN-BiLSTM的训练次数与损失函数图

图5 RML2016.10a 下CNN-BiLSTM的训练次数与损失函数图

3.3 正确识别率对比

3.3.1 RML2016.04C 条件下的正确识别对比

从图6 可以看出,在SNR 低于-14 dB 时,本文识别网络的识别性能略低于文献[11]中的CNN2 卷积神经网络。但是,随着信噪比的提高,本文识别网络的识别率高于CNN2,并且在SNR=-2 dB 时,识别率达到了90%以上。图7~图10 为识别混淆矩阵,反映了各个调制方式的识别情况。从图7~图10 可以看出,算法识别率的提高主要是由于对8PSK 和WBFM 的识别效果增强。

图6 RML2016.04C 下CNN-BiLSTM 与CNN2 识别率对比图

3.3.2 RML2016.10a 条件下的正确识别率

下面对比了RML2016.10a 条件下两层卷积神经网络(CNN2)、三层卷积神经网络(CNN3)、四层卷积神经网络(CNN4)、CNN-BiLSTM、三卷积层的残差网络(Residual Network,ResNet)、四卷积层的残差网络的正确识别率,上述网络的识别情况可参照文献[14]。由图11 可以看出,只有两个卷积层的CNN-BiLSTM 的识别效果优于CNN2、CNN3 和三卷积层的ResNet,并且网络的复杂度低于CNN3 和具有3 个卷积层的ResNet。虽然本文网络识别性能低于CNN4 和四卷积层的ResNet,但是上面两种网络是以网络深度与参数的增加换取识别率的提高,复杂度增加。

图7 SNR=0 dB 时,CNN 的混淆矩阵

图8 SNR=0 dB 时,CNN-BiLSTM 的混淆矩阵

图9 SNR=16 dB 时,CNN 的混淆矩阵

图10 SNR=16 dB 时,CNN-BiLSTM 的混淆矩阵

图11 RML2016.10a 下不同识别网络识别率对比图

3.4 复杂度分析

复杂度分析中,因为CNN3,CNN4 和ResNet 的复杂度都高于CNN2[14],所以主要对比了本文所提CNN-BiLSTM 与 文 献[11] 中 的CNN2 网 络 在RML2016.04C 下的运行时间与训练参数数量,得到的算法运行时间与训练参数如表1 所示。由表1 可以看出,CNN2 的单次训练平均运行时间是本文网络的5.6 倍,总用时为本文网络的5.1 倍。同时,CNN2 的网络训练参数比本文网络的训练参数多将近一个量级。

表1 CNN-BiLSTM 与CNN2 运行时间与训练参数对比表

4 结论

本文基于公开的RML2016.10a 和RML2016.04C 两个数据集,研究了11 种调制方式的识别问题。本文方法基于卷积神经网络和双向长短期记忆神经网络,建立了CNN-BiLSTM 的调制识别网络,充分利用CNN 在图像处理中的优势和BiLSTM的前后时序相关性,达到了区分11 种调制方式的目的。实验结果表明,其大大降低了网络复杂度,调制识别性能得到了一定的改善。下一步将重点研究在信噪比低于-14 dB 时,如何有效提高算法的识别性能。

猜你喜欢
张量识别率卷积
基于全卷积神经网络的猪背膘厚快速准确测定
浅谈张量的通俗解释
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
关于一致超图直积的循环指数
非负张量谱半径上下界的估计不等式
支持张量机算法优化研究综述
档案数字化过程中OCR技术的应用分析
基于PCA与MLP感知器的人脸图像辨识技术