梁 晶, 杨晶晶∗, 黄 铭
(1.云南大学 信息学院, 云南 昆明 650091;2.云南大学无线创新实验室, 云南 昆明 650091)
随着无线通信的发展,电磁空间中海量的不同通信体制无线电设备潜在的相互干扰一直是无线电监测工作关注的热点。 在无线电监测问题中,除需要判断某个频段是否有信号出现之外,还需要对信号进行识别分类。 然而传统上,基于无线通信信号检测与识别的方法都是单独进行的,例如,Digham等[1]提出了有关能量检测(Energy Detection,ED)的方法。 Yang 等[2]提出了有关循环平稳特征检测的方法。 Zhang 等[3]提出了基于匹配滤波器的检测方法。 Liu 等[4]提出了有关最大特征值的检测方法。Zheng 等[5]研究了基于深度学习(Deep Learning,DL)分类的认知无线电检测方法,考虑到了噪声不确定性的影响。 Awe 等[6]和Bao 等[7]提出了基于支持向量机(Support Vector Machine,SVM)的检测方法,SVM 将采样到的能量信号作为训练集与测试集,能够对信号与噪声进行分类识别。 但是该方法需求解特征参数并且存在感知时间长的缺点。 Gao等[8]提出了一种基于卷积长短期深度神经网络(Convolutional Long Short-Term Deep Neural Network,CLDNN)的DL 检测器,适用于任意类型的初级信号。 Liu 等[9]探索了基于卷积神经网络(Convolutional Neural Network,CNN)协方差矩阵的检测方法,可以方便地设置期望的虚警概率。 Xie 等[10]提出了使用双CNN 结构来从当前和历史感测数据构建的一系列协方差矩阵中同时学习能量相关特征和用户活动模式,以进一步提升检测性能。 而在文献[10]的基础上,Xie 等[11]继续提出了一种基于DL 的CNN-LSTM 感知检测器。 Ni 等[12]提出了一种基于时间卷积网络(Temporal Convolutional Network,TCN)的检测方法,该方法通过离线训练和在线检测阶段提取离散时间信号中的隐藏关系,消除噪声不确定性的影响,以提高检测概率和降低计算复杂度。而Liu 等[13]为自动调制分类(Automatic Modulation Classification,AMC)提出了一种简单的CNN 的识别方法,并探索了所提出结构的最佳深度。 侯涛等[14]研究了一种基于深度神经网络通信信号调制识别模型。 任进等[15]研究了基于循环神经网络(Recurrent Neural Network,RNN)的卫星调制信号识别算法。O’Shea 等[16]研究了基于时域同相和正交(IQ)数据训练的CNN。 Wang 等[17]研究了一种数据驱动的融合方法,使用2 个CNN 的组合在不同数据集上训练来获得更好的分类精度。 Ramjee 等[18]研究了3 种基于不同神经网络的AMC 高精度模型,包括CLDNN、长短期记忆(Long Short-Term Memory,LSTM)神经网络和深度残差网络(ResNet)。 Zhang等[19]研究了一种基于CNN 的AMC 数据预处理方法,一定程度上解决了直接使用采集到的信号样本作为CNN 模型的输入带来的弊端。 Liao 等[20]研究了一种用于快速AMC 的序列卷积递归神经网络,结合了CNN 的并行计算能力和RNN 的时间敏感性,显著提高了收敛速度。
从以上文献可以看出,研究者们对无线频谱监测系统中信号检测和信号识别方面的问题都是分开研究的,并没有考虑到将信号检测和识别相结合起来用于获取无线电监管知识[21]。 基于此,本文分别将卷积注意力模块(Convolution Block Attention Module,CBAM)[22-23]与LSTM 网络和TCN 结合起来通过二分类实现信号检测,以及基于多分类实现信号识别的集成方法。 仿真实验的结果充分验证了算法模型的可行性和有效性。
在无线频谱监测系统中,信号模型如下:
式中,xi(n)为用户发射的信号;y(n)为接收到的信号;hi(n)为信道的状态信息;M为信号中存在的未知信号个数;v(n)为信道干扰,通常建模为零均值的加性高斯白噪声。 从分类的角度可将H0和H1假设表示为二分类问题:H0只有噪声,H1有未知信号和噪声。
图1 信号模型结构Fig.1 Signal model structure
信号检测与识别的算法如表1 所示。 本文分别将CBAM[22-23]与LSTM 和TCN 结合起来通过二分类实现信号检测(简称CBAMLSTM 和CBAMTCN),基于多分类实现信号识别的集成方法。
表1 信号检测与识别的算法Tab.1 Algorithms for signal detection and recognition
该方法的2 阶段如下:在信号检测阶段中,CBAMLSTM 和CBAMTCN 检测器被用于通过用2 类训练来决定信号是否存在,第一类包括未知信号和噪声,第二类仅包括噪声。 为了简化表示,将y (n)的离散时间采样中生成的信号样本表示为:
式中,N为采样总数;yn为Y 的第n个采样点。 由于采用的信号样本是I/Q 样本,所以每个采样点可以表示为:
式中,T 表示转置;In及Qn分别为采样点yn的实值和虚值。 将In和Qn设置为一个像素点上的2 个通道中的值,组成大小为N×2 的Y0,并将Y0作为正样本,噪声作为负样本,组成Y1用作检测器的输入,并进一步通过DL 的感知框架,做出关于信号是否存在于频段中的决定。 而相比于ED 方法,这种基于DL 的信号检测方法,是利用调制信号的底层结构信息,不需要关于信道状态信息或背景噪声的先验知识,减少了许多复杂的计算度[8]。
一般来说,分类算法Ddl可以表示为[9]:
式中,Yd为分类器的输入,通过由L层组成的自定义神经网络进行处理;fi,i=1,2,…,L-1,表示第i层权值和激活函数的计算,fL是Softmax 函数给出2 个假设H1和H0的概率;argmax 是返回列表中最大数字的索引的操作符。
在信号检测阶段中,针对DL 检测器,设计了一种定制化的两段训练策略。 在第一段,当验证集损失在连续6 次训练周期中都没有得到降低时,停止模型训练,以防止模型过拟合。 第二段用观察到的指标来权衡特性,即验证损失和精度均保持稳定,而不同信噪比下的虚警概率(Pf)和检测概率(Pd)则随训练次数的变化而变化。 因此,设计了一个Pf停止时间间隔,首先从第一段的最佳模型继续,当Pf落入最佳模型时停止训练。 DL 方法的一个缺点是缺乏精确的性能控制,采用两段训练策略,通过调整预设的停止时间间隔可以在一定程度上控制检测性能。 利用区间大小参数实现控制精度与训练时间的平衡。
本文认为,把人工智能的技术水平分为四个等级,比三个等级能更清楚地反映其可能导致的社会效应,因为中级和高级的差别是很大的。
而在调制识别阶段中,利用CBAMLSTM 和CBAMTCN 识别分类器激活该阶段。 在文献[19]的启发下,为进一步提取信号特征,首先将式(3)中In和Qn设置为一个像素点上的2 个通道中的值,然后换算出该采样点的幅度值和相位值Pn= arctan(In/Qn),同样设置为另一个像素点上2 个通道的值与In及Qn合并,使每个采样点变换为一个矩阵,组成大小为N×4 的Y2,用作识别分类器的输入,并进一步通过所采用的网络模型来识别信号。
CBAMLSTM 算法模型的网络结构如图2 所示。该CBAMLSTM 的网络基线模型是由4 个卷积层、2 个全连接层、2 个128 单元的LSTM 层和CBAM 层组成的网络。 其中CBAM 是由通道(Channel)注意力机制和空间(Spatial)注意力机制组成,是为了提高模型的表征能力,有效减少无效目标的干扰,提升对关注目标的检测识别效果,进而提高模型的整体性能。
图2 CBAMLSTM 的网络结构Fig.2 Network structure of CBAMLSTM
CBAMLSTM 算法模型的总体流程如下。 首先Y1作为检测器的输入,通过该基线模型网络的卷积层、LSTM 层、CBAM 层和全连接层等来判断信号存在(H1)和信号不存在(H0),当返回H1时Y2作为识别器的输入进一步通过该基线模型网络识别该信号的类型。 此外,识别信号的类型时,直接通过输出层返回结果,不需要进入判断层。 第一个全连接层表示一个64 类神经元,另一个全连接层表示在检测方案时Y1作为检测器的输入判断信号有无的2 类神经元和在调制识别方案时Y2作为识别器的输入的11类神经元。 2 个LSTM 层都返回完整的序列,激活函数ReLU 应用于卷积层。 最后的全连接层利用Softmax 函数来实现信号检测和调制识别分类。 每个隐藏层利用30%的下降来减少过拟合。 损失函数采用分类交叉熵,可表示为:
式中,yi以一次性编码的形式表示基本事实;表示预测;N为训练批次大小。 根据其计算效率,使用了学习率为0.001 的Adam 优化。
CBAMTCN 算法模型的网络结构如图3 所示。CBAMTCN 网络基线模型是由4 个卷积层、2 个全连接层、TCN 层和CBAM 层组成的网络。 该模型中使用的CBAM 网络结构与CBAMLSTM 算法模型中使用的CBAM 网络结构是一样的。
图3 CBAMTCN 的网络结构Fig.3 Network structure of CBAMTCN
CBAMTCN 算法模型的总体流程如下。 首先,Y1作为检测器的输入,通过该基线模型网络的卷积层、TCN 层、CBAM 层和全连接层等来判断信号存在(H1)和信号不存在(H0),当返回H1时Y2作为识别器的输入进一步通过该基线模型网络识别该信号的类型。 此外,识别信号的类型时,直接通过输出层返回结果,不需要进入判断层。 第一个全连接层表示一个64 类神经元,另一个全连接层表示在检测方案时Y1作为检测器的输入判断信号有无的2 类神经元和在调制识别方案时Y2作为识别分类器的输入的11 类神经元。 激活函数ReLU 应用于卷积层和TCN层。 最后的全连接层利用Softmax 函数来实现信号检测和调制识别分类。 每个隐藏层利用30%的下降来减少过拟合。 损失函数也采用分类交叉熵,与式(8)表示一样,同样使用了学习率为0.001 的Adam 优化器。
使用GNU Radio 生成的典型调制数据集RadioML2016.10a[24]用作基准数据集,用于训练和评估所提结构在信号检测和识别分类方面的性能。 该数据集中包含11 类调制信号,每类包含20 000 个信号样本,每个样本包括128 个I/Q 样本点,SNR=-20 ∶2 ∶18 dB 共20 个,总共220 000 个样本。 文中的数据集和源码地址为https:∥github. com/Win-LabYunnanUniversity/CBAMLSTM-and-CBAMTCN。
在信号检测阶段,判断信号的有无时,由于传统的ED 方法在低信噪比下的检测性能极其差,如信噪比为-20 dB 时,ED 发现不了信号,而基于DL 的检测方法拥有良好的检测性能。 因此将数据集在SNR=-18 ∶2 ∶18 dB 共209 000 个样本作为正样本,提取数据集中SNR=-20 dB 的样本作为噪声负样本,共418 000 个样本作为输入,使用3 ∶1 ∶1 的分割比例,分别是250 800 个样本用于训练、83 600 个样本验证和83 600 个样本测试。 参数如表2 所示。
表2 信号检测部分的数据集参数Tab.2 Dataset parameters of signal detection part
在调制信号识别分类阶段,将整个数据集RadioML2016.10a 中总共220 000 个样本划分成2 部分,70%共154 000 个样本用于训练,30%共66 000 个样本用于识别分类模型的测试。
信噪比和检测概率如图4 所示。 可以看出,在低信噪比下CBAMLSTM 模型和CBAMTCN 模型的检测性能相比于DNN[8],CNN[9],LSTM[11]和TCN[12]有所改善,提高了1%~10%,其中CBAMLSTM 模型的虚警概率(0. 16%)比DNN(1. 95%)低1.79%、比CNN(1.19%)低1.03%、比LSTM(1.46%) 低1.3%、比TCN(1.28%)低1.12%;CBAMTCN 模型的虚警概率(0.22%)比DNN(1.95%)低1.73%、比CNN(1.19%)低0.97%、比LSTM(1.46%)低1.24%、比TCN(1.28%)低1.06%。 此外,还可以看出,CBAMLSTM 和CBAMTCN 与ED[1]通过理论公式虚警概率Pf=Q((λ-Nσn2)/)计算出检测阈值λ,然后根据λ计算检测概率的检测性能趋势是一样的,都是随着信噪比的增大,检测概率相应地增大,进而验证了该方法的合理性。在样本数量N都为128 时,其方法在低信噪比的检测性能都比传统的ED 方法更好,而在高信噪比下的检测性能没能达到1,是由于数据集的限制,其噪声样本是通过提取数据集中信噪比为-20 dB 的信号作为噪声负样本,不是以高斯白噪声作为噪声负样本造成的。
图4 信噪比和检测概率Fig.4 Signal-to-noise ratio and detection probability
不同模型的识别精度如图5 所示。 图5(a)所示,是多分类实现信号识别的结果,可以看出在高信噪比下所采用的CBAMLSTM 模型和CBAMTCN 模型相比于不加CBAM 的TCN[12],CNN[13]和LSTM[20]基线模型的识别准确度提高5% ~ 9%,分别有着92.1%和92.7%的显著识别准确度。 图5(b)显示了CBAMLSTM 模型和CBAMTCN 模型与其他3 种模型在所有信噪比下的平均识别准确率。 可以看出CBAMLSTM 和CBAMTCN 分别比CNN 平均识别准确率高出0. 068 和0. 076,比TCN 平均识别准确率高出0.034 和0.042,比LSTM 的平均识别准确率分高出0.041 和0.048。
图5 不同模型的识别精度Fig.5 Recognition accuracy of different models
由图4 和图5 可以看出, 在低信噪比下CBAMLSTM 和CBAMTCN 的检测性能相差不大,但CBAMLSTM 的虚警概率(0.16%)比CBAMTCN 的虚警概率(0.22%) 低 0.06%; 在高信噪比下CBAMLSTM 的识别准确率(92.1%)比CBAMTCN的识别准确率(92.7%)低0.06%,CBAMLSTM 的平均识别准确率(0.619 22)比CBAMTCN 的平均识别准确率(0.626 47)低0.007 25。
为了进一步分析CBAMLSTM 模型CBAMTCN模型识别分类的性能,图6 呈现了CBAMLSTM 模型和CBAMTCN 模型与其他3 种网络模型的混淆矩阵图。 关于图中描绘的混淆图,行对应于真实的调制,而列对应于预测的调制。 对角线单元格对应于正确分类的观察值,非对角线单元对应于错误分类的观察值。 因此, 由图的对角线单元格可以看出,CBAMLSTM 模型和CBAMTCN 模型对每类信号的识别精度都比其他3 种网络模型的高。
由图6 也可以看出,除了矩阵中清晰的对角线之外,还有2 个主要差异:一是WBFM 被误分类为AM-DSB;二是QAM16 被误分类为QAM64。 这种差异可能是因为它们信号特征的相似性使得这种区分容易受到信号中小噪声的影响。 因此可以预想,调制识别的未来发展应该集中减少这2 方面的差异。
图6 不同模型的混淆矩阵Fig.6 Confusion matrix of different models
考虑到无线频谱监测系统中可以将信号检测和识别结合起来用于获取无线电监管知识,提出了分别将CBAM 与LSTM 网络和TCN 结合起来通过二分类实现信号检测,以及基于多分类实现信号识别的级联方法。 结果表明,二分类模型在低信噪比下的检测性能有所改善;多分类模型相比于不加CBAM 的LSTM,TCN 和CNN 基线模型,实现了在高信噪比下的高效识别,同时这一DL 算法是利用调制信号的底层结构信息,无需人工提取特征,可以快速适应未知信号。 下一步将研究不同网络模型在真实场景中的实践。