幸晨杰,王良刚
(中国西南电子技术研究所,成都 610036)
电台个体识别是现代电子战和民用通信管控的重要环节,通过信号处理技术对所截获的通信电台信号进行处理分析,提取所获取信号个体的属性特征,快速将每个信号对应到相应的电台[1-7]。该技术有助于准确获得电台个体的属性信息,定位和跟踪敌方的电台位置,进而分析通信组网构成,推测敌军的未来操作。
电台个体识别任务的传统研究方法可分为两个方向,一种是使用电台个体信号的暂态特征[8-9],另一种是使用电台个体信号的稳态特征[10-13]。暂态特征是指信号的瞬时幅度、相位、频率、功率等参数呈现的分布特性,以及在辐射源设备开关机瞬间或工作模式转换的瞬间,因受工作环境、温度、噪声等因素的影响而产生的非线性特性;稳态特征一般是提取数据部分进行分析,数据部分由前导序列、中间码和有效负载联合组成[14]。例如,文献[15-20]都运用了双谱法提取信号稳态特征及其变换形式,或在此基础上再结合信号其他特征,取得了较好的电台识别效果;文献[21]和文献[22]运用了分形法提取电台暂态特征,取得了较好的识别效果。随着流形学习理论的深入研究,雷迎科等人[23]提出首先对信号样本进行双谱变换,然后利用正交局部样条判别嵌入方法深入提取辐射源的指纹特征,有效解决了辐射源个体特征缺乏鲁棒性的问题。
上述传统研究方法往往需要进行特征工程,存在依赖领域专业知识的问题。另外,传统特征还存在对信噪比要求较高和难以用单一模型描述多种特征、识别算法难以统一的问题。
现代电子通信装备制造精度的提高,使得同型号、同批次电台的个体特征越来越相似。同时,信道干扰多、通信质量较差的复杂电磁环境中,接收的电台通信信号质量难以保证。在此情况下,传统方法提取的特征因此将难以区分极其相似的同类电台个体。
现代通信装备种类、信号制式越来越多,技术细节越来越复杂,往往难以靠专家人力穷尽所需识别的个体信号体制和有效的指纹特征提取方法,因此需要研究一种方法,在电台个体识别中降低对专业知识的依赖,实现更高鲁棒性的电台个体识别。
本文提出一种基于深度神经网络的智能个体识别方法,直接将电台个体时序信号输入深度网络,提取特征并开展分类,能降低特征提取的难度。本文设计的一维多子网络模型,能减轻深度网络模型调参优化耗时费力的问题,提升模型的深度特征表达能力,能较单一结构网络提高电台个体分类精度与泛化能力。
本文提出的基于深度神经网络的智能个体识别方法的总体流程包括电台个体数据预处理、划分样本集、模型构建、模型训练、分类效果评估五大步骤,如图1所示。
图1 基于深度神经网络的智能个体识别方法的具体流程
电台个体信号原始数据以脉冲采样形式存储,为符合网络输入层结构,所有样本都以1 024点长度存储,超出部分采样点删除,不足部分补零。
将预处理后的电台个体数据和对应的类别标签组成样本对,随机从中选取80%的样本数据组成训练集,将剩下的样本等比例随机抽取,组成验证集和测试集。
在生成样本集时,考虑各个电台样本数量有差异的情况。对样本数量差异悬殊的情况,采用样本复制或者样本删除的方式,实现样本数量平衡,以免模型训练时样本数量悬殊,导致模型拟合误差大。
卷积神经网络(Convolutional Neural Network,CNN)由于共享权重所带来的平移不变性,可以高效地用于数据的特征提取。把信号时域数据看作一维特征向量,便可用一维卷积计算提取信号的个体特征。
一维离散卷积定义如下:
(1)
式中:x是输入的特征向量,w是卷积核。使用公式(1)定义的一维离散卷积计算每一层的特征向量。
值得强调的是,与二维CNN不同,在深度一维卷积神经网络中,应用一维CNN层进行特征提取,无需对输入数据做任何预先增强或特征转换。将特征化领域从二维简化为一维后,模型参数更少,与其他应用二维深度神经网络的个体识别模型相比,本方法具有量级更轻的优势。同时,本方法无需进行一维信号特征化等有人参与的特征提取过程,不但降低了整体的计算量和算法复杂度,而且减少了整个网络的参数量。
图2给出了本方法的结构示意图,针对一维信号的本质特征,本文设计了基于深度一维卷积网络的电台信号特征提取与分类识别网络。依靠所设计的金字塔式网络结构,模型可以更为深入地从信号提取电台的多层次个体特征,使特征提取更有效。
图2 电台信号特征提取一维卷积神经网络流程示意图
1.4.1 搭建一个包含3个子网络的一维多子网络深度集成模型
为了提取一维信号中的个体特征,参考深度神经网络在计算机视觉领域的成功经验,本文提出的集成模型及其子网络被设计为含有多层卷积网络的结构。为了在多次卷积中适当减少模型参数量以提高模型训练和运行效率,并在模型中保留信号主要特征,防止训练时过拟合,本文在卷积层中穿插加入了池化层。在多层卷积结构提取信号中包含的个体深度特征后,本文使用全连接层和Softmax分类器,将特征映射到电台类别中,实现电台的个体识别。
该多子网络深度集成模型包含3个不同结构的子网络,其结构互相关联,其中子网络B是从子网络A中删去少量卷积层后形成,子网络C是从子网络B中删去少量卷积层后形成。这样设计的目的是采用多种不同深度的子网络分别从输入信号序列中提取深度不同的个体特征,并使用不同深度的特征产生子网络分类置信度,使得集成模型能提取的特征和计算的分类置信度多样化,提高集成模型的适应性,尽量避免过拟合。
子网络A结构如图3所示,共包含1个输入层、10个卷积层、4个池化层、2个全连接层、2个批归一化层、1个分类器层和1个输出层。
图3 子网络A结构
子网络B结构如图4所示,共包含1个输入层、8个卷积层、3个池化层、2个全连接层、2个批归一化层、1个分类器层和1个输出层。
图4 子网络B结构
子网络C结构如图5所示,共包含1个输入层、6个卷积层、2个池化层、2个全连接层、2个批归一化层、1个分类器层和1个输出层。
图5 子网络C结构
1.4.2 设置三个子网络的网络参数和集成方式
上述子网络中,输入层神经元个数为电台个体数据长度1 024,卷积层的卷积核个数为括号内的第一个数,卷积核大小为括号内第二个数,激活函数均使用线性整流函数(Rectified Linear Unit,ReLU),全连接层的神经元个数为括号内数字;所有池化层均使用最大池化,大小为2;分类器层使用多分类函数Softmax。
在集成三个子网络的分类置信度并形成集成网络的分类置信度时,采用直接平均法,即直接平均三个子网络模型对输入信号产生的类别置信度,得到集成网络对该输入信号的类别置信度,并据此得到分类结果。
1.4.3 设置三个子网络的损失函数、优化算法和训练迭代次数
子网络损失函数均使用交叉熵损失函数,如公式(2):
(2)
式中:M表示电台个体类别数量,yc∈{0,1}表示电台个体数据实际类别标签的独热编码(one-hot)形式,pc∈{0,1}表示网络对训练样本的预测标签向量。
子网络优化算法均使用基于自适应矩估计的优化算法(Adaptive Moment Estimation,Adam)。
子网络的训练步长即训练样本集每批次送入子网络的数量设置为512,迭代次数设置为50。
首先,将训练样本随机输入一维多子网络深度集成模型,进行训练预测。然后,反向传播误差损失,并通过优化函数计算模型参数改正量,直到达到所设置的训练迭代次数,或直到使用验证样本验证模型的损失函数波动小于预设值。完成多子网络深度集成模型的训练过程后,保存最优的网络权重参数。
首先,将一条测试样本输入模型,对三个子模型的每一类识别置信度求平均,得到预测的Softmax分类结果,如公式(3)所示:
(3)
式中:p1、p2、p3、pc分别表示子网络A、B、C对一个测试样本数据在各个类别的分类置信度向量和平均的分类置信度向量。
将平均置信度向量最大值对应的类别作为识别出的电台个体类别。
然后,将测试集样本的分类结果和真实的类别标签进行比较,计算总体分类精度(Overall Accuracy,OA)、平均分类精度(Average Accuracy,AA)和Kappa系数,以评估算法有效性。
总体分类精度指被正确分类的电台个体个数与总的电台个体个数的比值,如公式(4)所示:
(4)
式中:TPi代表准确识别为第i个电台的样本个数,FNi代表第i个电台的样本中没有准确识别出的个数,M代表样本集中所有电台个数。
平均分类精度是各类电台分类精度的平均值,如公式(5)所示:
(5)
Kappa系数代表分类与完全随机分类相比,错误减少的比例,如公式(6)~(7)所示:
(6)
(7)
式中:FPi代表本不属于第i个电台但被识别为第i个电台的样本信号条数,N代表所有测试样本条数。
为验证本文所提模型的可行性和准确性,选用实采电台数据开展了仿真实验。参与实验的电台个体有10部,信号数据为两组原始采样的基带脉冲信号,调制方式分别为8PSK和MSK,长度为短脉冲500采样点左右,长脉冲1 000采样点左右,两组数据的带内信噪比均为12 dB,其中第一组数据的各类样本个数如表 1所示,第二组数据的样本数量规模与之相当。
表1 电台个体样本统计
仿真实验的硬件平台为惠普服务器Z840,使用Intel至强处理器,两块NVIDIA GTX1080显卡,各8 GB显存。
仿真实验环境的操作系统为Ubuntu16.04LTS,算法实现依赖的软件工具包括TensorFlow1.6.0、Keras2.2.0、CUDA9.0+cudnn7、python3.6。
仿真实验使用数据如2.1节所示,步骤按照第1节所述开展。
2.3.1 OA、AA和Kappa系数
为了验证本方法的效果,利用总体分类精度、平均分类精度和Kappa系数三个评价指标对本方法所涉及的各个子网络与深度集成模型在第一组数据集(8PSK调制的电台信号)的分类结果进行评估,将得到的所有计算结果列入表2中。
表2 本方法分类结果评估
分别使用子网络A、B、C单独对10类电台信号进行特征提取与识别,其总体分类精度、平均分类精度、Kappa系数如表2前三行所示。总体分类精度、平均分类精度和Kappa系数最高的为子网络B,说明子网络B的性能优于子网络A和子网络C。
再通过集成网络综合上述子网络的分类结果,对10类电台信号进行特征提取与识别,总体分类精度91.83%,平均分类精度为89.12%,Kappa系数为0.901 5,如表2第四行所示。
集成网络的三个评判标准比所有子网络都高,说明集成网络性能超过了子网络A、B、C中任何一个网络单独的性能,通过网络集成实现了电台个体识别性能的提升。
2.3.2 混淆矩阵
混淆矩阵也称误差矩阵,是表示精度评价的一种标准格式。图6为子网络A、B、C及集成网络分类结果的混淆矩阵,其中横轴都代表测试样本所分类结果,纵轴都代表测试样本的真实类别,每一个单元格的数值都代表纵轴真实类别预测到横轴类别的统计频率值。
(a)子网络A的识别混淆矩阵
(b)子网络B的识别混淆矩阵
(c)子网络C的识别混淆矩阵
(d)集成网络的识别混淆矩阵图6 子网络A、B、C以及集成网络对8PSK调制电台信号分类结果的混淆矩阵
从混淆矩阵的数值主要集中在主对角线上可以看出,各个电台个体分类总体情况较好,每种网络只有少数的错分情况。结合上述分类精度、Kappa系数的统计可以表明,本方法在信噪比12 dB的8PSK调制信号条件下,可以实现10类通信电台个体的细微特征提取和个体分类识别,总体和平均分类精度都达到约90%的同时,大多数类别的识别正确率能超过85%,一半类别的识别正确率能超过95%。
2.3.3 不同调制方式对分类结果的影响验证
为了验证本文提出的集成模型对信号调制方式的适应性,第二组数据集(MSK调制方式的电台信号)还被用于输入集成模型并开展分类。平均分类精度为89.1%,形成的混淆矩阵如图7所示。
图7 集成模型对MSK调制电台信号分类结果的混淆矩阵
从平均分类精度和混淆矩阵可以看出,该集成模型对MSK调制的电台个体数据仍然可以开展分类。除电台4有较明显的错分以外,其余电台的分类精度与8PSK调制的数据在该模型上的分类精度总体相当,甚至分类准确度100%的个体(共5个)占到总个体量的一半,说明改变调制方式有可能影响分类精度,但影响不大。
对比两组实验数据在本文提出的集成模型上的分类效果可以看出,该集成模型对8PSK和MSK调制的电台个体数据都有较好的适应性。以上的仿真实验可以说明,本方法通过深度神经网络采用一维卷积直接对电台个体原始数据进行特征提取与识别,拥有较高的识别准确率。相比单一深度神经网络模型,本文方法通过集成多个深度神经网络,提高了电台个体识别的准确性。
本文基于一维卷积神经网络结构提出了一种一维多子网络深度集成模型,将待识别的电台原始信号作为输入,使用网络进行端到端学习,提取电台信号中的个体特征并进行电台个体分类识别,获得了较高的分类精度。
本方法由于直接从时序采样数据提取特征,免去了提取电台个体传统特征的步骤,同时避免了依赖专家知识的特征设计或选择工作,能降低数据处理的难度,提高电台个体识别系统的适应性,有望解决传统特征难以区分相似度极高的电台个体的问题。
本方法通过设计并集成多个子网络模型,凭借有规律可循的子网络模型设计,能降低设计深度网络模型时优化调参的难度,节省算法研发时间与实验计算资源。同时,将多子网络集成在一起,能克服单一结构神经网络模型提取特征不全面、分类精度不足的问题,有望降低单一模型的过拟合风险,有望提高电台个体识别算法的泛化能力与鲁棒性。
在本方法的基础上,下一步还将研究使用多任务模型满足实际应用场景“检测加识别”的需要,研究适应更广泛电台个体类型的识别模型和方法;还将针对电台个体数据难以获取、样本数不均衡等不利条件开展研究,进一步巩固研究成果,为军民用信号智能处理提供新方案。