刘亚冲,唐智灵
(桂林电子科技大学 广西无线宽带通信与信号处理重点实验室,广西 桂林 541004)
由于制造工艺存在随机性,即使是同一批次生产的不同辐射源电路之间具有细微的个体差异,反映在无线电信号上表现为辐射源的“指纹”特征。这种个体特征为通信辐射源个体的识别提供了可能性。研究通信辐射源个体识别方法在无线通信安全认证、无线电监测、电磁环境感知、信息作战等领域具有应用价值[1-4]。
通信辐射源特征识别的研究方向有:在理论上探索特征机理,为特征提取提供可靠依据;在技术上设计特征提取和相对应的分类器,作为特征识别系统的核心。目前,在理论和技术上仍然存在很多难点。已经提出的辐射源个体特征大致可分为时域[5-7]、频域[5,7]、其他变换域[8-9]3类,每一类特征又可包含多维特征,从而形成一个特征向量。但是由这3类特征组成的特征向量往往具有较大的特征维数,这对算法的效率带来了较大挑战。针对上述问题,虽然通过神经网络分类[10]、双谱特征分析[11]、支持向量机(Support Vector Machine,SVM)[12]等方法解决,但还存在着明显的不足:随着训练样本数量的增加,神经网络和SVM的分类效率降低,时间加长。随着测试样本数的增加,识别率会有较大下降,识别效果差。
本文设计一种循环谱和Softmax回归相结合的多分类识别器,在测试样本数远大于训练样本数的条件下,对辐射源信号进行有效分类识别,并通过联合主成分分析(Principal Component Analysis,PCA)降维算法提高识别效率。
Softmax回归模型是logistic回归模型在多分类问题上的推广,主要用于解决多分类的问题,即分类识别的输出结果y可以取2个以上的值。Softmax基本原理:在多分类的问题中,类标签y有k个不同的值。那么对于训练集{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(m))},有y(i)∈{1,2,…,k}。对于给定的测试输入x,Softmax函数针对每一个类别J估算出概率值p(y=j|x),即估计x的每一种分类结果出现的概率。函数hθ(x)形式如下:
(1)
(2)
Softmax函数将k个可能的类别进行了累加,即在Softmax回归中将x分类为类别J的概率为:
(3)
其中,最大概率所对应的类别即是x的分类类别。
在实际应用中,通常在上诉代价函数中加入权重衰减以解决Softmax回归的参数冗余导致的数值问题,则式(2)变为:
(4)
利用梯度下降法求解函数中的θ,对式(4)求导后,可以得到梯度公式为:
p(y(i)=j|x(i);θ))]+λθj
(5)
循环谱是循环平稳分析的常用手段,它的定义域从频率扩展到了谱频率与循环频率的二维平面,利用循环谱的差异可以对参数不同的信号进行分辨和识别。而且由于平稳噪声不具有循环平稳特性,因此循环谱分析可以在很大程度上将信号与噪声区分开,在信号分析中具有很大的优越性[13]。本文采用循环谱手段,通过分析信号中的循环谱特征差异性,从而达到辐射源个体识别的目的。
假设随机信号为x(t),那么,其自相关函数为[13]:
Rx(t+τ/2,t-τ/2)=E{x(t+τ/2)x*(t-τ/2)}
(6)
如果在时间域Rx(t,τ)是周期为T0的周期函数,满足下式:
Rx(t+τ/2,t-τ/2)=Rx(t+nT0+τ/2,t+nT0-τ/2)
(7)
则称信号x(t)具有二阶周期平稳特性,并且Rx(t,τ)的Fourier的展开式为:
(8)
(9)
(10)
通信信号通常都是调制信号,在调制过程中经常会将某些周期性引入到调制信号中,从而使调制信号具有循环平稳特性。其循环谱不仅在α≠0出存在非零向量,而且在某些特定的循环平率上呈现峰值,所以,通过观测在循环平率α≠0上的谱峰值的差异可以区分参数不同的通信信号,从而达到识别通信辐射源个体特征的目的。
循环谱特征的提取步骤如下:
1)对信号x(t)以采样周期Ts均匀采样N个样本,得到长度Δt=NTS的离散序列x(n)。
2)对x(n)作离散傅里叶变换得到:xΔt(f)|f=kFs=TsXΔt(k)。
如果简单地将循环谱密度函数作为辐射源特征识别分类器的训练样本,往往会面临样本维数较高的问题[14]。分类器计算高维数的数据,必然会降低分类识别的效率。因此,需要提取信号的循环谱密度函数作为初始高维特征,然后采用主成分分析法对其进行降维处理。主成分分析是模式识别等领域最为成熟的算法,做为一种线性映射方法引入到分类识别器的构建中来,可实现信号的重构,并最大限度地保留原信号的重要信息。
PCA的基本思想是将数量较多的具有一定相关性的变量变重新组合成一组数量较少的互不相关的变量。通常是将原始变量进行线性加权组合成若干个不相关的综合变量,从而能够最大限度的保留原有的数据结构分布,并从中选取最能代表原始数据的几个成分进行分析,实现对特征空间降维的目的,提升运算效率[15]。
分类器的设计是调制信号自动识别技术的重点之一。如何设计出高效率,高识别率的分类器对其相当重要。常见的分类器,如BP神经网络、径向基神经网络,属于二分类分类器。如果想要对多个类别进行分类,需要增加隐含层的数量,这将大大增加算法的复杂度。同时由于其输出类别并不互斥,因此对大量相近的样本分类效果较差。
针对多分类问题,本文构建了循环谱计算与Softmax级联的多分类识别器,其结构如图1所示。
图1 循环谱计算与Softmax级联的多分类识别器结构
在图1中,xI是通过循环谱特征提取得到的高维特征向量,XN是经过PCA降维后的最终特征向量,同时作为神经网络的样本输入,wjN是多分类识别器通过样本训练后得到的对辐射源信号分类的网络权值,yJ是经过循环谱与Softmax多分类识别器后得到的已识别信号。识别器对通信辐射源个体特征识别的步骤为:
1)采用循环谱算法对采集的样本信号进行循环谱密度特征提取,形成特征样本集。
2)对得到的特征样本集进行PCA降维。
3)使用降维后的特征样本集对Softmax多分类识别器进行训练,得到分类识别模型。
4)对待识别的信号经过第1)步的特征提取,再经过第2)步的PCA降维,最后使用第3)步训练好的分类识别模型进行特征识别。
实验采集5部移动电话的辐射信号,每个辐射源采集400个样本,共2 000个样本。从每个辐射源的样本中随机选取100个样本组成训练集,剩下的样本组成测试集。
首先对每份样本计算其循环谱密度,得到初始的2 150维特征向量。其中两部移动电话信号样本的循环谱密度如图2所示。因为特征向量维数过多,所以只展示其中3部手机的第19维、20维特征,如图3所示。由三维图、等高图可以看出,即使是两部工作在相同条件下的手机,它们的循环谱在不同的循环频率处达到峰值;由特征样本分布图可以看出,两部手机的循环谱密度函数存在一些细微的特征差异。通过分辨这些差异就能达到区分不同辐射源的目的。然后,对初始高维体征进行PCA降维处理,得到的特征值用百分比形式表示如图4所示。由图4可见,越靠前的主成份包含的信息量越大。为了充分保留辐射源特征信息,本文选取包含了99%信息量的前899维主成分作为神经网络的输入特征集。
图2 2部手机样本的循环谱密度函数对比
图3 3部手机信号的指纹特征样本分布
图4 降维特征
最后,对降维获得的特征向量,使用本文提出的多分类通信辐射源个体分类识别器进行训练和识别。为了评估新识别器的性能,实现了2种分类识别器对本文的辐射源样本进行识别:分别为基于BP神经网络的辐射源识别器,基于Softmax回归的辐射源多分类识别器,后者直接对未降维的循环谱密度特征进行训练和识别。对3种方法得到的识别率和识别时间进行了对比,结果如表1所示。从表1可以看出,采用循环谱结合BP神经网络的方法在测试样本大于训练样本的情况下,识别率会大幅度下降,并且识别率速度慢。本文构建的多分类识别器具有与基于Softmax回归的辐射源多分类识别器的方法相近的识别率,且不会因为测试样本数的增加而产生较大变化。同时识别时间明显缩短,以及识别效率有一定的提高。
表1 各方法性能对比
本文提出一种基于循环谱密度特征的通信辐射源个体识别方法。通过引入Softmax回归模型实现多分类识别,弥补传统方法在样本数大的情况下识别率效果差、识别效率低的不足。在此基础上,采用PCA算法对特征向量进行降维,进一步缩短识别的时间。实验结果表明,在大量测试样本数的情况下,经过降维改进后的识别器仍然能保持较高的识别率,比传统神经网络识别器及高维Softmax回归的多分类识别器的性能有一定改善。
[1] OROSCO E,DIEZ P,LACIAR E,et al.On the Use of High-order Cumulant and Bispectrum for Muscular-activity Detection[J].Biomedical Signal Processing and Control,2015,18:325-333.
[2] 肖乐群,张玉灵,赵拥军.基于对角积分双谱的雷达辐射源信号识别[J].信息工程大学学报,2012,13(1):95-99.
[3] OLIVEIRAM D,BITMEAD R R.High-fidelity Modulation Parameter Estimation of Non-cooperative Transmitters:Baud-period and Timing[J].Digital Signal Processing,2011,21(5):625-631.
[4] 陈 红,蔡晓霞,徐 云,等.基于多重分形特征的通信调制方式识别研究[J].电子与信息学报,2016,38(4):863-869.
[5] 唐 哲,雷迎科,蔡晓霞.通信辐射源的潜在细微特征提取方法[J].电波科学学报,2016,31(5):883-890.
[6] KAWALEC A,PIENIEZNY A.Radar Pulse Trains Classification[C]//Proceedings of Microwaves,Radar and Remote Sensing Symposium.Washington D.C.,USA:IEEE Press,2008:166-169.
[7] 王宏伟,赵国庆,王玉军.基于脉冲包络前沿高阶矩特征的辐射源个体识别[J].现代雷达,2010,32(10):42-45,49.
[8] 徐书华,黄本雄,徐丽娜.基于SIB/PCA的通信辐射源个体识别[J].华中科技大学学报(自然科学版),2008,36(7):14-17.
[9] ZHANG Jingwen,WANG Fanggang,DOBRE O A,et al.Specific Emitter Identification via Hilbert-huang Transform in Single-hop and Relaying Scenarios[J].IEEE Transactions on Information Forensics & Security,2016,11(6):1192-1205.
[10] 陈 娟.雷达辐射源特征提取与个体识别[D].西安:西安电子科技大学,2013.
[11] TANG Li,JIANG Ting.Target Identification Based on Diagonal Slice of The Complex Bispectrum[C]//Proceedings of IEEE International Conference on Communication Problem-solving.Washington D.C.,USA:IEEE Press,2015:303-306.
[12] SHOTTON J,SHARP T.Real-time Human Pose Recognition in Parts from Single Depth Images[J].Communications of the Association for Computing Machinery,2013,56(1):116-124.
[13] 李世平,陈方超,王 隆,等.多径信道下基于循环谱特征的调制识别算法[J].计算机应用,2012,32(8):2123-2127.
[14] 陈志伟,徐志军,王金明,等.一种基于循环谱切片的通信辐射源识别方法[J].数据采集与处理,2013,28(3):284-288.
[15] HAO Zengcao,SINGH V P.Drought Characterization from a Multivariate Perspective:A Review[J].Journal of Hydrology,2015,527:668-678.