黄 欣,郭汉伟
(1.中国西南电子技术研究所,成都610036;2.北京科航军威科技有限公司,北京100044)
通信辐射源个体识别被用于战场电子侦察情报、态势感知精细化、无线网络非法入侵检测等领域。目前,在雷达辐射源个体识别中,利用功放无意调制的相空间特征[1]、脉冲上升与下降沿变化[2]、瞬态特征[3-4]、频率特性[5]等进行个体识别效果显著。其中,李楠等针对雷达辐射源识别提出分形、变精度粗糙集灰度识别法[6-7],对通信辐射源识别具有借鉴意义。针对通信辐射源因其信号连续、发射功率较小、发射内容不重复等特点,使通信辐射源个体识别呈现出信号微弱、瞬时特征不明显等特点,导致个体特征提取困难。目前,关于通信辐射源个体识别的方法,国内外主要有以下几类,各具特点。
(1)现代谱:采取双谱[8]和循环谱[9-10]方法。双谱巧妙选取积分路径,减少运算量,实际数据测试识别率90.3%(信噪比为15 dB),存在交叉项,引入较高虚警;循环谱在低信噪比效果好,仿真识别率90.8%(信噪比为0 dB),每次需要校准特征适量,校准矩阵对数据获取系统具有依赖性。
(2)瞬态特征:采取时频统计[11]方法。为诺·格公司技术专利,采用时频图中方向梯度直方图算子作为特征向量,对开关信号进行模板匹配。识别结果涉密,无公开报导。
(3)频率特性:采取载波短时稳定度[5]与信息维特征分型提取方法,仿真信噪比为10 dB,识别率87%,实际测试为85.3%。对同一型号、同一批次的电台识别能力有限。
本文以高斯频移键控(Gaussian Frequency-Shift Keying,GFSK)为例讨论通信辐射源稳健特征与模板构建,同时提出特征提取和模板匹配准则。利用通信信号的长时谱统计特性,即大/平均统计谱,提取模板匹配后的包络特征参数,采用峰值与包络特征构建个体特征矢量。利用朴素贝叶斯分类算法与个体特征矢量结合进行通信辐射源个体识别,同时对训练样本长度进行仿真确认。在分析仿真基础上,使用安捷伦示波器和频谱仪构建通信辐射源个体识别算法验证系统,开展了对同一厂家、同批次、同型号20 个GFSK 调制的无线通信模块识别实验验证本文算法。文中方法较易实现,是一种稳健而有效的辐射源个体自动识别方法。
从目标识别的角度讲,理想的通信辐射源个体特征应满足以下条件[1]:
(1)唯一性,即个体特征是与众不同的;
(2)独立性,即个体特征与传递信息本身无关,当发射信号波形改变时,该特征不变;
(3)稳定性,即个体特征本身稳定,不因温度、振动、空间和时间等环境因素的变化而发生显著变化;
(4)可测性,即特征是可以通过测量得到,并且测量精度能达到个体分类的要求。
辐射源个体信号的频谱特性容易测量,满足以上独立、稳定的特点,本文以通信辐射源的频域峰值特征和频谱包络构建个体识别空间,进行辐射源个体识别实验。通信信号频谱峰值与包络与调制方式直接相关,幅移键控(Amplitude Shift Keying,ASK)、频移键控(Frequency Shift Keying,FSK)调制方式的频谱具有峰值与包络特性,而如相移键控(Phase Shift Keying,PSK)调制信号本身频谱不具备峰值特征,但是二次信号或多次信号的频谱具备峰值与包络特征。为便于用大量的通信辐射源验证算法,以GFSK 为例进行推导通信辐射源个体识别特征的选择过程,GFSK 在短距离数传模块中应用较多,成本低,便于大批量采购用于验证本文算法。
GFSK 调制是把输入数据经高斯低通滤波器预调制滤波后,再进行FSK 调制的数字调制方式。它在保持恒定幅度的同时,能够通过改变高斯低通滤波器的3 dB带宽对已调信号的频谱进行控制,具有恒幅包络、功率谱集中、频谱较窄等无线通信系统所希望的特性。GFSK 调制解调技术被广泛应用在移动通信、航空与航海通信等诸多领域中。
如图1所示,GFSK 的调制过程如下,输入信号x(t)是随机二进制信号形成双极性方波,经过冲激响应h(t)的高斯滤波器后进行积分,形成I/Q 调制相位。输入二进制数字基带脉冲序列p(t),经过高斯滤波器g(t)后,进入调频系统h(t),输出GFSK 波形y(t)。
图1 GFSK 调制信号模型Fig.1 Signal model of GFSK modulation
GFSK 辐射源的功率谱有连续谱包络特征和离散谱峰值两种特征。个体包络形状与GFSK 调制器输出包络、变频器频率响应、射频放大器和前置滤波器包络有关,包络形状与个体辐射源的模板匹配程度是辐射源个体识别的依据之一。离散峰值个数、位置和多峰之间间距与调制阶数、调制度和时钟模块稳定度、系统杂散特性有关。
如图2和图3所示,单次观测的谱包络信噪比较低,引入最大值方法和均值方法提取包络。
图2 窄带GFSK 功率谱图Fig.2 Narrow-band GFSK power spectrum diagram
图3 宽带GFSK 功率谱图Fig.3 Broadband GFSK power spectrum diagram
最大值包络形成方法如下:
式中,N 为形成包络稳定的观测次数,满足
均值包络形成方法如下:
式中,N 为形成包络稳定的观测次数,满足
如图2和图3所示,单次观测的功率谱峰值特征不明显,经过多次观测累计(最大/均值)平均功率谱,峰值特征与包络明显显示出来。
设平均功率谱的序列为 ()p n ,n =0,1,…,N。借鉴图4雷达恒虚警检测算法,进行峰值检测。选取2(m+m0)+1 个单元,选取最大值Mmax,其中m0是保护单元。取2m 个测试单元均值M 和方差V;如果最大值在单元中心m 的位置,且 (Mmax-M)/V>K,则 p ( m)为频谱峰值点。滑动2 (m+m0)+1 长度单元,完成多峰值点的检测。如图5所示,提取GFSK 辐射源的多个峰值点。
通过MATLAB 程序生成GFSK 信号,awgn 函数加入白噪声,在不同信噪比下通过蒙特卡罗仿真,峰值计算算法的检测性能如图5所示。
图4 单元平均恒虚警峰值检测算法示意图Fig.4 Schematic diagram of unit Peak Detect Algorithm with average constant false-alarm
图5 峰值检测算法性能曲线Fig.5 Performance curve of Peak Detect Algorithm
通过仿真与测试发现:最大值法形成频谱包络样本的方差较小,可用于提取峰值,峰值特征样本一致性优于均值积累,因此采用最大值积累包络提取峰值;而均值法形成的频谱包络样本形状一致性较好,采用均值法形成频谱包络模板。
针对雷达脉冲包络,可进行基于Holder 系数的相关比较,以比较两个包络的相似性[2]。对时域通信辐射源信号而言,包络连续且与发送信息的内容紧密相关,因此对通信辐射源识别而言,比较时域信号包络相似性存在数据选择上的困难。幸运的是,通信信号在时域连续,在频域为带通信号,其频谱存在包络,可进行频谱包络的模板匹配。在模板匹配之前,对样本再进行小波去噪处理。
采用Holder 系数作为频谱包络模板匹配特征,存在以下不足:
(1)Holder 系数对噪声敏感;
(2)稳健性有待商榷。存在不同信噪比下,不同辐射源对P/Q 值取值不同情况,才能区分不同辐射源之间的Holder 系数。
为提高稳健性,引入不相似系数作为约束。以文献[12]中定义的不相似测度和相似测度作为频谱包络模板匹配特征参数。
不相似测度如下:
相似性测度:Pearson 相关系数
式中,xd=和yi分别是x 和y 序列的第i 个坐标,珋和分别为x 和y 序列的均值。通过不相似测度和相似测度两个特征来描述辐射源频谱包络与模板的相关性,两者组合可稳健地对频谱包络进行分类。
如果有m 个辐射源,那么由峰值特征矢量和包络特征参数共同构成通信辐射源的个体特征矢量V:
其中包括i 个频率峰值f,以及m 个辐射源个体的包络不相似系数r0和相似系数r1,特征空间的维度为i+2m。
经过试验统计GFSK 辐射源测试数据,通信辐射源的个体识别特征样本近似服从正态高斯分布。本文采用朴素的贝叶斯分类器[12],为保证概率密度函数的准确性,训练样本的数目要足够大,样本的数量随着特征空间维数l 增加呈现指数增长。如果一维空间需要N 个样本可以准确估计概率密度函数,在l 维空间,需要Nl 个训练样本,对于l 较大的情况,准确估计概率密度困难。通用的做法是假设每个特征值xj,j =1,2,…,l 是统计独立的,这种假设条件下,可以得到
为了估计l 个一维密度函数,用l·N 个样本来替代Nl个样本,这就可以得到准确的估计。朴素贝叶斯(Naive- Bayes)分类器将未知样本xj=[x1,x2,…,xl]T分类到
朴素贝叶斯分类器虽然违背了独立性假设,但具有很好的鲁棒性。朴素贝叶斯分类器训练数据长度lN 取决于特征空间维数l 和一维空间样本个数N。设置GFSK 峰值的特征样本概率密度函数符合高斯分布,通过MATLAB 程序生成具有l 个峰值GFSK 信号,其峰值呈现随机特性,但峰值方差分布满足概率分布。通过仿真实验,测试得到N 的取值范围。图6为在一维空间下朴素贝叶斯分类器的学习曲线。从图中可以看出,在一维特征空间下,样本长度N≥10 的情况下,分类概率误差不大于5%。因此,l 维特征空间用于训练的样本长度不小于10l。
图6 朴素贝叶斯分类器学习曲线Fig.6 Learning curve of Naive-Bayes classifier
如图7所示,由控制计算机、安捷伦E4440A 频谱仪、安捷伦DXOX9320A 示波器、可调衰减器、无线射频模块构成辐射源识别算法验证系统。控制计算机发送任意二进制文件经过无线实验模块,实验模块输出射频信号进入频谱仪,频谱仪观测信号频谱,选取最大值和平均谱模式提取峰值和包络。安捷伦DXOX9320A 示波器用于观测波形和数据实时采集记录。控制计算机通过网络控制示波器、频谱仪和射频模块协同工作。试验中,更换不同的无线射频模块,随机发送二级制文件,采集频谱和时域波形数据,通过计算机后处理的时域和频域数据,进行辐射源个体识别验证试验。
图7 通信辐射源个体识别算法验证系统Fig.7 Algorithm verification system of specific communication emitter identification
实验共测试20 个无线射频模块的频谱数据,该射频模块普遍用于物联网及短距无线传输应用中,成本较低,可在市场上大批量采购同型、同批次的无线模块。
利用本文算法,通过观测,最终确定43 个特征参量构建个体识别特征矢量V(公式(3)),每个无线射频模块采集200 次数据,每次信号采集持续2 s,形成200 条样本。20 个实验模块,共计4000 条样本;其中,2000 条样本用于形成模板,2000 条样本用于识别试验。图8和图9为频谱仪抓取的信号谱域峰值特征和包络特征。
图8 无线射频模块频域峰值Fig.8 Frequency-domain peak of wireless radio frequency module
图9 无线射频模块带内峰值与包络Fig.9 Bandwidth peak and envelope of wireless radio frequency module
在信噪比为5 dB 的情况下进行辐射源个体识别,20 个样本的具体识别结果如表1所示。
表1 辐射源个体识别实验统计Table 1 Experiment statistics of specify emitter identification
定义辐射源识别的技术指标如下:
(1)辐射源个体识别虚警概率:设某辐射源识别后的结果总数为M,其中m 个为其他辐射源样本,该辐射源个体识别虚警概率为m/M;
(2)某辐射源的识别率:识别结果中正确样本个数与属于该源的参试样本数量之比;
(3)整体识别概率:所有参与测试的辐射源识别正确的样本数/参与测试样本总数。
本次实验中,所有参与测试辐射源20 个,参与测试样本数1996 个。
在信噪比为5 dB 的条件下,测试试验的整体识别率为93.7%,整体错误识别概率为6.3%,识别试验中各个辐射源的虚警率和识别率统计如表2所示。
表2 辐射源个体虚警概率和识别率Table 2 False-alarm & identification probability of specify emitter
其中,No.16 的识别概率最低,No.4 的虚警概率最大,观察No. 16 与No. 4 的不相似系数均值2.1,方差为2.216 1,不相似系数出现多个样本小于或接近1,导致20 个辐射源No.16个体被判为No.4;通过对样本进行统计后,样本数据生成的特征矢量与识别模板的不相似性系数小于1,相似系数大于0.9,该样本与识别模板同属于相同辐射源;样本数据生成的特征矢量与识别模板的不相似系数大于1,相似系数小于0.9 时,该样本与识别模板同属于不同辐射源;而个体间的峰值特征均值差越大,识别概率越高;各个特征系数的样本方差愈小,特征愈稳健。
利用通信辐射源信号为频域限带信号特点,本文推导了GFSK 调制通信辐射源的频谱特性,提出利用频谱峰值作为特征、频谱包络作为匹配模板,引入不相似系数与相似系数作为模板特征,进行通信辐射源个体识别。采用朴素的贝叶斯分类器,在信噪比为5 dB的情况下,对同一批次、同一型号的20个通用GFSK 无线数传射频模块进行个体识别,整体识别概率达到93.7%。需要说明的是,本次试验中识别的20 个GFSK 射频模块均为市场上可购买的商用模块,成本较低,一致性相对较差,因此试验的识别概率较高,但仍然可以说明基于频谱峰值与包络的通信辐射源个体识别算法的有效性。
该方法可扩展应用到ASK、FSK、PSK 调制方式的辐射源个体识别中。通信信号频谱峰值和包络与调制方式直接相关,ASK、FSK 调制方式的频谱具有峰值与包络特性,而如PSK 调制信号本身频谱不具备峰值特征,但是二次信号或多次信号的频谱具备峰值与包络特征。当辐射源处于运动状态或干扰环境时,需要对本文算法进行调整,以适应辐射源动态识别需求。本文算法扩展试验以及环境适应性修正将是后续的研究工作。
[1] 许丹,柳征,姜文利,等. 一种基于交叉关联积分的功放无意调制识别方法[J]. 国防科技大学学报,2008,30(3):116-121.XU Dan,LIU Zheng,JIANG Wenli,et al.An Unintentional Modulation Identification Method of Power Amplifier Based on Cross-correlation integral[J]. Journal of National University of Defense Technology,2008,30(3):116-121.(in Chinese)
[2] 王海华,沈晓峰.一种新的雷达辐射源信号脉内特征提取方法[J].系统工程与电子技术,2009,31(4):809-811.WANG Haihua,SHEN Xiaofeng.New Intra-pluse Feature Extration Approch of Emitter Signals[J].System Engineering and Electronics,2009,31(4):809-811.(in Chinese)
[3] 程吉祥,张葛祥,李志丹.基于时频原子方法的雷达辐射源个体识别[J]. 航天电子对抗,2011,2(1):54-57.CHENG Jixiang,ZHANG Gexiang,LI Zhidan. A Novel Specific Emitter Identification Method Based on time frequency Atom Approch[J]. Aerospace Electronic Countemeasures,2011,2(1):54-57.(in Chinese)
[4] D'Agostino S,Foglia G,Pistoia D.Specific Emitter Identification:Analysis on real radar signal data[C]//Proceedings of 2009 IEEE Radar Conference.Rome:IEEE,2009:242-245.
[5] 张曼,钟子发,王若冰. 通信电台个体识别技术研究[J].电子学报,2009,39(10):2125-2129.ZHANG Man,ZHONG Zifa,WANG Ruobing. Research On The Technologyb of Individual Communication Transmitter Identification[J].Acta Electronica Sinica,2009,39(10):2125-2129(in Chinese)
[6] 李楠,曲长文,平殿发.基于分形理论的辐射源识别算法[J].航天电子对抗,2010(2):62-64.LI Nan,QU Changwen,PING Dianfa.Study of Transmitter Individual Identification Based on Fractal Theory[J].Aerospace Electronic Countemeasures,2010(2):62-64.(in Chinese)
[7] 曲长文,李楠,苏峰,等.基于VPRSM 的辐射源灰色识别法[J].控制与决策,2011(5):753-756.QU Changwen,LI Nan,SU Feng,et al.Emotter Gray IdentificationBased On Variable Precision Rough Set Model[J].Control and Decision,2011(5):753-756.(in Chinese)
[8] 蔡忠伟,李建东. 基于双谱的通信辐射源个体识别[J].通信学报,2007,28(2):75-79.CAI Zhongwei,LI Jiandong.Study of Transmitter Individual Identification Based On Bispectra,[J]Journal on Communications,2007,28(2):75-79.(in Chinese)
[9] Sahmel P H. Eigenspace Approach to Specific Emitter Identication of Orthogonal Frequency Division Multiplexing Signals[D].Virginia,USA:Virginia Polytechnic Institute and State University,2011.
[10] Kyouwoong K,Spooner C M,Akbar I,et al. Specific Emitter Identification for Cognitive Radio with Application to IEEE 802.11[C]//Proceedings of 2008 IEEE Global Telecommunications Conference. New Orleans,LO:IEEE,2008:1-5.
[11] Owechko Y.Specific Emitter Identification Using Histogram of Oriented Gradient Features:US,20100061630[P].2010-11-03.
[12] Theodoridis S,Koutroumbas K.模式识别[M].3 版.李晶皎,王爱侠,译.北京:电子工业出版社,2006.Theodoridis S,Koutroumbas K. Pattern Recognition[M].3rd ed. Translated by LI Jingjiao,WANG Aixia.Beijing:Publishing House of Electronic Industry,2006.(in Chinese)