赵永宽,沈 雷,王希琳,张铭宏
(杭州电子科技大学通信工程学院,浙江 杭州 310018)
复合调制信号广泛应用于测控系统,因其同时具有模拟调制设备复杂度低和数字调制保密性强等特点,在卫星通信、测控、测距以及广播系统中的应用日益增长,在卫星通信中具有重要作用。目前,复合调制信号识别的相关研究主要基于局部信号特征和分类树的识别算法。文献[1]采用二叉树算法,基于瞬时频率特征实现对MPSK,MTONE-FM和AM-FM信号的识别,在较高信噪比下具有良好的性能,但在低信噪比下性能较差。文献[2]提取内调制信号的包络特征和谱线特征参数,通过决策树算法实现对MPSK-FM,FSK-FM和MPSK信号的识别。文献[3]通过提取内调制信号的时频特征参数,使用决策树算法实现对AM-FM,FM-FM,FSK-PM和MPSK-PM信号的识别。但是,文献[2-3]算法对内调制信号提取的准确性要求极高,在内调制信号提取不佳时,性能迅速下降。
决策树分类器实现简单,实时性好,但其分类性能易受阈值影响且存在误差累积现象。支持向量机(Support Vector Machine,SVM)算法可以从标记数据中稳定且快速地进行特征学习,通过提取一组数据的支持向量来实现分类,避免了决策树算法的缺点。在信号处理方面,文献[4]将SVM用于脑电信号的模式识别和参数提取。文献[5]使用SVM分类器实现了对雷达信号的分类,直接将信号时域特征作为训练依据,但抗噪声性能较差。文献[6]使用多个高阶累积量构造特征参数实现对MAPSK,MPSK和QAM信号的分类,性能优于传统分类器,但该算法依赖大量样本数据,在样本较少时性能不佳。
本文从全数字接收机的鉴相误差中提取复合信号的内调制信号,利用级联SVM分类器对内调制信号的功率谱和平方谱图形特征进行识别,从而实现FM复合信号的调制识别。
FM复合调制信号的产生,需要先对基带信息进行某种数字或模拟调制(内调制),再对调制后的信号进行FM调制(外调制),其生成模型如图1所示。
图1 FM二次调制模型
图1中,x(n)为调制前的基带信号,d(n)为内调制后的信号,s(n)为调制完成的FM复合调制信号。其一般表达式为:
(1)
式中,A为信号幅度,Ts为采样周期,Kf为调频系数,且Kf≪1,fc为载波频率,m(k)为内调制信号。对于2ASK信号,m(k)可以写为:
m(k)2ASK=e(k)cos(2πf1kTs)
(2)
式中,e(k)为单极性二进制脉冲序列,f1为副载波频率。
MTONE-FM信号内部调制方式表示为:
(3)
式中,fn为副载波频率。BPSK信号与QPSK信号均采用正交调制,其区别在于QPSK信号的两路基带信号不同,而BPSK的两路基带信号相同。
m(k)MPSK=a(k)cos(2πf1kTs+φ0)+b(k)sin(2πf1kTs+φ0)
(4)
式中,a(k),b(k)为两路双极性基带信号,φ0为初始相位。
对FM复合调制信号直接进行特征提取时,往往只显示FM信号的特征,无法体现内调制信息的差异,因此,需先对复合信号进行内调制信息提取。本文采用基于全数字接收机的FM盲解调算法来恢复内调制信号。其原理如图2所示。
图2 数字接收机原理
接收到的FM复合信号与数控振荡器的两路输出相乘,通过低通滤波器(Low Pass Filter,LPF)滤除和频分量,得到正交的两路信号SI(n)和SQ(n):
(5)
(6)
式中,Δf=fc-f0为信号载频与NCO初始频率的差值,θ(n)为数控振荡器(Numerical Control Oscillator,NCO)输出信号的初始相位。将得到的两路信号通过鉴相和环路滤波后反馈回NCO,NCO根据反馈结果调整输出直至环路达到稳定状态。
环路中的鉴相方程为:
(7)
二阶环路滤波器的输出:
τ(n)=C2φ(n)+λ(n)
(8)
式中,λ(n)=C1φ(n)+λ(n-1)。
设数控振荡器的输出相位为fN(n),则有:
fN(n)=fN(n-1)+τ(n)
(9)
φ(n)=2πKfm(n)Ts
(10)
由于Kf和Ts均为常数,因此鉴相后得到的φ(n)即为内调制信号m(n)。由鉴相误差得到的内调制信号的时域特征易受噪声影响,但其频域特征较为稳定。
SVM是机器学习的一种算法,普遍应用于模式识别。其基本原理是在分类时对输入数据进行非线性变换,将输入数据映射到高维特征空间,在高维空间中依据输入信息建立超平面,利用超平面完成对输入数据的分类。
理想情况下,分类面H1可以正确区分所有样本点,与法线垂直且符合最大间隔原则,如图3所示。实际情况中,总会存在偏离自身原本所在的区间的样本点,这样的样本点被称为离群点,如图4所示。
图3 最优分类超平面示意图
图4 离群点示意图
离群点会导致分类面的构造难度增大,甚至无法构造出能将样本准确分类的超平面。若在二维空间内构造不出这样的超平面,则需要通过核函数将二维数据映射到更高维度,在更高维度内寻找最优超平面。常用的核函数有多项式核函数和径向基核函数等。其中径向基函数能够实现非线性映射,且其参数较少,运算复杂度较低,因此本文采用径向基函数作为核函数。
径向基函数的数学表达式为:
(11)
支持向量机是为解决线性可分的二分类问题而提出的,通过使用核函数使其可以解决非线性分类问题。对于多分类问题,则需要使用一对多分类、一对一分类等方法来实现。
一对多支持向量机(One Against All SVMs,OAA-SVMs)是将多种数据中的一种与其它类别分开,对于M种数据,需要构造M个二分类SVM。一对一支持向量机(One Against One SVMs,OAO-SVMs)中,每个向量机只对两类数据进行分类,对于M种信号需要M(M-1)/2个支持向量机,但每个向量机要分类的数据少,运算速度快。本文只涉及四种信号的分类,因此采用一对一支持向量机的效率更高。
惩罚因子C和核函数参数γ是SVM分类器设计时的重要参数。惩罚因子在分类过程中表征了分类时对于离群点的重视程度。C值越大,在分类时越倾向于保留离群点的特征,分类会因此变的困难;C越小,则对离群点越不重视,分类越容易,但是会降低分类的准确性。γ是核函数的宽度参数,影响核函数的作用范围。γ过小会导致分布函数只作用于支持向量样本附近,降低分类器对未知样本的分类能力;γ过大则导致平滑效应过大,无法找出合适的分类面对样本进行分类,从而影响测试集的识别性能。
经过全数字接收机鉴相后得到4种单一调制信号:2ASK信号,多音调制信号,BPSK信号和QPSK信号。由式(2)得到2ASK信号的功率谱密度表达式为:
(12)
式中,Pe(f)为单极性基带信号功率谱。可知其功率谱在f=f1处存在单根谱线。
由式(3)得到多音调制信号的功率谱密度表达式为:
(13)
因此可知,其功率谱在f=fn处存在多根独立谱线。
MPSK信号的功率谱密度表达式与2ASK信号类似,但不同的是其基带码元为双极性码,通常表现为宽带信号。7 dB信噪比下,对副载波频率f1为40 kHz的2ASK-FM信号和MPSK-FM信号,及副载波频率fn分别为20 kHz,30 kHz,40 kHz,50 kHz,60 kHz的MT-FM信号进行解调,得到的内调制信号功率谱特征如图5所示。
图5 4种内调制信号的功率谱
对MPSK信号进行平方处理:
m2(n)=[a(n)cos(2πfcnTs+φ0)+b(n)sin(2πfcnTs+φ0)]2=a2(n)cos2(2πfcnTs+φ0)+
b2(n)sin2(2πfcnTs+φ0)+2a(n)b(n)cos(2πfcnTs+φ0)sin(2πfcnTs+φ0)
(14)
由于a(n),b(n)都是幅值为±1的双极性码,因此式(14)简化为:
m2(n)=1+a(n)b(n)sin(4πfcnTs+2φ0)
(15)
对于BPSK信号,a(n),b(n)为相同的双极性码,因此式(15)可以改写为:
(16)
因此,BPSK信号的平方谱在直流和2倍载频处存在峰值,而对于QPSK信号,a(n),b(n)并不相同,乘积在正负1之间跳变,其功率谱不包含2倍载频分量,仅在直流处存在峰值。相同条件下解调得到MPSK信号的平方谱如图6所示。
图6 解调得到的MPSK信号平方谱
由以上分析发现,4种信号在功率谱或平方谱图形上存在明显差别。因此将信号功率谱和平方谱整体图形特征作为SVM分类器训练的依据,实现对复合信号的调制识别。
使用级联支持向量机对FM复合信号进行调制识别的流程如图7所示。
图7 基于级联SVM的复合信号识别流程
首先根据输入信号设计数字接收机,通过全数字接收机对复合信号解调恢复出内调制信号,进而获取其功率谱和平方谱图形,最后利用SVM分类器实现信号调制识别。由1.3节的分析可知,2ASK,MTONE信号以及MPSK信号在功率谱图形上存在明显的差别,BPSK和QPSK信号无法从功率谱图形上进行区分,但它们在平方谱图形上的差异明显。
传统算法是将功率谱和平方谱特征混合使用,在同一个SVM分类器中同时对两类特征进行训练。这种算法原理简单,但是由于增加了特征数量,在实现时的运算复杂度较高,训练和识别时间都会大大增加。因此本文提出一种级联SVM分类算法,在分类时先将两类PSK信号归为一类,并标记为MPSK,利用功率谱谱图形数据训练SVM分类器1,实现对2ASK、MTONE和MPSK信号的区分。之后对识别为MPSK信号的数据获取平方谱图形,然后输入SVM分类器2,利用平方谱图形特征区分BPSK和QPSK信号。
混合特征的SVM分类方案对4种信号使用一对一支持向量机时需要的分类器个数为M(M-1)/2=6个,而级联方案需要的分类器个数仅为M1(M1-1)/2+M2(M2-1)/2=4个,该方案中每个向量机要运算的特征数仅为混合特征方案的一半,因此在训练和识别速度上更有优势。基于Windows 10操作系统和Intel CORE i5处理器进行的MATLAB仿真表明,混合特征方案对每个信号进行训练和识别所需的平均时间为1.26 s,而级联方案所需的平均时间仅为0.28 s。
图8 参数C和γ对分类器性能的影响
仿真实验使用中国电子科技集团某研究所提供的复合调制信号文件(信噪比很大,仿真时视为不含噪声)。已知信号采样频率fs=2 MHz,载频fc=500 kHz,码速率fb=40 kbps,FM调频系数为α=0.005。2ASK-FM和MPSK-FM信号的副载频为f1=40 kHz,MT-FM调制信号的副载频为f1=20 kHz,f2=30 kHz,f3=40 kHz,f4=50 kHz,f5=60 kHz。
首先向信号文件中分别添加不同功率的高斯白噪声,形成信噪比分别为10 dB和0 dB的带噪声信号,然后每4 096点为一组,产生4种信号类型、2种信噪比的信号各100组,共800个信号作为训练集,使用交叉验证方法寻找参数C和γ的最优值。即将样本分为多份,对于不同的参数按比例将部分数据作为训练集,另一部分作为测试集,并对识别率进行统计,将识别率最高的参数C和γ作为最佳参数。最后使用最佳参数进行调制识别。对不同C和γ进行20次重复训练得到的平均识别率如图8所示。
图9 不同信噪比下的识别率
由图8可知,当log2C≥1,log2γ=-5,即C≥2,γ≈0.03时分类器性能达到最佳。这是由于C的值小于2时分类器忽略过多的样本点,导致欠拟合,从而影响了识别性能。而γ过小会限制分布函数的作用范围,降低分类器对未知样本的分类能力,γ大于0.03时平滑效应太大,分类器难以对训练集进行有效区分,识别性能也随之下降。
使用最佳参数,保持训练集不变,在相同条件下产生4种复合信号各200组,即每种信噪比条件下都由800个长4 096点的信号组成测试集进行识别率测试,同时与文献[3]中所使用的基于部分特征提取和决策树分类的识别算法进行识别率对比分析。不同信噪比条件下各信号在不同分类算法下的识别率情况如图9所示。
从图9可以看出,本文算法识别率优于文献[3]算法。以0 dB为例,文献[3]算法对于2ASK-FM,MT-FM,BPSK-FM和QPSK-FM信号的识别率分别为92%,94%,83%和84%,而本文算法在0 dB时的识别率分别为100%,99%,88%和90%,提高了5%以上。在更低信噪比下,本文算法的识别率优势更加明显。
图10 副载波频偏fΔ对本文算法识别率的影响
为验证本文算法的鲁棒性,使用MATLAB产生参数可变的FM复合调制信号对本文算法进行验证。在信噪比(Signal Noise Ratio,SNR)为0 dB的条件下,采用4种信号各200组,共800个信号作为测试集进行识别率测试,之后改变测试集中复合信号的副载频,得到副载频偏移量fΔ对本文算法识别率的影响如图10所示。
从图10以看出,当副载频的偏移在-25~45 kHz时,本文算法的识别率不受影响。类似的,保持副载频和其他条件不变,依次改变载波频率fc,码元速率fb和调频系数α,验证算法的稳定性。表1给出了识别性能保持稳定的参数范围。
表1 参数设置范围
当信号参数在表1所示的范围内发生改变时,本文算法的识别性能不受影响,具有较强的稳定性。综上所述,本文算法对载频、副载频、调频系数和码元速率的变化不敏感,与基于局部信号特征和决策树的分类算法相比,识别率有较大提升。
本文提出一种基于数字接收机和支持向量机分类器的FM复合调制信号识别算法,避免了传统决策树算法对阈值设置的依赖,提高了低信噪比下的识别性能。但本文算法依赖于内调制信号在频域上的差异,对频域特征一致的复合信号识别问题需要展开进一步研究。