基于随机森林的低阶数字调制识别算法研究*

2018-03-21 00:56谭正骄施继红胡继峰
通信技术 2018年3期
关键词:训练样本特征参数决策树

谭正骄,施继红,胡继峰

(云南大学 信息学院,云南 昆明 650500)

0 引 言

在复杂的无线通信环境中,如何对不同调制参数和不同调制方式的通信信号进行监视和识别,一直是人们关注的焦点。对调制方式的识别,是非协作通信中一项不可或缺的关键技术,是认知无线电、软件无线电等领域研究的基础,在军事和民用领域有着广泛应用,如信号监控、干扰识别、电子对抗及军事威胁分析等方面。目前,调制识别算法大致可分为两大类:基于

似然比判决理论的方法和基于统计模式的方法[1]。基于似然比判决理论的方法在实际应用中存在对先验知识依赖性大、推导复杂、计算量大的问题。相较于判决理论的方法,统计模式的方法因其简便易行且设计合理时可接近最优而得到广泛应用。统计模式的方法因其使用特征参数的不同,可以分为多种具体算法。具体地,基于瞬时特征的算法是Nandi和Azzouz于1998年利用瞬时幅度、频率和相位特征,对低阶数字信号进行的识别[2]。文献[3]提出了一种改进的瞬时特征识别算法,提高了低信噪比条件下的识别性能。该算法虽然易于实现、特征参数提取简单、计算量小,但特征参数易受噪声影响[4]。基于高阶统计量的算法适合在低信噪比条件下对信号进行识别,且具有运算量小等优点,但对多种信号进行识别时,由于高阶统计量的相同或接近性,无法实现完全识别[5-6]。文献[7]提出了一种基于星座图的分类方法,具有计算复杂度低、性能稳健等优点,但随着星座点数的增加性能有所下降,且加大了运算量。

对此,本文通过提取调制信号的5个瞬时特征——零中心归一化瞬时幅度的谱密度最大值γmax、归一化中心频率的四阶矩紧致性μ42f、递归归一化瞬时幅度绝对值的均值A1、递归归一化瞬时频率绝对值的均值Af1和递归归一化瞬时相位绝对值的均值Ap1,辅助以随机森林算法,对6种典型的低阶数字调制信号进行调制识别。该算法克服了决策树过拟合问题,具有特征参数提取简单、计算量小、易于实现、对噪声有较好容忍性的特点,在低信噪比环境下具有良好的识别效果。实验仿真表明,在信噪比不小于-5 dB的条件下,所提算法对2FSK、BPSK、4FSK、QPSK的识别正确率可达78%以上;在信噪比不小于3 dB的条件下,所提算法的调制识别正确率可达到100%。

1 随机森林(RF)算法

随机森林(Random Forest,RF)是由美国科学家Leo Breiman于2001年提出的一种机器学习算法。它包含多个由Bagging集成学习技术训练得到的决策树[8],最终分类结果由单个决策树的分类结果投票决定,克服了决策树过拟合问题,只需对给定的训练样本进行学习训练分类规则而无需分类的先验知识,且对噪声和异常值有较好的容忍性[9]。当前,随机森林算法因其良好的性能表现,被广泛应用于科学研究的众多领域。

随机森林决策树的组合是从训练样本集中利用Bootstrap抽样生成新的训练集。对每个新的训练集利用随机特征选取方法生成决策树,而决策树在生成过程中不进行剪枝[10]。单棵决策树的训练过程如图1所示。

图1 随机森林单棵决策树的生成过程

从图1可以看出,在随机森林单棵决策树的生成过程中,首先从原始训练样本中随机抽取一个与原始训练样本相同大小的Bootstrap训练样本,然后等概率从属性集合中抽取属性子集,在属性子集中选择最优属性进行节点分裂,最终生成一棵决策树。循环上述过程,直至生成K棵决策树,构成随机森林。

本文基于CART算法生成随机森林中的决策树,而节点分裂时的规则选用Gini指标最小原则。它的计算过程为:

其中Pi为类别Ci在样本集S中出现的概率。将样本集S分割成k个子集Sn(n=1,2,3,…,k),则划分后的Gini系数为:

2 特征参数的提取及分析

2.1 特征参数提取

为了提取信号的时域特征参数,需先对信号进行希尔伯特变换。设接收到的调制信号经采样后的采样序列为S(n)(n=0,1,2,…,Ns),采样频率为fs,则进行希尔伯特变换后得到:

于是,瞬时幅度为:

瞬时相位为:

对相位序列 φ ( n )进行去相位卷叠和去线性相位运算后,得到真正的相位序列φNL,计算瞬时频率为:

基于得到的瞬时幅度、相位和频率,提取以下5个特征参数组成特征向量。

对信号进行归一化处理,是为了消除信道增益的影响。其中,采样速率为fs,Ns为信号样本采样点的样本个数,对acn(i)有如下定义:

其中φ'(i )为对归一化瞬时相位 φ (i)的归一

NLNL化处理。φNL(i)具有如下定义:

2.2 识别原理

应用上述提取的5个特征参数进行调制识别,其原理可用图2简单表示。

图2 调制信号识别原理

γmax用于对MASK与MFSK、MPSK信号的类间区分;μ42f用于对MPSK与MFSK信号的类间区分;A1用于对2ASK与4ASK信号的类内区分;Af1用于对2FSK与4FSK信号的类间区分;Ap1用于对2PSK与4PSK信号的类间区分。

2.3 基于随机森林的调制识别算法及实现

本文基于随机森林算法的低阶数字信号调制识别模型,如图3所示。

图3 基于随机森林算法的低阶数字信号调制识别系统模型

在以上分析的基础上,提取γmax、μ42f、A1、Af1、Ap1这5个能明显区分各调制信号的特征参数,作为信号的识别特征。通过在不同信噪比条件下提取各调制信号的上述5个特征,组成随机森林的训练样本和测试样本。

调制识别算法的具体步骤如下:

(1)从训练样本集中用Bagging的方法有放回地抽取一个Bootstrap训练样本,作为一棵数训练样本;

(2)每个Bootstrap训练样本生成一棵不剪枝的决策树;

(3)重复步骤(1)和步骤(2),直至生成ntree棵决策树;

(4)由生成的ntree棵决策树构成森林,对未知类别的测试样本进行分类,最终结果由各决策树多数投票决定。

3 实验仿真与结果分析

3.1 实验仿真

为了验证上述方法的可行性和有效性,选取2ASK、2FSK、BPSK、QPSK、4ASK和 4FSK共 6种典型的数字调制信号,在Matlab 2012a环境中进行仿真实验。噪声为高斯白噪声,信号的码元速率为5 kb/s,载频为15 kHz,采样频率为120 kHz,载波幅度为1。在-10~20 dB的信噪比条件下,对各数字调制信号分别提取2 000组特征样本,其中1 000组作为训练样本,1 000组作为测试样本。用训练样本对随机森林进行训练,将测试样本输入训练完成的随机森林(ntree=100棵决策树构成,分裂节点的候选特征mtry=2)得到识别结果,则在不同信噪比条件下的识别正确率如表1所示。

表1 各数字调制信号在不同信噪比条件下的识别正确率/(%)

在-10~20 dB的信噪比条件下,步长为1 dB,得到各数字调制信号的调制识别正确率,如图4所示。

3.2 结果分析

从表1、图4的结果可以看出,在信噪比不小于-5 dB的条件下,对2FSK、BPSK、4FSK、QPSK的识别正确率可达78%以上;在信噪比不小于3 dB的条件下,调制识别正确率达到100%。

对比文献[12]采用的BP神经网络方法,所提算法的识别性能有较大改善,其中文献[12]的识别结果如表2所示。

文献[3]中采用传统分类判决树算法,在信噪比不小于5 dB时,识别正确率达到90%以上而在相同信噪比条件下,本文算法达到了100%的识别正确率。可见,本文所提算法的识别效果有了较大提高,且在较低信噪比条件下也能取得一定的识别效果。在信噪比0~5 dB时,文献[13]中算法对2ASK、4ASK和文献[14]中算法对4PSK、4ASK的平均识别正确率与本文所提算法的平均识别正确率,如图5所示。可见,在信噪比0~5 dB时,文献[13]中的算法对2ASK、4ASK信号的识别效果较差,但在信噪比大于10 dB的情况下,取得了95%以上的识别正确率。本文算法在1 dB以上时,对2ASK、2FSK、BPSK、QPSK、4ASK和4FSK的识别正确率均在95%以上。相较于文献[14]的方法,本文算法对4PSK、4ASK信号的识别正确率也有了提高。

图4 6种低阶数字调制信号的调制识别正确率

表2 BP神经网络在不同信噪比下的调制识别正确率/(%)

图5 3种算法的平均调制识别正确率对比结果

4 结 语

本文采用随机森林算法对数字调制信号的自动识别进行研究,通过分析2ASK、2FSK等6种典型低阶数字调制信号的时域特征提取了5个特征参数,辅助以随机森林算法对其进行分类识别。实验验证表明,本文算法具有有效性和可行性,但未对更多不同调制方式的信号进行验证。用随机森林对数字调制信号进行自动识别,在较低信噪比条件下能取得良好的识别效果;随机森林通过引入2个随机性,使得随机森林不容易陷入过拟合,具有很好的抗噪能力,且对数字信号的调制识别具有较高的精度和良好的稳健性。

[1] 何继爱,张文启.通信信号调制识别技术及其发展[J].高技术通信,2016,26(02):157-165.HE Ji-ai,ZHANG Wen-qi.Communication Signal Modulation Recognition Technology and Its Development[J].High Technology Communication,2016,26(02):157-165

[2] Nandi A K,Azzouz E E.Algorithms for Automatic Modulation Recognition of Communication Signals[J].IEEE Transactions on Communications,1998,46(04):431-436.

[3] 位小记,谢红,郭慧.基于瞬时特征参数的数字调制识别算法[J].传感器与微系统,2011,30(01):127-130.WEI Xiao-ji,XIE Hong,GUO Hui.Digital Modulation Recognition Algorithm Based on Instantaneous Characteristic Parameters[J].Sensors and Microsyste ms,2011,30(01):127-130.

[4] 郭彩丽,冯春燕,曾志民.认知无线电网络技术及应用[M].北京:电子工业出版社,2010.GUO Cai-li,FENG Chun-yan,ZENG Zhi-min.The Technology and Application of Cognitive Radio Network[M].Beijing:Electronic Industry Press,2010.

[5] BALDINI G,STURMAN T,BISWASi A R,et al.Security Aspects in Software Defined Radio and CognitiveRadio Networks:a Survey and a Way Ahead[J].IEEE Communications Surveys & Tutorials,2012,14(02):355-379.

[6] 张艳秋.基于高阶累积量的数字信号调制识别[J].信息通信,2016,158(02):27-29.ZHANG Yan-qiu.Modulation Recognition of Digital Signal Based on High Order Cumulant[J].Information Co mmunication,2016,158(02):27-29.

[7] 崔旭,熊刚.一种基于星座图模糊分析的数字调制识别方法[J].通信技术,2016,49(09):1155-1158.CUI Xu,XIONG Gang.A Digital Modulation Recognition Method Based on the Fuzzy Analysis of Constellation[J].Communications Technology,2016,49(09):1155-1158.

[8] 夏龄.基于循环特征的调制模式识别[J].科学技术与工程,2012,12(31):8241-8246.XIA Ling.Modulation Pattern Recognition Based on the Feature of Circulation[J].Science and Engineeri ng,2012,12(31):8241-8246.

[9] 董师师,黄哲学.随机森林理论浅析[J].集成技术,2013,2(01):1-7.DONG Shi-shi,HUANG Zhe-xue.A Brief Theoretical Overview of Random Forests[J].Journal of Integration Technology,2013,2(01):1-7.

[10] 方匡南,吴见彬,朱建平.随机森林方法研究综述[J].统计与信息论坛,2011,26(03):32-37.FANG Kuang-nan,WU Jian-bin,ZHU Jian-ping.A Review of Random Forest Methods[J].Statistics and Information Forum,2011,26(03):32-37.

[11] Nandi A K,Azzouz E E.Procedure for Automatic Recognition of Ainalogue and Digital Modulations[J].IEEE Proc. Commun,1996,143(05):259-266.

[12] 余嘉,陈印.基于BP神经网络的数字调制识别方法[J].传感器与微系统,2012,31(05):16-19.YU Jia,CHEN Yin.A Digital Modulation Recognition Method Based on BP Neural Network[J].Ensors and Microsystems,2012,31(05):16-19.

[13] 赵强,杨建波,刘鹏.一种新的联合特征调制识别算法[J].通信技术,2016,46(03):4-9.ZHAO Qiang,YANG Jian-bo,LIU Peng.A New Automatic Recognition Algorithm Based on Combined Feature Parameters[J].Communications Technology,2016,46(03):4-9.

[14] 张艳秋.基于高阶累积量的数字信号调制识别[J].信息通信,2016,158(02):27-30.ZHANG Yan-qiu.Modulation Recognition of Digital Signal Based on High Order Cumulant[J].Information Co mmunication,2016,158(02):27-30.

猜你喜欢
训练样本特征参数决策树
冕洞特征参数与地磁暴强度及发生时间统计
人工智能
基于交通特征参数预测的高速公路新型车检器布设方案研究
决策树和随机森林方法在管理决策中的应用
基于PSO-VMD的齿轮特征参数提取方法研究
基于视频的车辆特征参数算法研究
决策树多元分类模型预测森林植被覆盖
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
基于决策树的出租车乘客出行目的识别