一种基于类内聚集度和类间离散度的特征集提取方法

2018-01-22 09:38王扬钧段金虎
航天电子对抗 2017年6期
关键词:辐射源特征选择特征提取

廖 帅,王扬钧,姜 楠,段金虎

(北京市遥感信息研究所,北京 100094)

0 引言

雷达辐射源信号由于受噪声等多种因素影响,最重要的特征常常难以发现,特征提取一般采用经验式的方法,所提取出的特征往往带有主观性和猜测性,且由于大量噪声的存在,信噪比通常在几dB到几十dB之间变化,这些因素易造成特征向量在特征空间中的无序分布,使不同类别的辐射源信号特征在特征空间中发生严重交叠而致使分类识别率降低。为了消除特征提取的主观性和提高准确识别率,需要采用特征选择方法,按照与分类有关的评价准则从高维特征中挑选最有效的特征集。

特征选择的任务是利用特征模式样本集的内部信息,从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的。特征选择应能有效降低特征向量的维数、减少特征提取的代价、简化分类器的设计和提高识别效率,因此,特征选择是继特征提取之后的一个重要研究课题,受到模式识别、数据挖掘、机器学习等多个领域研究人员的广泛关注。

将分类器的错误概率作为特征选择准则固然好,但即使在类条件概率分布密度已知的情况下错误概率的计算也很复杂,何况实际问题中通常不知道这一分布,这使得直接用错误概率作为分类标准来分析特征的有效性变得十分困难。因此,在实际应用中,需要寻求一种有效的解决方案来衡量各类别间的可分离性。

本文给出了一种类内聚集度和类间离散度的定义,并提出一种基于类内聚集度和类间离散度的特征集评价准则。基于该准则,采用特征排序选择的搜索策略,可以从雷达辐射源信号原始特征集中挑选出品质优良的特征子集,从而实现对雷达辐射源信号的准确识别。

1 雷达辐射源信号多模特征分类

1.1 物理分类方式

物理意义上,可把雷达辐射源信号多模特征分为以下五个类别。

脉冲序列统计特征:载频、重频、脉宽等;

脉冲序列衍生特征:载频、重频、脉宽的相关性及组合变化特征等;

单脉冲脉内调制特征:频率、带宽、调制类型、调制参数、零中频相位曲线等;

单脉冲脉冲包络特征:精测脉宽、上升沿夹角、下降沿夹角、顶部趋势夹角、顶部波动、包络J特征、包络差分J特征等;

雷达扫描特征:圆周扫描雷达扫描周期。

1.2 特征描述分类方式

从识别的角度考虑,按照特征描述的方式,可把雷达辐射源信号多模特征分为以下三个类别。

连续取值类特征:脉冲载频、带宽、重频、精测脉宽、上升沿夹角、下降沿夹角、顶部趋势夹角、顶部波动、包络J特征、包络差分J特征、扫描周期、脉内调制参数等;

离散取值类特征:载频统计类型、重频统计类型、脉宽统计类型、脉内调制类型、脉内调制码等;

曲线图片类特征:脉冲序列载频/脉宽/重频的相关性脸谱图、脉内调制识别曲线、脉冲包络曲线、零中频相位曲线等。

2 基于类内聚集度和类间离散度的特征集评价准则

2.1 基于类间离散度的特征评价体系

按照第1节中对雷达辐射源信号特征的描述,特征可分为连续取值类、离散取值类以及曲线图片类。对于离散取值类和曲线图片类的特征,目前只能依赖人工分类判别及挑选,本文详细讨论了连续取值类特征的奇异样本筛选及评价准则。首先,给出了一种类内聚集度和类间离散度的定义,依据类内聚集度,通过设置合理的阈值,挑选并剔除奇异样本。然后,提出了一种基于类内聚集度和类间离散度的特征集品质评价准则函数,基于该准则函数,采用相关的搜索策略,可从雷达辐射源信号原始特征集中挑选出品质优良的特征子集。

定义1 第i类信号的类内聚集度Cii为:

(1)

定义2 第i类与第j类信号的距离Dij定义为:

(2)

定义3 第i类与第j类信号的类间离散度Sij定义为:

Sij=Dij/Cii+Cjj

(3)

式中,Dij是第i类与第j类信号的距离,Cii和Cjj分别为第i类与第j类信号的类内聚集度。

如果待识别信号共有H类(H≥2),考虑识别的复杂度,选择的特征子集维数越低越好,另外各类的类间离散度平均值越大越好。由此,根据定义1和定义3给出的类内聚集度和类间离散度,设计评价特征集质量的准则函数为:

(4)

由式(4)可知,特征子集维数q越小,f值越大;各类的类间离散度Sij平均值越大,f值越大。准则函数f值越大,表明选择的特征子集越好。

2.2 基于雷达辐射源信号特征聚集度的样本筛选

在对某个雷达辐射源信号进行特征提取及分析时,依据信号分选结果提取的脉冲样本可能会存在个别的错误情况,即脉冲样本不是该雷达辐射源真实脉冲或者选取的脉冲样本体现出的特征不是雷达辐射源真实的特征,主要有以下几类情况:

1) 由信号分选策略所导致的脉冲信号漏分选,造成频率跳变或捷变的范围没有完整体现,表现出雷达参数变化类型的错误或不完整;

2) 分选出的脉冲列中包含个别其他辐射源的脉冲,或者挑选出的脉内采集数据不是原脉冲列包含的样本脉冲的采集数据;

3) 当脉冲功率较低,例如一个大脉宽的脉冲功率在接收机灵敏度附近起伏时,会分裂成多个小脉宽的脉冲,造成分裂成小脉宽脉冲以及不规则小重频;

4) 对于频率分集信号和脉内频率跳变信号,由接收机体制导致未能截获部分频点的脉冲,造成脉冲分裂,形成虚假脉冲现象。

因此,对样本进行统计分析时,存在奇异值样本是正常的,对特征进行统计分析之前,有必要检查样本特征的统一性,剔除奇异样本。由于样本的数量较小,但每个样本提取的原始特征种类多,表述样式不统一,不便于用统一的方法去查找错误样本。对于离散取值类的特征,可通过统计样本该特征不同取值的出现次数,剔除出现次数很少的奇异样本;对于图片曲线类的特征,通过人工比对分析,挑选出差异较大的样本;对于连续取值类的特征,本文结合聚类的思想,给出一种依据样本特征值聚集度的挑选奇异样本并分类的方法。

Step4:设σ为样本类数量阈值,当a<σ,第一类样本因数量小于阈值判为奇异样本,舍弃该类样本,否则保留该类样本;

Step6:对于保留的样本,重复Step2,直到Δya/Δyb≤δ,结束流程。

2.3 特征排序选择法

样本筛选完成后,对于同型雷达辐射源的几个不同个体,依据样本类内聚集度及类间离散度排序的特征选择方法,挑选合适的特征,以降低后面个体分类识别的特征维数,提高分类效率和准确率,具体步骤如下:

Step1:设某型待分类的雷达辐射源信号总共有H类信号,共提取了q个特征,计算第i类与第j类信号的第n个特征的分离度Snij及准则函数fn,其中i=1,2,…,q,n=1,2,…,q;

Step2:按各特征的准则函数f由大到小进行排序,结果为fA1≥fA2≥…≥fAq,其中fAi为第Ai个特征的类间离散度;

3 结束语

特征提取和特征选择是雷达辐射源信号识别的重要课题之一,本文在给出的一种类内聚集度和类间离散度定义的基础上,提出了基于类内聚集度和类间离散度的特征集品质评价准则函数。基于该准则函数,采用特征排序选择的搜索策略,可从雷达辐射源信号原始特征集中挑选出品质优良的特征子集,从而实现了信号特征的高效描述,提高了雷达辐射源信号识别的准确率。■

[1] 张葛祥,荣海娜,金炜东.基于小波包变换和特征选择的雷达辐射源信号识别[J].电路与系统学报,2006,11(6):46-49.

[2] 张静远,张冰,蒋兴舟.基于小波变换的特征提取方法分析[J].信号处理,2000,16(2):156-162.

[3] 钱涛,马健,刘凯,等.基于连通检测和区域扩展的多重聚类方法研究[J].航天电子对抗,2016,32(5):36-39.

[4] 杨建,周涛,何梓昂.一种有效的雷达信号快速识别方法[J].电讯技术,2017,57(4):418-424.

[5] 普运伟,金炜东,胡来招.基于瞬时频率二次特征提取的辐射源信号分类[J].西南交通大学学报,2007,42(3):373-379.

[6] 沈家煌,黄建冲,朱永成.特征参数匹配法在雷达信号识别中的应用[J].航天电子对抗,2017,33(2):9-14.

[7] 吴振强,常硕,张国毅.基于信号特征综合处理的雷达辐射源识别[J].科学技术与工程,2015,15(25):12-17.

[8] 郭亚琴,王正群.基于类内类间离散度的分类器设计方法[J].信息技术,2010,5(1):35-37.

猜你喜欢
辐射源特征选择特征提取
基于单站干涉仪测向法的未知辐射源定位技术*
基于博弈论的GRA-TOPSIS辐射源威胁评估方法
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
数字电视外辐射源雷达多旋翼无人机微多普勒效应实验研究
微动目标雷达特征提取、成像与识别研究进展
外辐射源雷达直升机旋翼参数估计方法
基于智能优化算法选择特征的网络入侵检测
故障诊断中的数据建模与特征选择