雷达辐射源信号聚类分选算法综述

2019-11-11 02:12

雷达科学与技术 2019年5期

(1.四川大学电子信息学院，四川成都 610064； 2.中国人民解放军77618部队，西藏拉萨 850000)

0 引言

雷达信号分选是指将接收机接收到的各种雷达信号采取适当的分选办法，按照不同辐射源一一区分开来的过程。传统的雷达信号分选方法是对脉冲参数进行预处理，然后根据脉冲间隔PRI的交错进行主处理，从而实现信号分选。然而，随着信息化装备平台的广泛运用，战场电磁环境日趋复杂化，传统的信号分选方法已不再适用于现有信号分选工作。

聚类分析是利用未知数据对象之间的关系，将数据性质相似的聚集成一类的分类行为，是数据挖掘的重要方法之一[1]。在探索新的雷达辐射源信号分选算法过程中，许多学者提出将聚类分析应用于雷达信号分选，如传统聚类算法的基于迭代自组织数据分析聚类[2]、仿生优化算法中的人工鱼群聚类算法[3]、群智能算法的粒子群优化算法[4]等都能够很好实现未知雷达辐射源信号的聚类分选。

本文则是首先介绍国内学者对传统的聚类算法及其改进算法在雷达辐射源信号分选中的应用和理论研究成果，再归纳总结提出了选择最优聚类分选算法的参考标准和意见。

1 传统聚类算法分选

聚类分选因对先验知识要求小、大数据处理能力较强且具有无监督的分类的优势而被应用到雷达辐射源信号分选。传统的聚类分选可大致分为划分、层次、网格、密度、模型、图论六类算法，其中前四类算法及其组合常应用于雷达辐射源信号分选。

1.1 划分聚类法

划分法是对给定的脉冲数据集N，先基本划分为K(K≤N)类，然后通过迭代重定位技术重新划分，直到找到局部最优的聚类方法。划分聚类算法里最具有代表性的是K-Means算法和FCM算法，其中FCM算法本质上是对K-Means算法的改进，所以本文以K-Means算法为例介绍其算法流程，如图1所示。

图1 K-Means聚类法流程图

1.1.1 基于K-Means算法的雷达信号分选

1967年，Mac Queen首次提出了K-Means聚类算法，这是一种非监督实时聚类算法，具有快速收敛、分类迅速、计算简单等优点[5]，但是该算法因需要人为设定聚类数、对异常数据敏感、易陷入局部最优解等缺点而不能直接应用于未知雷达辐射源信号的分选。因此，为了达到未知信号聚类分选的目的，部分学者针对其缺点提出了一些基于K-Means聚类算法的改进算法。

针对需要人为设定聚类数和类中心的缺点，文献[6]采用加权殴氏距离和距离阈值、文献[7-8]利用数据场理论、文献[9]引入蚁群算法、文献[10]采用基因表达式编程、文献[11]采用SVC算法的方式都能够很好地自动完成簇数和类中心的选取，然后再利用K-Means算法均很好地实现了未知雷达辐射源信号的分选，但不可避免地都带来了计算时间较长、相关参数设置较难的问题，有待进一步解决。另外，针对该算法在分选雷达辐射源信号时存在的其他缺点，文献[8]采用灰关联度代替欧式距离，提高数据之间相似性的判断；文献[12-13]分别使用人工蜂群算法和免疫规划算法与K-Means算法相结合，有效避免了陷入局部最优解的同时也降低了对初始聚类中心的依赖性；文献[14]提出的改进K-Means算法能够有效克服孤立点对聚类的影响同时有效提高分类效率。

在研究雷达辐射源信号聚类分选时，K-Means算法的改进算法理论研究成果相对较为成熟，且都具有一定工程应用价值。

1.1.2 基于FCM算法的雷达信号分选

模糊C均值聚类(Fuzzy C-Means，FCM)算法是由Bezkek于1974年提出,并经Baraldi改进推广[15]。FCM算法和K-Means算法一样，也存在着需要预先人为设定聚类数目、易陷入局部最小等问题，不能够直接应用于未知雷达辐射源信号的分选。因此，为了完成对雷达辐射源信号的聚类分选工作，需在该算法的基础上加入其他技术综合使用或者对算法加以改进。

文献[16-17]采用Chriplet时频原子与入侵杂草智能算法相结合的分配技术、文献[18]利用粒子群优化算法的全局优化能力、文献[19]介绍了核函数思想并采用人工鱼群算法和文献[20]利用数据场理论并联合云模型都能有效解决聚类中心自动选取的问题，通过FCM算法均能够很好实现雷达信号的聚类。这些改进算法减少了人为因素对分选时的干扰，分选正确率有所提高，但计算时间相对有所延长，分选效率有待提高。而文献[21]则引入诱导矩阵，采用自适应距离准则，利用拉格朗日乘法优化目标函数，在FCM算法的基础上提出了G-K聚类算法，具有更高的分选正确率，但是由于聚类数目仍需人为设定，可用范围有限。

基于FCM算法的改进算法属于模糊聚类，先验知识需求较少，同时具有较强抗干扰能力，在一定程度上解决了雷达信号分选的问题，实用性较K-Means算法有一定提高。

1.2 层次聚类法

层次法是在给定的数据集N中，判断数据点之间的距离值d是否小于给定的距离阈值以确定是否属于同一类的方法。算法初始阈值设置为0，所有数据各为一类，分类完毕以后给阈值一定增量Δ，再次完成数据分类，通过计算每次分类的评价指标Q来找到最优分类，实现数据自动聚类，其中Δ和Q的设置可以参考文献[22]，算法流程如图2所示。

图2 层次聚类法流程图

该算法可有效处理任意形状数据集，不依赖相似度，可以灵活应对各种聚类粒度的数据，但是在复杂情况下相关参数设置困难,运算量大，且不能实现增量式聚类。

在研究雷达辐射源信号聚类分选时，国内学者对层次聚类算法的应用还相对较少。文献[22]提出的层次聚类方法实现未知雷达辐射源信号的分选，根据实验仿真结果可知仅对参数固定和参差变化雷达具有良好分选效果，使用范围有限；文献[23-24]是考虑复杂电磁环境条件下，提出了利用数据场理论的层次聚类方法，有效解决了信号分选“增批”的现象，优化了分选参数选择；文献[25]则在脉内细微特征运用的基础上，将灰关联分析运用到分裂式层次聚类算法进行雷达信号聚类分选，该方法有较高的分选效率和正确率。

1.3 网格密度法

1.3.1 网格聚类法

网格聚类法[26]是将归一化后的样本数据集N映射到划分好的K个网格单元，通过分析网格之间的密度阈值MinPts与给定的阈值ε的关系，去除低密度网格，连通相邻的高密度网格，从而实现数据聚类的算法，其流程大致如图3所示。

图3 网格聚类法流程图

该算法能够识别任意形状的簇，有效消除干扰数据的影响，且运算速度快、正确率高。但是，人为设定网格大小和密度阈值也限制了分选的精确度，在未知雷达辐射源信号分选时，易出现“漏批”的情况，针对此情况，文献[27-29]提出了多种动态生成网格、自动生成密度阈值、优化网格边界的改进算法，有效解决了雷达辐射源信号分选时人为干扰因素的影响，分选正确率高、速度快，适合大规模数据的分选。此外，文献[30]在原有网格聚类的基础上提出了双密度阈值策略，利用边缘稀疏网格优化方法，提高了雷达辐射源信号聚类精度及其抗干扰能力；文献[31]采用表征信号的脉内特征相像系数与网格聚类法相结合的方法，能够对参数交叠严重的雷达脉冲信号进行有效分类，并且满足工程实施的要求。

1.3.2 密度聚类法

密度聚类法是以数据集在空间分布上的稠密程度为依据而进行的聚类[32]，该算法不需要预先设定簇的数量，先验知识的需求较少。学者在研究雷达辐射源信号聚类分选时，多以DBSCAN聚类算法[33]为基础，其流程如图4所示。

图4 DBSCAN聚类算法流程图

DBSCAN聚类算法在处理分布不均匀的雷达信号时，易出现“漏批”情况，文献[34-35]均针对这个问题提出了理论上可解决的方法。其中，文献[34]采用的自适应密度阈值的方法，文献[35]则是采用近类点和模糊点的改进算法，均能很好实现雷达信号的聚类，并对噪声不敏感，不过，密度阈值和最佳邻域半径的自动设定是该算法急需解决的实际问题。此外，该算法在实现大数据聚类分选时，计算量较大、难以实时分选，文献[36]提出用一定量的参考点代表一定领域范围内的数据点，建立两种之间关系，利用广度优先搜索算法完成信号聚类的改进算法，一定程度上减少计算量、缩短计算时间，同时保证较高的分选正确率。

鉴于密度聚类能够有效识别任意形状的聚类和噪声信号以及网格聚类的分选速度快、伸缩性好的优点[30]，部分学者在研究雷达辐射源信号分选时，提出了将两者结合起来使用的观点并作了一定推广运用。例如，文献[37]运用的改进的网格密度聚类方法，高效、快速地实现了未知雷达辐射源信号分选工作；文献[26]分别提出了固定网格密度聚类法、动态网格密度聚类算法及其改进算法来应用于雷达辐射源信号分选，而其中改进的动态网格密度聚类算法对先验知识要求低，识别信号能力强，聚类精度高、速度快，适用范围较广；文献[38]则运用了自适应网格密度聚类来实现雷达辐射源信号的聚类分选，能够有效处理大规模雷达信号数据集，且有良好的抗噪声性能；文献[39-40]则是在基于网格密度聚类的思想基础上，分别采用了滑动窗口机制和动态网格生成技术，并利用双密度阈值提高精度，有效实现了雷达辐射源信号的动态聚类分选。

网格密度法由于其聚类本质是密度阈值的判定，因此如何利用信号数据本身实现密度阈值的自动提取还值得深入探究。

1.4 归纳总结

对上述应用于未知雷达辐射源信号分选的传统聚类算法分析后，可得结论如表1所示。

表1 传统聚类算法分析

2 聚类分选算法选择

现代战场环境中，雷达信号愈发密集，信号之间交叠愈发严重，实现雷达信号聚类分选时的特征参数选择至关重要，这将直接影响分选的有效性[41]。另外，在选择合适的聚类算法时，为了提高分选的效率和质量，充分考虑分选影响因素能够有效避免在计算时浪费资源、增加计算难度等问题。

2.1 雷达信号特征参数

常见的雷达信号参数主要包括脉冲间特征参数、脉内特征参数以及极化特性等。

2.1.1 脉冲间特征参数

雷达信号脉冲间特征参数包括瞬时参数和二次测量参数，其中，瞬时参数主要是脉冲描述符PDW(到达方向DOA、到达时间TOA、载频RF、幅度PA、脉宽PW)，二次测量参数则有脉冲重复间隔PRI、天线扫描周期ASP等[42]。其中，PA在测量时因受外界因素影响非常大，往往不作为聚类分选参数考虑。

实施岗位管理包括进行系统的岗位调查、岗位信息的采集、岗位分析等。医院人事处处长王慧卿介绍，北医三院联合中国人民大学劳动人事学院于2013年5月至2014年9月启动全院员工岗位分析项目，通过访谈法、问卷调查法、资料回顾法等对全院93个科室进行岗位分析，完成“部门职责说明书、核心岗位架构图、核心岗位说明书”的编写，形成了医院人力资源管理的基础性文件和可持续应用工具。在岗位说明书中，结构化定义了岗位的基本信息、工作描述、在组织中的位置等要素内容。

2.1.2 脉内特征参数

脉内调制参数主要包括脉内有意调制和脉内无意调制两类[43]。脉内有意调制是为了提高雷达检测性能和抗干扰能力而采取的特定调制样式，主要包括相位调制、频率调制、幅度调制以及3种调制的组合调制方式等；脉内无意调制又称为指纹特征[44]，具有唯一性、可测量性、普遍性、稳定性等特点，主要包括了频率稳定度、高阶谱分析、信号包络等特征参数。

2.1.3 极化特性

雷达常用的极化方式[45]主要包括4种形式，分别是垂直极化、水平极化以及左、右旋圆极化，但是雷达后向散射波是椭圆极化。极化特性不会随着信号的频率、幅度、相位、波形等变化而发生变化[43]，只与辐射源天线有关，因此能够在一定程度上反映雷达辐射源的类别和属性。

2.2 分选影响因素

2.2.1 数据量规模

现代战场是一个信息化、电子化、数字化的战场，各种电子信号变化多端、充斥其间，电磁脉冲数量早已达到百万级每秒甚至更高。未知雷达辐射源信号分选直接关系着决策者的决议，所以在选择聚类算法时必须考虑其伸缩性，不仅对小规模数据能够实现实时、高效的分选，对于大规模数据也能有良好的分选效果。

2.2.2 数据簇形状

现代战场是海陆空天多维战场，雷达数据参数实时多变，数据场景并不是常见的球形簇或者凸形簇，这也导致部分聚类算法不能实现有效分选。所以在选择聚类算法时，为了保证分选的准确性，建议选择能够发现任意形状簇的聚类算法[46]。

2.2.3 异常数据处理

雷达接收机在接收信号时，除了雷达辐射源的信号以外，还包括杂波、噪声等干扰信号，另外接收机自身在处理信号时也会产生噪声。在实现信号聚类之前，接收机需对信号的相关特征参数进行测量，其中的噪声信号和错误数据易导致异常数据点或孤立点的出现，因此，在选择聚类算法时必须考虑该算法对异常数据的处理能力，尽量选择对异常数据不敏感的聚类算法[46]。

2.2.4 相似度测量

在部分聚类算法中，选择一个合适的相似度测量方法能够直接影响聚类效果的质量。而在研究未知雷达信号聚类时，常见的相似度测量方法有欧式距离、Minkowsky距离[47]、海明距离[48]、灰关联度[8，25]以及相像系数[49-51]等。每种测量方法在计算相似度值都预先设置适当的权重参数，以便提高簇质量。

2.2.5 其他因素

其他因素包括多维数据处理能力和数据输入顺序。目前常用的雷达信号聚类算法都是基于两维或三维的数据，对高维数据处理要求相对较低。另外，部分聚类算法对数据输入顺序有要求，这并不满足在战场上对雷达信号实时聚类的要求。

2.3 聚类算法综合选择

在实现雷达信号聚类分选时，单个传统聚类分选算法基本上是无法有效完成分选任务，如K-Means聚类算法不能发现非凸面形状的簇[52]，DBSCAN聚类算法不能分选密度不均匀的数据簇。所以，在选择聚类算法时，首先考虑接收数据集的特征参数选择，选择代表性强的特征参数能够为后面算法计算减轻压力、提高效率；其次是综合考虑上述的外在影响因素，减小分选时“增批”“漏批”的可能性，提高分选的正确率、实时性；最后是在传统的聚类分选算法上，引入恰当的智能算法，形成智能聚类分析，可以有效解决对先验知识的依赖性的问题，减少人为因素的干扰。

此外，除了运用传统的聚类算法及其改进算法对未知雷达辐射源信号进行聚类分选，单独基于支持向量聚类[11，53-59]、数据场聚类[60-62]、BFSN聚类[63-66]、集对分析聚类[67-68]、神经网络聚类[69-72]和模糊聚类[73-78]等方法也受到学者关注，提出了一些理论研究成果，同样值得关注。

3 结束语

近年来，随着军事科技的快速发展，各种新体制雷达层出不穷，更新换代愈加频繁，雷达信号分选面临着严峻的挑战和考验。属于无监督学习的聚类分选正好满足未知环境下雷达信号缺乏先验知识的特性，同时与智能算法的有机结合能够很好地胜任雷达信号的分选工作。本文介绍了近年来国内学者对传统的聚类算法的改进算法在雷达信号分选中理论研究成果，分析了聚类算法的影响因素，提出了算法选择的意见，在以后的拓展研究具有一定的参考意义。