潘美艳,蔡兴雨,臧会凯,薛 健
(1.西安电子工程研究所,西安 710100;2.西安邮电大学 通信与信息工程学院,西安 710121)
脉冲雷达在机载预警探测和导弹制导等方面具有广泛应用。通常情况下雷达发射脉冲后在脉冲重复周期内接收物体散射的雷达回波,而当目标与雷达之间的距离大于脉冲重复周期所对应的最大距离时,物体回波不落在发射脉冲周期内,此时测得的物体距离为非真实距离,这种现象被称为距离模糊[1-3]。距离模糊目标的真实距离在雷达最大不模糊距离之外,雷达发射机功率的增大或者脉冲压缩技术的使用会导致距离模糊目标数量的增加,甚至在雷达回波中出现超过雷达最大不模糊距离数倍(可达8倍)的强目标回波。这些存在多次距离模糊的目标回波通常被称为雷达多次回波[4]。雷达多次回波往往来自于远处强目标的后向散射,其在后续的雷达目标检测算法中很可能会被判断为目标点迹。对于脉冲雷达而言,多次回波点迹不属于当前探测感兴趣的信号。当雷达信号处理技术[4-5]无法抑制雷达多次回波时,会造成过门限点迹过多,继而导致航迹起始困难和航迹关联易出错等问题,严重影响雷达数据处理环节。
目前工程中常用的雷达多次回波分类方法是基于经验门限判决的雷达多次回波分类方法,通过比较经验选取的门限和相邻脉冲间的对数幅度差值的大小进行雷达多次回波的分类。具体地,当第一个脉冲和第二个脉冲之间的幅度差值大于经验门限时,当前距离单元的多脉冲回波被判断为二次回波;当第一个、第二个脉冲幅度相近而和第三个脉冲之间的幅度差值大于经验门限时,当前距离单元的多脉冲回波判为三次回波;依次类推,当第一、二、三个到第L-1个脉冲幅度相近而与第L个脉冲之间的幅度差值大于经验门限时,当前距离单元的多脉冲回波被判为L次回波。然而实际应用中,目标种类多样,而且雷达回波在脉冲间的幅度起伏变化不定,难以选取统一的经验门限进行雷达多次回波分类。因此,传统基于经验门限判决的雷达多次回波分类方法在实际中存在分类准确率较低、泛化能力弱的问题。
基于数据驱动的机器学习方法[6-7]在分类任务中得到了应用广泛,而且往往表现出优越的分类性能[8]。因此,针对现有方法难以有效分类雷达多次回波的问题,本文提出了一种采用集成装袋树的雷达多次回波分类方法。具体而言,首先对雷达多脉冲回波数据进行相邻脉冲幅度补齐等预处理操作,然后利用装袋法随机选择样本,通过构建多个决策树自动学习雷达多次回波和正常回波在幅度域的特征并完成初步分类,接着基于“投票法”集成多分类器的分类结果,实现雷达正常回波和多次回波的准确分类。实测雷达数据验证了所提方法的有效性。
假设雷达发射和接收L个脉冲,探测的距离单元数目和方位单元数目分别为R和A。每个雷达分辨单元内的多脉冲回波数据可以使用如下的二元假设检验描述:
(1)
式中:H0假设表示只有杂波数据;H1假设表示包含目标和杂波的数据;zr,a,cr,a,sr,a分别表示第r个距离单元、第a个方位上L个脉冲的雷达回波向量、杂波回波向量和目标回波向量。
基于式(1)的假设检验问题,可以设计得到雷达目标检测方法[9]。利用雷达目标检测方法对雷达回波数据进行处理后,可以得到检测点迹数据集合,表示如下:
(2)
式中:D表示检测出目标的距离单元索引和方位单元索引构成的集合;IT,+∞(·)表示定义在集合{T,…,+∞}上的指示函数,+∞表示正无穷大,T表示检测门限;f(·)表示雷达目标检测算法函数,该函数将L个脉冲的回波数据映射为一个检验统计量。
点迹集合D中包含少量的杂波虚警点迹,剩余点迹属于雷达目标点迹。为了区分出雷达多次回波点迹,将点迹集合D可以分为3个子集合:
D={Dc,De,Df}
(3)
式中:Dc表示杂波虚警点迹集合;De表示正常回波点迹集合;Df表示多次回波点迹集合。对于岸基警戒等近距离探测雷达而言,雷达多次回波往往属于非期望回波,在检测点迹数据流转到数据处理环节之前需要将其抑制。
由于雷达观测目标种类多样,且雷达回波在脉冲间的幅度起伏变化不定的问题,导致传统基于经验门限判决的雷达多次回波分类方法难以选取统一的经验门限进行雷达多次回波分类。因此,传统雷达多次回波分类方法的分类准确率较低,泛化能力弱。随着机器学习的快速发展,决策树[10]、支持向量机[7](Support Vector Machine,SVM)以及K近邻(K-Nearest Neighbor,KNN)等成为分类算法的代表,目前已广泛应用到目标分类中。然而将上述分类器用于雷达多次回波分类时,会受到雷达多次回波样本分布不均匀的影响,导致分类准确率不高,泛化能力不强。为提高雷达多次回波分类的准确性和算法的泛化性能,本文设计了集成装袋树方法,基于决策树分类器,同时引入装袋法和集成方法,构建了雷达多次回波分类模型。如图1所示,首先,利用装袋法对训练样本进行多次有放回采样,选择样本具有随机性,降低噪声数据对分类结果的影响,使得所构建的分类器不容易受到过拟合的影响;其次,采用决策树[10-12]作为基础分类器,训练多个决策树分类器,提取不同样本之间的互补特征;最后,通过“投票法”[13-14]原则的集成方法投票选择多个弱分类器占优的结果作为最终分类的结果,可有效提升分类结果的准确性和鲁棒性。
图1 集成装袋树模型Fig.1 Ensemble bagging tree model structure
集成装袋树[15-16]又称为引导聚集算法,其原理是通过组合多个训练集的分类结果来提升分类效果。集成方法通过集成多个弱分类器的结果提升分类结果的准确性,并使得输出结果更具鲁棒性。对于分类问题按照投票表决法输出分类结果,而对于回归问题将采用多个分类器的平均值作为最终的回归输出。
本文针对雷达多次回波分类问题,利用集成装袋树算法实现对多次回波的分类。集成装袋树的基本思想如下:
假设有一个大小为N的训练集,包含训练样本和标签,通过装袋法从训练集中多次有放回采样取出大小为n(n 目前对于训练好的集成装袋树模型而言,输入层要求输入数据的维度是固定的。然而实测中雷达为了更好地分配和利用资源,在同一方位不同俯仰上发射及接收脉冲数目不同,因此输入数据维度固定的模型无法适应这种情况。针对不同脉冲数目的雷达多次回波分类问题,本文提出基于相邻脉冲幅度补齐的预处理方法。该方法将所有不同脉冲数目的回波补齐至设定的脉冲数目,解决集成装袋树模型无法分类不同脉冲数目的雷达多次回波的问题。 本文提出的相邻脉冲幅度补齐法对输入回波数据进行预处理,具体实现如下:若原始回波数据有p个脉冲,而分类器输入要求q个脉冲,则在当前数据的基础上增加q-p个脉冲,其幅度与第p个脉冲的幅度相近。这是由于实际测量过程中每个脉冲幅度有所差异,故不能直接用第p个脉冲的幅度进行补全,需要在第p个脉冲幅度上加噪声之后再补全。无论接收到的回波数据脉冲数是多少,都可以通过该方法补齐样本特征,将样本长度补齐到最大脉冲数,并且将多种不同脉冲数目的雷达回波数据组合在一起进行雷达多次回波的分类。按照此方法将某实测雷达数据回波脉冲补齐,原始脉冲数分别为9,8,4,3,将不足9个脉冲的回波数据补齐到9个脉冲,所得的结果如图2所示。从图2中可以看出补齐后的回波幅度与实际脉冲回波幅度起伏差异不大,故可以组合在一起实现后续的雷达多次回波分类。 图2 雷达回波脉冲补齐结果Fig.2 Radar echo pulse completion result 该预处理方法可以有效地解决不同脉冲回波数据不能用同一集成装袋树分类器分类的问题,通过相邻脉冲幅度补齐法打破了分类器输入数据维度固定的局限,构建了不同脉冲数目通用的雷达多次回波分类方法,实现了不同输入维度的样本均可通过同一分类模型进行雷达多次回波的分类,为采用集成装袋树的雷达多次回波分类方法的工程化应用提供了基础和依据。 本文所提出的基于集成装袋树的雷达多次回波分类方法步骤如图3所示。 图3 雷达多次回波分类流程Fig.3 Radar multiple echo classification process 雷达多次回波分类方法主要包括两个阶段:模型训练阶段和新样本测试阶段(训练阶段流程为步骤1~步骤5,新样本测试阶段流程为步骤6~步骤7): 步骤1 获得雷达多脉冲回波数据:根据雷达检测点迹和雷达回波数据获得点迹所在距离单元的多脉冲回波数据。 步骤2 多脉冲数据预处理:首先将多脉冲回波数据的幅度取对数,然后针对不同脉冲数目的回波通过2.2节的相邻脉冲幅度补齐预处理操作,获得固定脉冲对数幅度值特征。 步骤3 构建样本集及标注样本标签:通过经验门限和人工辅助对步骤2获得的多脉冲对数幅度特征进行标注,经验门限根据检测时的信噪比选择。若接收到的雷达回波共有L个脉冲,则标注的标签为1~L之间的数值,1代表1次回波(正常回波),2代表2次回波,以此类推,L代表L次回波。将幅度特征和标注标签对应构成带标签的样本集,并分为训练集和验证集。 步骤4 集成装袋树分类器设计:利用装袋法选择样本特征,有放回地抽取;基础分类器选择决策树,共构建30个基础的决策树弱分类器,设置集成方法为“投票法”。 步骤5 训练集成装袋树并验证性能:利用步骤3生成的训练样本集对步骤4设计的集成装袋树进行训练,并在验证集上验证分类器的性能。 步骤6 测试样本集生成:将新的雷达多脉冲回波数据按照步骤1~步骤2构建测试样本集。 步骤7 测试样本分类:将测试样本数据集输入到步骤5训练好的模型中,得到最终的雷达多次回波分类结果。由于实际使用时不需要经验门限,故该分类方法不依赖于经验门限。 所提分类方法的优势在于:通过装袋法有放回地选择特征样本,样本选择具有随机性,降低了噪声数据的影响,训练模型不易过拟合;利用决策树挖掘和提取脉冲幅度之间的差异性对多次回波进行分类,决策树作为基础分类器,易于理解和使用,用途广泛且功能强大;“投票法”融合多个分类器的输出结果,将多个分类器的输出结果按照多数占优原则集成,提升模型分类的准确率,使得模型具有较强的鲁棒性和泛化能力。 本文通过实测数据对所提方法的性能进行验证。所采用的实测数据为某情报雷达接收的回波复数据,回波中包含多类目标,回波信号中共有9个脉冲,雷达检测点迹中包含较多的多次回波反射的点迹。通过雷达信号处理得到的多次回波的多脉冲对数幅度特征如图4所示,其中包含了1次回波到8次回波的多脉冲对数幅度特征。 图4 多次回波对数幅度Fig.4 Multiple echo logarithmic amplitude 为了更清晰地看到多次回波脉冲间对数幅度起伏特征,图5显示了相邻脉冲对数幅度差值特征。从图5可知,1次回波表示正常回波,所有脉冲的对数幅度差异较小;而2次回波在第2个脉冲上的幅度有较大的起伏,第1个和第2个脉冲幅度差值超过29 dB;而3次回波在第3个脉冲上的幅度有较大起伏,第2个和第3个脉冲幅度差值超过26 dB;以此类推,8次回波在第8个脉冲上的幅度起伏较大,第7个和第8个脉冲幅度差值超过39 dB。从图4和图5样本特征可知,多次回波在多脉冲对数幅度上的特征差异明显。 图5 多次回波相邻脉冲对数幅度差值Fig.5 The logarithmic amplitude difference between adjacent pulses in multiple echoes 对样本标注时,人工标注精确度高但代价过大,所以选择经验门限和人工辅助相结合的方法对样本进行标注:首先使用经验门限对样本进行标注,针对当前采用的数据,经验门限设为12 dB;再利用人工辅助标注对数幅度差值在10~12 dB之间的样本,提高样本标签的准确率,有助于集成装袋树的训练。实际应用中,可以根据雷达环境(噪声和杂波)特性、虚警概率和检测方法对应的恒虚警门限设置合适的经验门限,例如文献[17]中给出了常用恒虚警检测算法的门限计算公式。 通过对3.1节生成的样本集对集成装袋树进行训练和验证,得到的雷达多次回波分类混淆矩阵[18-19],如表1所示。混淆矩阵能表示该分类方法的准确性,混淆矩阵的每一行表示真实类别,而每一列表示集成装袋树预测的类别[20],对角线上的值表示每一类预测值为真实值的概率,也即预测正确的概率。从表1可以看出,每一类的预测准确率均大于93%以上,且8次回波的预测准确率为100%。这也说明了该集成装袋树模型可以将8类回波准确的分类出来,并且综合分类准确率达到了95.9%,分类效果较佳,可以在实际雷达信号处理中使用,降低雷达数据处理的计算复杂度,提高处理效率。 表1 所提方法混淆矩阵Tab.1 Confusion matrix of the proposed method 单位:% 为验证本文所提方法的有效性和高准确率,设计了决策树、KNN以及SVM分类器,并进行雷达多次回波的分类,对比不同分类器的分类结果,通过多次独立重复实验,所得的平均分类准确率和平均训练时间如表2所示。 表2 不同分类方法对比结果Tab.2 Comparison results of different classification methods 从表2可知,采用集成装袋树的雷达多次回波分类方法的平均分类准确率最高,证明了所提方法的有效性和鲁棒性。SVM(三次多项式核函数)的平均分类准确率与本文所提方法相差不大,而决策树的平均分类准确率较低。由此可见,多分类器集成思想可以提升单个决策树分类器的分类性能。从复杂度来讲,以训练阶段所用平均时间作为复杂度的评价指标,分类器所用的训练样本及环境都是相同的,由表2时间可知,本文所提方法相比于SVM所需平均时间要少,即集成装袋树的收敛速度要快于SVM,故本文方法既高效又准确。 为验证本文所提方法的鲁棒性,在新的雷达实测数据上进行测试,根据2.3节测试阶段流程生成测试集样本,输入到采用集成装袋树的雷达多次回波分类方法所得到的分类器模型中,得到的分类结果如图6所示,图中标签1~8分别代表1次回波到8次回波,标签1蓝色点迹是需要的1次回波(正常回波)点迹,而其他标签点迹是多次回波生成的虚警点迹。从图6可知雷达检测点迹被分为1次回波和多次回波,多次回波点迹约占检测点迹的1/3,抑制分类出的多次回波点迹,则剩余的正常回波点迹将大大减少。 图6 实测数据分类结果Fig.6 Classification results of measured data 图7显示了利用所提方法分类出多次回波,并剔除多次回波点迹后的检测结果,目标点迹清晰明显。对比图6和图7可知,本文方法在多类目标回波场景下仍能达到较好的分类效果,可以抑制不同类型目标的多次回波。由此可知,所提分类方法在实测数据上的鲁棒性强,训练好的模型具有良好的泛化性能,通过分类并剔除雷达多次回波造成的检测点迹,可以提高雷达检测点迹的质量,进而提升雷达目标跟踪性能。 图7 抑制多次回波后检测结果Fig.7 Detection results after suppressing multiple echoes 本文研究了脉冲雷达中强目标产生的雷达多次回波分类问题,针对传统基于经验门限的分类方法难以对雷达多次回波有效分类的问题,提出了采用集成装袋树的雷达多次回波分类方法。该方法首先对多脉冲回波数据进行预处理以突破分类器输入维度固定的限制,然后通过装袋法和决策树提取和挖掘多脉冲回波幅度之间的差异性对多次回波进行分类,最终集成多个分类器的输出结果,提升模型分类的准确率,使得训练好的模型具有较强的鲁棒性和泛化能力。相比于传统分类方法,该方法在实测数据上具有高的准确率,而且实际使用时不依赖于经验门限。所提方法对雷达多次回波进行分类后,可抑制由多次回波造成的虚假点迹,进而提升雷达目标跟踪性能。2.2 雷达多次回波分类预处理方法
2.3 基于集成装袋树的雷达多次回波分类流程
3 基于实测数据的性能评估
3.1 实测数据介绍及样本集制作
3.2 所提方法训练结果
3.3 不同分类器方法对比结果
3.4 实测数据分类结果
4 结 论