张 岩,张晓东
(1.海军装备部驻扬州地区军代室,江苏 扬州 225001;2.中国船舶集团有限公司第七二三研究所,江苏 扬州 225101)
雷达作为一种探测目标的重要工具,在军事和民用领域发挥着越来越重要的作用。雷达利用目标的回波来获得目标的信息,从而发现和测定目标。在雷达目标环境中,目标以外的其他散射体的回波会使雷达显示器上的图像变得杂乱,妨碍对目标回波的检测,这类回波被称为雷达杂波。杂波是雷达信号检测和处理的固有环境,在杂波背景下进行信息处理是雷达的基本任务之一[1-2]。作为雷达数据处理的一个重难点就是在目标检测后进行雷达点迹真伪鉴别,区分出目标点和杂波点。
针对雷达点迹真伪鉴别这一问题,国内外专家学者提出了很多不同的研究方法。文献[3]利用SVM理论实现了对多雷达数据的自动分类处理。文献[4]将支持向量机用作分类器,通过训练大量样本数据实现了对真实目标与虚假目标的分类,其核心思想是将航迹起始问题转化为机器学习中的真实航迹与虚假目标分类问题来处理。文献[5]提出了一种基于双通道卷积神经网络的雷达海上目标智能检测方法,从特征提取分类角度,通过深度学习分类方法对目标和杂波的雷达回波信号进行二元分类,达到90.0%的准确率。文献[6]提出了一种基于反向传播神经网络的雷达点迹分类方法,利用雷达点迹数据包含的距离跨度、方位跨度、幅度、距离、方位和信噪比等多种特征信息,训练的反向传播神经网络的分类准确率可达87.3%。
人工神经网络是一种运算模型,通过大量的带有数学意义的神经元节点连接组成。每个节点都代表着一种规定的输出函数,又可以称为激活函数。节点之间的相互连接代表着信号连接的加权值,由于网络连接方式、网络的权重值以及激活函数的多样性,神经网络的输出值也各不相同。神经网络中最基础的组成部分是神经元,神经元本质上是受生物学神经元的启发而建立的一种包括输入、输出以及其它计算功能的一个数学模型,它接收已知的输入向量x并结合相应的权重值w以及偏移量b,然后将获得的结果用非线性函数来处理,最终获得结果的预测值输出。一个网络层一般由多个神经元组成,而神经网络通常由多个网络层组成。随着计算能力的提升,计算机的计算能力己经足够支撑多层神经网络的计算。多层神经网络的非线性分界拟合能力随着层数的增加不断增加,具有更深入的表示特征和更强的函数模拟能力。
本文利用神经网络研究雷达点迹真伪鉴别问题。即针对信号处理输出的包含真实目标和杂波的数据,利用神经网络方法鉴别该数据是来自真实目标回波还是杂波,鉴别结果可以为减少杂波环境下虚假航迹数目,提高机动目标跟踪能力提供有力的技术支撑。
基于深度学习算法实现的全连接神经网络是一种非线性数据建模工具,常用来对输入与输出间复杂的关系进行建模,具有独特的分布并行处理、非线性映射和自适应学习能力等特征[7]。该网络结构包含多个隐藏层,能以更少模型参数、更快收敛速度和更高拟合精度来逼近现实[8]。
在神经网络的实际训练过程中,需要通过输入的训练数据集来求解出网络模型中各层之间的权重参数矩阵w和偏置向量参数b,即反向传播算法。当训练好的神经网络输入测试数据后,期望得到的输出值和实际的数据值更加接近,所以需要训练出更加合适并且更优的权重参数矩阵w和偏置向量参数b。在样本数据训练的过程中,可以定义一个损失函数来近似表示实际样本值和训练样本值之间的误差,在机器学习中常使用梯度下降法来求解损失函数的最小值,最终获得相关神经网络模型的权值参数矩阵w和偏置向量参数b。反向传播算法就是运用梯度下降算法对损失函数迭代求解极值的一个过程,获得深度神经网络模型的最佳相关参数,从而完成深度神经网络模型的训练,继而对样本数据的测试集数据进行测试。
利用神经网络研究分类问题通常按如下4个步骤进行:
(1) 提取不同实体不同的特征向量作为神经网络的输入。
(2) 定义神经网络如何从输入得到输出,即定义神经网络的前向传播算法。
(3) 训练神经网络,调整神经网络中各个参数的取值。
(4) 利用训练好的神经网络模型预测未知的数据。这个过程和步骤(2)中的前向传播算法一致。
神经网络中的激活函数,主要提供网络的非线性建模的能力,激活函数通常是可微的、单调的,用以保证实现基于梯度的后向传播算法。常用的激活函数有S曲线函数Sigmoid、双曲函数tanh、ReLU等。其中ReLU函数的收敛速度比Sigmoid/tanh函数快得多,并且运算十分简单,因此是当前流行的神经网络模型中较为常用的激活函数。
通常利用损失函数优化神经网络模型的训练效果,从所有样本中找到一组平均损失“较小”的权重和偏差。损失是对糟糕预测的惩罚,通过一个数值来表示对于单个样本而言模型预测的准确程度,即如果模型的预测完全准确,则损失为零,否则损失会较大。比较常见的损失函数有交叉熵损失函数、感知损失函数、平方损失函数、对数损失函数、Hinge损失函数、以及0-1损失函数。
本文采用的损失函数是交叉熵损失函数,它是机器学习分类问题中使用非常广泛的一种损失函数。假设给定p和q2个概率分布,利用q来表示p的交叉熵为:
H(p,q)=-∑p(x)lgq(x)
(1)
通过Softmax回归将神经网络前向传播得到的结果变成概率分布,这样可以通过交叉熵来计算预测的概率分布和真实答案的概率分布之间的距离。假设原始的神经网络输出为y1,y2,…,yn,那么经过Softmax 回归处理之后的输出为:
(2)
针对雷达点迹数据,本文利用如下特征信息,具体如表1所示。
表1 点迹特征信息
(1) 异常值剔除
本文采用雷达实测点迹数据进行模型训练,录取的雷达点迹数据中通常有很多异常值。为了降低模型算法计算量的同时,提高雷达点迹真伪鉴别准确率,在数据准备初始对这些异常值进行剔除。
(2) 产生训练数据
按照以下步骤产生训练数据:
(a) 利用航迹处理程序对每一组点迹数据进行建航处理;
(b) 根据试验环境和剧情,人工剔除虚假航迹,保留真实航迹。
(c) 将真实航迹所对应的点迹数据标注为1(目标),而将其他点迹标注为0(杂波)。
(d) 将标注好的点迹数据构成的数据集分为两部分,一部分作为训练集数据,另一部分作为测试集数据。
(3) 数据预处理
雷达点迹数据包含的不同特征信息间值域差别较大,为避免具有不同量纲的输入变量不能同等使用,需要对原始数据进行预处理,以消除数据量纲影响。归一化公式如下所示:
(3)
式中:p和Pnorm表示归一化前后的值;pmax和pmin表示p的最大值和最小值。
本文模型效果评估指标为准确率、目标损失率以及杂波滤除率[9]。下面对3个模型效果对比指标进行说明。
准确率是模型预测正确的结果所占的比例:
(4)
式中:Acc表示准确率;TP为目标被判为目标的数目;TN为杂波被判为杂波的数目;FP为杂波被判为目标的数目;FN为目标被判为杂波的数目。
在本文雷达点迹数据真伪鉴别方法研究中,漏警造成的损失远高于将杂波判为目标的损失。因此在评估模型效果时,需要将目标损失率rt作为一项重要指标,公式如下:
(5)
在降低目标损失率的同时,要尽可能多地滤掉杂波,杂波滤除率rc公式如下:
(6)
本文所用的神经网络结构图如图1所示。
图1 神经网络结构
输入层有8个神经元,输入雷达点迹有8种特征,共4层隐藏层,每个隐藏层分别包含64、128、64和32个神经元,每一层神经元的输入为上一层神经元的输出,每层神经元的输出均乘以权重w,再加上偏置b,通过ReLU激活函数后作为下一层神经元的输入。最后的输出层使用Softmax函数进行分类,分别输出各个类别的可能性(0.0~1.0),最后选择可能性得分最高的类别作为预测的类别。
本文用于神经网络训练的训练集数据为8 034个,用于验证分类效果的测试集数据为2 000个。训练次数初始化为0,将网络的连接权值和偏置量均初始化为随机值,初始学习速率设置为0.001,每训练10轮后学习率乘以衰减系数0.99。每次从训练数据集中随机抽取512个特征数据输入神经网络进行迭代训练,逐层计算各层神经网络的输出,获得预测值。使用经典的交叉熵损失函数为训练模型优化目的时,经过多次迭代后目标损失率只能达到0.11左右,准确率为0.89。因为漏警即目标判为杂波的损失要远高于将杂波判为目标的损失,因此增加目标被判为杂波的代价权重。优化损失函数后目标损失率下降到只有0.03左右,准确率为0.85。
将分类模型应用于雷达实测数据进行杂波点迹过滤,过滤前雷达原始点迹见图2,是雷达20个扫描周期的累积点迹,点迹总数3 798个,有一个目标轨迹20个点迹,剩余3 778个点迹均是杂波。
图2 原始点迹图
过滤杂波后的雷达点迹如图3所示,目标点迹全部保留,杂波点迹减少到1 133个。杂波过滤效果对比如表2所示。
图3 杂波过滤效果图
表2 杂波过滤效果对比
本文利用神经网络研究雷达点迹真伪鉴别问题,判断该点数据是来自目标还是杂波。根据工程中积累的经验,提炼出雷达点迹特征信息作为神经网络的输入,通过分析具体应用场景优化损失函数,使目标损失率下降到可接受范围。利用该分类模型处理雷达实测数据,给出杂波过滤效果。
当有点迹数据时,利用本文神经网络模型对点迹数据进行真伪鉴别,鉴别结果可以为后续数据处理过程如航迹起始以及虚假航迹剔除等提供技术支撑,最终达到减少杂波环境下虚假航迹数量的目的。